99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾OpenVINO?將全力助力極視角AI推理加速

英特爾物聯(lián)網(wǎng) ? 來源:極市平臺 ? 作者:鄧富城博士 極視角 ? 2021-09-22 16:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在模型開發(fā)和部署方面,極市平臺集成了最新版本的OpenVINO工具,助力開發(fā)者在最小化代碼修改的條件下加速AI算法在各類生產(chǎn)環(huán)境中規(guī)?;渴饝茫绕涫窃?a href="http://www.socialnewsupdate.com/tags/intel/" target="_blank">Intel豐富的硬件資源平臺上(CPUs、iGPUs、VPUs等等)。

本文重點介紹了極視角與英特爾開發(fā)人員共同研發(fā)的OpenVINO最新功能,無縫集成TensorFlow框架,對于熟悉TensorFlow開發(fā)的開發(fā)者來說,在原有代碼的基礎上只需要添加幾行簡單代碼就可以無痛實現(xiàn)模型精度不變的前提下推理加速1.34倍以上,避免了顯式地進行OpenVINO轉(zhuǎn)換以及推理部分代碼的重新編寫,大大簡化OpenVINO工具的使用,加速AI算法在生產(chǎn)環(huán)境中的應用部署。

無痛實現(xiàn) 1.34 倍加速推理

我們先來看看本文方法在模型推理加速上具體表現(xiàn):

可以看到,在同一測試環(huán)境下,OpenVINO 與 TensorFlow 的集成實現(xiàn)了 1.34 的加速幾何平均值,同時,模型的準確性保持不變:

具體實操

OpenVINO 與 TensorFlow 的集成專為使用 OpenVINO 工具套件的開發(fā)人員而設計——通過最少的代碼修改來提高推理應用程序的性能。該集成為提高TensorFlow 兼容性提供以 OpenVINO 工具套件內(nèi)聯(lián)優(yōu)化和所需運行時,并加速了各種英特爾芯片上多類AI模型的推理。

通過將以下兩行代碼添加到 Python 代碼或 Jupyter Notebooks 中,就可以極大地加速你的 TensorFlow 模型的推理:

import openvino_tensorflowopenvino_tensorflow.set_backend(‘《backend_name》’)

OpenVINO 與 TensorFlow 的集成通過將 TensorFlow 圖巧妙地劃分為多個子圖,再將這些子圖分派到 TensorFlow 運行時或 OpenVINO 運行時,從而實現(xiàn)最佳加速推理。

# 工作流概述

同時,通過 openvino_tensorflow ,我們能夠非常輕松地使用不同硬件:

更多的詳細信息可以前往 Github:

https://github.com/openvinotoolkit/openvino_tensorflow

# 在Extreme Vision notebooks中集成

在Extreme Vision IDE中可以直接將OpenVINO與TensorFlow集成。如下圖所示,你只需要簡單地導入openvino_tensorflow,即可無縫加速 Jupyter Notebook 中在CPU上推理的所有 TensorFlow模型,同時可以繼續(xù)使用標準的TensorFlow API,而無需代碼重構(gòu)。

對推理加速更深的討論

從前文對推理加速上的結(jié)果展示中,我們可以看到通過添加 2 行代碼激活OpenVINO與 TensorFlow 的集成后,可以獲得最高達 10 倍的推理加速。但也有個別模型出現(xiàn)了異常情況,如Mask RCNN Atrous 和 SSD Mobilenet V2,因此我們對如何獲得最佳性能進行了討論:

#01

OPENVINO_TF_MIN_NONTRIVIAL_NODES 變量

該變量設置了聚類中可以存在的最小操作數(shù)。如果操作數(shù)小于指定的數(shù)量,則聚類將回退到 TensorFlow。默認情況是根據(jù)總圖大小計算的,但除非手動設置,否則不能小于 6。另外,我們將此變量設置為 15 和 22 來觀察模型進一步的性能增強,并以此得到了最終的最佳推理性能。因此,在具體的開發(fā)應用中應通過默認值或?qū)嶒瀬泶_定能夠為模型提供最佳性能的變量最佳值。

#02

凍結(jié) Keras 模型以獲得最佳性能

一些 Keras 模型可能包含訓練操作,這會導致 TensorFlow 產(chǎn)生控制流。由于 OpenVINO 工具套件不支持這些操作,因此圖形可能會被劃分為較小的聚類。因此,在使用 OpenVINO 與 TensorFlow 的集成時,凍結(jié)模型可以避免這些操作并提高整體性能。

使用 Keras API 的 DenseNet121 推理應用代碼示例:

import tensorflow as tffrom tensorflow import kerasfrom tensorflow.keras.applications.densenet import DenseNet121# Add two lines of code to enable OpenVINO integration with TensorFlowimport openvino_tensorflowopenvino_tensorflow.set_backend("CPU")


model = DenseNet121(weights='imagenet')


# Run the inference using Keras API  model.predict(input_data)

下面是凍結(jié)和運行 Keras 模型的一個示例代碼,通過這種方式,我們能夠優(yōu)化使用 OpenVINO 與 TensorFlow 的集成實現(xiàn)的最佳性能。

import tensorflow as tffrom tensorflow import kerasfrom tensorflow.keras.applications.densenet import DenseNet121from tensorflow.python.framework.convert_to_constants import convert_variables_to_constants_v2# Add two lines of code to enable OpenVINO integration with TensorFlowimport openvino_tensorflowopenvino_tensorflow.set_backend("CPU")


model = DenseNet121(weights='imagenet')


# Freeze the model first to achieve the best performance# using OpenVINO integration with TensorFlow    full_model = tf.function(lambda x: self.model(x))full_model = full_model.get_concrete_function(tf.TensorSpec(model.inputs[0].shape,model.inputs[0].dtype, name=model.inputs[0].name))frozen_func = convert_variables_to_constants_v2(full_model)frozen_func.graph.as_graph_def()session = tf.compat.v1.Session(graph=frozen_func.graph)prob_tensor = frozen_func.graph.get_tensor_by_name(full_model.outputs[0].name)


# Run the inference on the frozen modelsession.run(prob_tensor, feed_dict={full_model.inputs[0].name : input_data})

#03

Mask RCNN Atrous和SSD Mobilenet

如上文的結(jié)果所示,OpenVINO與TensorFlow的集成可以加速大多數(shù)TensorFlow模型,但由于一些模型具有OpenVINO與TensorFlow集成尚不完全支持的工作組件(例如運算符、層等),如Mask RCNN Atrous和SSD Mobilenet V2等一些模型仍在開發(fā)完善中。

為了擴大模型覆蓋范圍以及進一步提升性能,極視角技術(shù)團隊將會繼續(xù)測試和完善OpenVINO與TensorFlow的集成,以幫助更多使用TensorFlow開發(fā)人員能夠更好地應用極市平臺。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • API
    API
    +關注

    關注

    2

    文章

    1609

    瀏覽量

    63997
  • SSD
    SSD
    +關注

    關注

    21

    文章

    2981

    瀏覽量

    119557
  • AI
    AI
    +關注

    關注

    88

    文章

    35083

    瀏覽量

    279428
  • 代碼
    +關注

    關注

    30

    文章

    4900

    瀏覽量

    70678

原文標題:英特爾OpenVINO? 助力極視角AI推理加速

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    主控CPU全能選手,英特爾至強6助力AI系統(tǒng)高效運轉(zhuǎn)

    2025年3月,英偉達發(fā)布了DGX B300 AI加速計算平臺。2025年5月,英特爾發(fā)布了三款全新英特爾至強6性能核處理器,其中一款6776P被用作是DGX B300的主控CPU,這
    的頭像 發(fā)表于 06-27 11:44 ?172次閱讀
    主控CPU全能選手,<b class='flag-5'>英特爾</b>至強6<b class='flag-5'>助力</b><b class='flag-5'>AI</b>系統(tǒng)高效運轉(zhuǎn)

    使用英特爾? NPU 插件C++運行應用程序時出現(xiàn)錯誤:“std::Runtime_error at memory location”怎么解決?

    使用OpenVINO?工具套件版本 2024.4.0 構(gòu)建C++應用程序 使用英特爾? NPU 插件運行了 C++ 應用程序 遇到的錯誤: Microsoft C++ exception: std::runtime_error at memory location
    發(fā)表于 06-25 08:01

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——
    的頭像 發(fā)表于 05-20 12:27 ?4433次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b>性能躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來新選擇

    Pro B50 GPU,搭載了為AI推理和專業(yè)工作站量身定制的配置,擴展了英特爾銳炫Pro產(chǎn)品系列。 英特爾 ? Gaudi 3 AI
    發(fā)表于 05-20 11:03 ?1511次閱讀

    英特爾借助開放生態(tài)系統(tǒng),加速邊緣AI創(chuàng)新

    英特爾推出全新AI邊緣系統(tǒng)、邊緣AI套件和開放邊緣平臺軟件,賦能合作伙伴AI無縫融入現(xiàn)有基礎設施 ?
    發(fā)表于 03-21 11:31 ?166次閱讀
    <b class='flag-5'>英特爾</b>借助開放生態(tài)系統(tǒng),<b class='flag-5'>加速</b>邊緣<b class='flag-5'>AI</b>創(chuàng)新

    為什么無法檢測到OpenVINO?工具套件中的英特爾?集成圖形處理單元?

    在 Ubuntu* Desktop 22.04 上安裝了 英特爾? Graphics Driver 版本并OpenVINO? 2023.1。 運行 python 代碼: python -c
    發(fā)表于 03-05 08:36

    請問OpenVINO?工具套件英特爾?Distribution是否與Windows? 10物聯(lián)網(wǎng)企業(yè)版兼容?

    無法在基于 Windows? 10 物聯(lián)網(wǎng)企業(yè)版的目標系統(tǒng)上使用 英特爾? Distribution OpenVINO? 2021* 版本推斷模型。
    發(fā)表于 03-05 08:32

    安裝OpenVINO?適用于Raspberry Pi64位操作系統(tǒng)的工具套件2022.3.1,配置英特爾?NCS2時出錯怎么解決?

    安裝OpenVINO?適用于 Raspberry Pi* 64 位操作系統(tǒng)的工具套件 2022.3.1。 配置英特爾? NCS2時出錯: CMake Error at CMakeLists.txt
    發(fā)表于 03-05 07:27

    英特爾?獨立顯卡與OpenVINO?工具套件結(jié)合使用時,無法運行推理怎么解決?

    使用英特爾?獨立顯卡與OpenVINO?工具套件時無法運行推理
    發(fā)表于 03-05 06:56

    英特爾OpenVINO 2025.0正式發(fā)布

    生成式AI(GenAI)在模型質(zhì)量與應用范圍上持續(xù)爆發(fā)式增長,DeepSeek 等頂尖模型已引發(fā)行業(yè)熱議,這種勢頭預計將在 2025年延續(xù)。本次更新聚焦性能提升、更多生成式AI 模型的支持,并針對英特爾神經(jīng)處理單元(NPU)推出
    的頭像 發(fā)表于 02-21 10:20 ?738次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>OpenVINO</b> 2025.0正式發(fā)布

    英特爾Gaudi 2D AI加速助力DeepSeek Janus Pro模型性能提升

    Pro模型進行了深度優(yōu)化。 這一優(yōu)化舉措使得AI開發(fā)者能夠以更低的成本和更高的效率實現(xiàn)復雜任務的部署與優(yōu)化。英特爾Gaudi 2D AI加速器通過其卓越的計算能力和高度優(yōu)化的軟件棧,
    的頭像 發(fā)表于 02-10 11:10 ?623次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出了全新的企業(yè)AI一體化方案。該方案以英特爾至強處理器和英特爾Gaudi 2D AI
    的頭像 發(fā)表于 12-03 11:20 ?590次閱讀

    英特爾助力百度智能云千帆大模型平臺加速LLM推理

    “大模型在各行業(yè)的廣泛應用驅(qū)動了新一輪產(chǎn)業(yè)革命,也凸顯了在AI算力方面的瓶頸。通過攜手英特爾釋放英特爾 至強 可擴展處理器的算力潛力,我們?yōu)橛脩籼峁┝烁咝阅堋㈧`活、經(jīng)濟的算力基礎設施方案,結(jié)合千帆
    的頭像 發(fā)表于 11-25 16:59 ?944次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>助力</b>百度智能云千帆大模型平臺<b class='flag-5'>加速</b>LLM<b class='flag-5'>推理</b>

    英特爾發(fā)布Gaudi3 AI加速器,押注低成本優(yōu)勢挑戰(zhàn)市場

    英特爾近期震撼發(fā)布了專為AI工作負載設計的Gaudi3加速器,這款新芯片雖在速度上不及英偉達熱門型號H100與H200 GPU,但英特爾巧妙地
    的頭像 發(fā)表于 09-26 16:16 ?1185次閱讀

    從運動員到開發(fā)者: 英特爾以開放式AI系統(tǒng)應對多重挑戰(zhàn)

    英特爾通過開放、易獲取的AI系統(tǒng)和生態(tài)協(xié)作,以創(chuàng)新的方式為運動員提供支持,并助力企業(yè)客戶創(chuàng)造更多可能。 今日,英特爾分享了與國際奧林匹克委員會(IOC)的一些合作細節(jié),并披露了其以行業(yè)
    的頭像 發(fā)表于 07-25 09:28 ?523次閱讀
    從運動員到開發(fā)者: <b class='flag-5'>英特爾</b>以開放式<b class='flag-5'>AI</b>系統(tǒng)應對多重挑戰(zhàn)