99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于移動(dòng)設(shè)備的框架TensorFlow Lite發(fā)布重大更新

jmiy_worldofai ? 來(lái)源:lq ? 2019-01-21 13:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

TensorFlow用于移動(dòng)設(shè)備的框架TensorFlow Lite發(fā)布重大更新,支持開發(fā)者使用手機(jī)等移動(dòng)設(shè)備的GPU來(lái)提高模型推斷速度。

在進(jìn)行人臉輪廓檢測(cè)的推斷速度上,與之前使用CPU相比,使用新的GPU后端有不小的提升。在Pixel 3和三星S9上,提升程度大概為4倍,在iPhone 7上有大約有6倍。

為什么要支持GPU?

眾所周知,使用計(jì)算密集的機(jī)器學(xué)習(xí)模型進(jìn)行推斷需要大量的資源。

但是移動(dòng)設(shè)備的處理能力和功率都有限。雖然TensorFlow Lite提供了不少的加速途徑,比如將機(jī)器學(xué)習(xí)模型轉(zhuǎn)換成定點(diǎn)模型,但總是會(huì)在模型的性能或精度上做出讓步。

而將GPU作為加速原始浮點(diǎn)模型的一種選擇,不會(huì)增加量化的額外復(fù)雜性和潛在的精度損失。

在谷歌內(nèi)部,幾個(gè)月來(lái)一直在產(chǎn)品中使用GPU后端做測(cè)試。結(jié)果證明,的確可以加快復(fù)雜網(wǎng)絡(luò)的推斷速度。

在Pixel 3的人像模式(Portrait mode)中,與使用CPU相比,使用GPU的Tensorflow Lite,用于摳圖/背景虛化的前景-背景分隔模型加速了4倍以上。新深度估計(jì)(depth estimation)模型加速了10倍以上。

在能夠?yàn)?a href="http://www.socialnewsupdate.com/v/" target="_blank">視頻增加文字、濾鏡等特效的YouTube Stories和谷歌的相機(jī)AR功能Playground Stickers中,實(shí)時(shí)視頻分割模型在各種手機(jī)上的速度提高了5-10倍。

對(duì)于不同的深度神經(jīng)網(wǎng)絡(luò)模型,使用新GPU后端,通常比浮點(diǎn)CPU快2-7倍。對(duì)4個(gè)公開模型和2個(gè)谷歌內(nèi)部模型進(jìn)行基準(zhǔn)測(cè)試的效果如下:

使用GPU加速,對(duì)于更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型最為重要,比如密集的預(yù)測(cè)/分割或分類任務(wù)。

在相對(duì)較小的模型上,加速的效果就沒有那么明顯了,使用CPU反而有利于避免內(nèi)存?zhèn)鬏斨泄逃械难舆t成本。

如何使用?

安卓設(shè)備(用Java)中,谷歌已經(jīng)發(fā)布了完整的Android Archive (AAR) ,其中包括帶有GPU后端的TensorFlow Lite。

你可以編輯Gradle文件,用AAR替代當(dāng)前的版本,并將下面的代碼片段,添加到Java初始化代碼中。

//InitializeinterpreterwithGPUdelegate.GpuDelegatedelegate=newGpuDelegate();Interpreter.Optionsoptions=(newInterpreter.Options()).addDelegate(delegate);Interpreterinterpreter=newInterpreter(model,options);//Runinference.while(true){writeToInputTensor(inputTensor);interpreter.run(inputTensor,outputTensor);readFromOutputTensor(outputTensor);}//Cleanup.delegate.close();在iOS設(shè)備(用C++)中,要先下載二進(jìn)制版本的TensorFlowLite。然后更改代碼,在創(chuàng)建模型后調(diào)用ModifyGraphWithDelegate()。//InitializeinterpreterwithGPUdelegate.std::unique_ptrinterpreter;InterpreterBuilder(model,op_resolver)(&interpreter);auto*delegate=NewGpuDelegate(nullptr);//defaultconfigif(interpreter->ModifyGraphWithDelegate(delegate)!=kTfLiteOk)returnfalse;//Runinference.while(true){WriteToInputTensor(interpreter->typed_input_tensor(0));if(interpreter->Invoke()!=kTfLiteOk)returnfalse;ReadFromOutputTensor(interpreter->typed_output_tensor(0));}//Cleanup.interpreter=nullptr;DeleteGpuDelegate(delegate);

(更多的使用教程,可以參見TensorFlow的官方教程,傳送門在文末)

還在發(fā)展中

當(dāng)前發(fā)布的,只是TensorFlow Lite的開發(fā)者預(yù)覽版。

新的GPU后端,在安卓設(shè)備上利用的是OpenGL ES 3.1 Compute Shaders,在iOS上利用的是Metal Compute Shaders。

能夠支持的GPU操作并不多。有:

ADD v1、AVERAGE_POOL_2D v1、CONCATENATION v1、CONV_2D v1、DEPTHWISE_CONV_2D v1-2、FULLY_CONNECTED v1、LOGISTIC v1

MAX_POOL_2D v1、MUL v1、PAD v1、PRELU v1、RELU v1、RELU6 v1、RESHAPE v1、RESIZE_BILINEAR v1、SOFTMAX v1、STRIDED_SLICE v1、SUB v1、TRANSPOSE_CONV v1

TensorFlow官方表示,未來(lái)將會(huì)擴(kuò)大操作范圍、進(jìn)一步優(yōu)化性能、發(fā)展并最終確定API。

完整的開源版本,將會(huì)在2019年晚些時(shí)候發(fā)布。

傳送門

使用教程:

https://www.tensorflow.org/lite/performance/gpu

項(xiàng)目完整文檔:

https://www.tensorflow.org/lite/performance/gpu_advanced

博客地址:

https://medium.com/tensorflow/tensorflow-lite-now-faster-with-mobile-gpus-developer-preview-e15797e6dee7

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11076

    瀏覽量

    217002
  • 移動(dòng)設(shè)備
    +關(guān)注

    關(guān)注

    0

    文章

    519

    瀏覽量

    55224
  • tensorflow
    +關(guān)注

    關(guān)注

    13

    文章

    330

    瀏覽量

    61170
  • TensorFlow Lite
    +關(guān)注

    關(guān)注

    0

    文章

    26

    瀏覽量

    747

原文標(biāo)題:TensorFlow Lite發(fā)布重大更新!支持移動(dòng)GPU、推斷速度提升4-6倍

文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    無(wú)法將Tensorflow Lite模型轉(zhuǎn)換為OpenVINO?格式怎么處理?

    Tensorflow Lite 模型轉(zhuǎn)換為 OpenVINO? 格式。 遇到的錯(cuò)誤: FrontEnd API failed with OpConversionFailure:No translator found for TFLite_Detection_PostP
    發(fā)表于 06-25 08:27

    迅為iTOP-3576開發(fā)板適用于ARM PC、邊緣計(jì)算、個(gè)人移動(dòng)互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品。

    計(jì)算、個(gè)人移動(dòng)互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品。 支持INT4/INT8/INT16/FP16/BF16/TF32混合運(yùn)算,并憑借其強(qiáng)大的兼容性,可以輕松轉(zhuǎn)換基于TensorFlow、MXNet
    發(fā)表于 06-19 10:48

    DevEco重大更新快來(lái)體驗(yàn)吧

    HarmonyOS首個(gè)api17 release已經(jīng)正式發(fā)布了。這次的更新DevEco增加了很多重大特性,系統(tǒng)能力也有所增強(qiáng)。DevEco現(xiàn)在支持創(chuàng)建api17的應(yīng)用了,模擬器也首次支持闊折疊手機(jī)
    發(fā)表于 05-17 20:59

    迅為iTOP-RK3576開發(fā)板/核心板6TOPS超強(qiáng)算力NPU適用于ARM PC、邊緣計(jì)算、個(gè)人移動(dòng)互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品

    計(jì)算、個(gè)人移動(dòng)互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品。 支持INT4/INT8/INT16/FP16/BF16/TF32混合運(yùn)算,并憑借其強(qiáng)大的兼容性,可以輕松轉(zhuǎn)換基于TensorFlow、MXNet
    發(fā)表于 05-16 14:46

    微軟Copilot迎來(lái)重大更新

    “在微軟成立50周年之際,微軟AI首席執(zhí)行官穆斯塔法·蘇萊曼發(fā)布了Copilot的重大更新,這標(biāo)志著人工智能助手進(jìn)入了一個(gè)全新的時(shí)代。穆斯塔法在活動(dòng)中表示:“Copilot不僅僅是一個(gè)AI,它是屬于
    的頭像 發(fā)表于 04-09 16:40 ?371次閱讀

    迅為iTOP-RK3576開發(fā)板/核心板適用于ARM PC、邊緣計(jì)算、個(gè)人移動(dòng)互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品

    計(jì)算、個(gè)人移動(dòng)互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品。 支持INT4/INT8/INT16/FP16/BF16/TF32混合運(yùn)算,并憑借其強(qiáng)大的兼容性,可以輕松轉(zhuǎn)換基于TensorFlow、MXNet
    發(fā)表于 01-23 10:26

    EE-217:更新ADSP-TS101S TigerSHARC EZ-KIT Lite固件

    電子發(fā)燒友網(wǎng)站提供《EE-217:更新ADSP-TS101S TigerSHARC EZ-KIT Lite固件.pdf》資料免費(fèi)下載
    發(fā)表于 01-14 16:39 ?0次下載
    EE-217:<b class='flag-5'>更新</b>ADSP-TS101S TigerSHARC EZ-KIT <b class='flag-5'>Lite</b>固件

    迅為RK3576開發(fā)板適用于ARM PC、邊緣計(jì)算、個(gè)人移動(dòng)互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品

    計(jì)算、個(gè)人移動(dòng)互聯(lián)網(wǎng)設(shè)備及其他多媒體產(chǎn)品。 支持INT4/INT8/INT16/FP16/BF16/TF32混合運(yùn)算,并憑借其強(qiáng)大的兼容性,可以輕松轉(zhuǎn)換基于TensorFlow、MXNet
    發(fā)表于 12-27 14:18

    卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)工具與框架

    TensorFlow是由Google Brain團(tuán)隊(duì)開發(fā)的開源機(jī)器學(xué)習(xí)框架,它支持多種深度學(xué)習(xí)模型的構(gòu)建和訓(xùn)練,包括卷積神經(jīng)網(wǎng)絡(luò)。TensorFlow以其靈活性和可擴(kuò)展性而聞名,適用于
    的頭像 發(fā)表于 11-15 15:20 ?666次閱讀

    Android 16發(fā)布計(jì)劃曝光,谷歌將同步更新AOSP與Pixel設(shè)備

     據(jù)外媒最新報(bào)道,谷歌計(jì)劃在2025年6月3日邁出安卓系統(tǒng)更新的一大步,屆時(shí)將正式將Android 16推送至Android開放源代碼項(xiàng)目(AOSP),并同步為Pixel設(shè)備帶來(lái)這一全新系統(tǒng)的更新
    的頭像 發(fā)表于 11-06 17:05 ?1829次閱讀

    蘋果發(fā)布用于AirPods Pro 2新固件更新

    據(jù)10月25日外媒報(bào)道,蘋果公司近期發(fā)布了針對(duì)AirPods Pro 2的新固件更新,版本號(hào)為7B19,這是在9月發(fā)布的7A305版本后的又一次升級(jí)。此次更新覆蓋了USB-C和Ligh
    的頭像 發(fā)表于 10-25 14:39 ?1507次閱讀

    第四章:在 PC 交叉編譯 aarch64 的 tensorflow 開發(fā)環(huán)境并測(cè)試

    本文介紹了在 PC 端交叉編譯 aarch64 平臺(tái)的 tensorflow 庫(kù)而非 tensorflow lite 的心酸過(guò)程。
    的頭像 發(fā)表于 08-25 11:38 ?2589次閱讀
    第四章:在 PC 交叉編譯 aarch64 的 <b class='flag-5'>tensorflow</b> 開發(fā)環(huán)境并測(cè)試

    谷歌針對(duì)Android和iOS版Chrome發(fā)布五項(xiàng)更新

    移動(dòng)設(shè)備上搜索內(nèi)容應(yīng)該像在電腦上一樣流暢。近期,我們針對(duì) Android 和 iOS 版 Chrome 發(fā)布了五項(xiàng)更新,旨在讓您能夠更輕松地在手機(jī)或平板電腦上進(jìn)行搜索。
    的頭像 發(fā)表于 08-09 16:56 ?1058次閱讀

    微軟推出Windows 11的重大更新KB5040529

    微軟今日針對(duì)Windows Insider項(xiàng)目中的Release Preview頻道成員,隆重推出了Windows 11的重大更新——KB5040529,此次更新將系統(tǒng)版本號(hào)躍升至Build 26100.1297,為用戶解鎖了一
    的頭像 發(fā)表于 07-26 14:46 ?2033次閱讀

    降低物聯(lián)網(wǎng)開發(fā)門檻的TuyaOS重磅更新:AI賦能設(shè)備升級(jí),配網(wǎng)速度10倍提升

    作為降低智能解決方案開發(fā)門檻的 TuyaOS 操作系統(tǒng),此次又迎來(lái)了重大更新(點(diǎn)擊查看 TuyaOS 完整介紹)! 本次 TuyaOS 3.10.0 版本發(fā)布了超豐富的開發(fā)框架,覆蓋多
    的頭像 發(fā)表于 07-22 11:47 ?637次閱讀
    降低物聯(lián)網(wǎng)開發(fā)門檻的TuyaOS重磅<b class='flag-5'>更新</b>:AI賦能<b class='flag-5'>設(shè)備</b>升級(jí),配網(wǎng)速度10倍提升