99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

圖像捕獲是AI中最難的問(wèn)題之一

倩倩 ? 來(lái)源:新經(jīng)網(wǎng) ? 作者:新經(jīng)網(wǎng) ? 2020-10-15 14:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

長(zhǎng)期以來(lái),AI的目標(biāo)就是準(zhǔn)確地描述圖像,而不僅僅是像笨拙的機(jī)器人。谷歌在2016年表示,其人工智能可以為人類提供幾乎與人類一樣的字幕圖像,準(zhǔn)確度達(dá)到94%?,F(xiàn)在,微軟表示,它走得更遠(yuǎn):它的研究人員建立了一個(gè)AI系統(tǒng),甚至比人類更準(zhǔn)確-以至于現(xiàn)在坐上了榜首的nocaps圖像字幕標(biāo)桿。微軟聲稱其自2015年以來(lái)一直使用的圖像字幕模型要好兩倍。

盡管這本身就是一個(gè)顯著的里程碑,但微軟不僅僅是將這項(xiàng)技術(shù)保留在自己手中?,F(xiàn)在,它作為Azure認(rèn)知服務(wù)的一部分提供了新的字幕模型,因此任何開(kāi)發(fā)人員都可以將其引入他們的應(yīng)用程序中。今天,它也可以在Seeing AI中使用,Seeing AI是面向盲人和視障用戶的Microsoft應(yīng)用程序,可以描述周圍的世界。今年下半年,字幕模型還將改善您在PowerPoint中針對(duì)Web,Windows和Mac的演示文稿。它還會(huì)在桌面平臺(tái)的Word和Outlook中彈出。

Azure AI的CVP Eric Boyd在接受Engadget采訪時(shí)說(shuō):“圖像捕獲是AI中最難的問(wèn)題之一。它不僅代表理解場(chǎng)景中的對(duì)象,還包括它們之間的交互方式,以及如何描述它們。”精細(xì)的字幕技術(shù)可以為每個(gè)用戶提供幫助:它使在搜索引擎中查找所需圖像變得更加容易;對(duì)于視障用戶,它可以使瀏覽網(wǎng)絡(luò)和軟件變得更加出色。

看到公司吹捧他們的AI研究創(chuàng)新并不少見(jiàn),但是將這些發(fā)現(xiàn)迅速部署到運(yùn)輸產(chǎn)品中卻很少見(jiàn)。Azure AI認(rèn)知服務(wù)的CTO Huang Xuedong出于對(duì)用戶的潛在好處,推動(dòng)將其迅速集成到Azure中。他的團(tuán)隊(duì)使用標(biāo)記有特定關(guān)鍵字的圖像對(duì)模型進(jìn)行了訓(xùn)練,這有助于使它成為大多數(shù)AI框架所沒(méi)有的視覺(jué)語(yǔ)言。通常,這些類型的模型是使用圖像和完整標(biāo)題訓(xùn)練的,這使得模型更難于學(xué)習(xí)特定對(duì)象的交互方式。

“視覺(jué)詞匯預(yù)訓(xùn)練本質(zhì)上是訓(xùn)練系統(tǒng)所需的教育;我們正在嘗試教育這種運(yùn)動(dòng)記憶,”黃在博客文章中說(shuō)。這就是這種新模型在nocaps基準(zhǔn)測(cè)試中的優(yōu)勢(shì),該基準(zhǔn)測(cè)試側(cè)重于確定AI可以如何為字幕創(chuàng)建字幕,這些字幕從未見(jiàn)過(guò)。

但是,盡管要打破基準(zhǔn)很重要,但微軟新模型的真正考驗(yàn)將是它在現(xiàn)實(shí)世界中的功能。據(jù)博伊德說(shuō),Seeing AI開(kāi)發(fā)人員Saqib Shaik也在自己的盲人手中推動(dòng)了Microsoft的更大可訪問(wèn)性,他說(shuō)這是對(duì)他們先前產(chǎn)品的巨大改進(jìn)。既然微軟已經(jīng)設(shè)定了一個(gè)新的里程碑,那么有趣的是,看看來(lái)自Google和其他研究人員的競(jìng)爭(zhēng)模型也將如何競(jìng)爭(zhēng)。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6686

    瀏覽量

    105786
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212987
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35168

    瀏覽量

    280169
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(離線AI語(yǔ)音視覺(jué)識(shí)別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無(wú)需依賴網(wǎng)絡(luò)即可實(shí)現(xiàn)智能功能的特性,在些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場(chǎng)景中,發(fā)揮著不可或缺的作用。本章基于CSK
    發(fā)表于 07-04 11:14

    CX3顯示RAW12圖像錯(cuò)誤的原因?

    我想通過(guò)CX3065從FPGA捕獲MIPI圖像,我可以切換4種分辨率并通過(guò)開(kāi)始捕獲顯示圖像,但片刻之后,我的UVC_App顯示的圖像是錯(cuò)誤的
    發(fā)表于 05-16 07:49

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+讀《零基礎(chǔ)開(kāi)發(fā)AI Agent》掌握扣子平臺(tái)開(kāi)發(fā)智能體方法

    收到發(fā)燒友網(wǎng)站寄來(lái)的《零基礎(chǔ)開(kāi)發(fā)AI Agent》這本書(shū)已經(jīng)有好些天了,這段時(shí)間有幸拜讀了下全書(shū),掌握了個(gè)開(kāi)發(fā)智能體的方法。 該書(shū)充分從零基礎(chǔ)入手,先闡述了Agent是什么,它的基本概念和知識(shí)
    發(fā)表于 05-14 19:51

    泰克MDO3052示波器波形捕獲率評(píng)測(cè)

    能力,為用戶提供選型參考。 、波形捕獲率的核心價(jià)值與技術(shù)原理 波形捕獲率是示波器在單位時(shí)間內(nèi)捕獲并處理波形的次數(shù),直接影響異常信號(hào)的捕獲
    的頭像 發(fā)表于 04-02 11:49 ?379次閱讀
    泰克MDO3052示波器波形<b class='flag-5'>捕獲</b>率評(píng)測(cè)

    芯原推出新代集成AI的ISP9000圖像信號(hào)處理器,賦能智能視覺(jué)應(yīng)用

    芯原股份今日發(fā)布其ISP9000系列圖像信號(hào)處理器(ISP)IP——面向日益增長(zhǎng)的智能視覺(jué)應(yīng)用需求而打造的新AI ISP解決方案。ISP9000采用靈活的AI優(yōu)化架構(gòu),提供卓越的
    的頭像 發(fā)表于 04-02 10:43 ?384次閱讀

    中科億海微SoM模組——AI圖像推理解決方案

    隨著AI技術(shù)的快速發(fā)展,AI圖像推理作為種高效、智能的圖像處理技術(shù),已成為推動(dòng)各行業(yè)數(shù)字化轉(zhuǎn)型和智能化升級(jí)的關(guān)鍵。它憑借強(qiáng)大的
    的頭像 發(fā)表于 03-27 13:48 ?362次閱讀
    中科億海微SoM模組——<b class='flag-5'>AI</b><b class='flag-5'>圖像</b>推理解決方案

    圖像采集卡:現(xiàn)代圖像處理技術(shù)的關(guān)鍵組件

    直接影響到圖像的質(zhì)量和處理效率。本文將系統(tǒng)探討圖像采集卡的定義、工作原理、應(yīng)用領(lǐng)域以及未來(lái)發(fā)展趨勢(shì)。、圖像采集卡的定義圖像采集卡,通常被稱
    的頭像 發(fā)表于 02-20 10:42 ?491次閱讀
    <b class='flag-5'>圖像</b>采集卡:現(xiàn)代<b class='flag-5'>圖像</b>處理技術(shù)的關(guān)鍵組件

    攝像頭捕獲 2D 圖像,深度傳感器拉長(zhǎng)距離

    的,但單獨(dú)的攝像頭只能捕獲2D圖像。為了發(fā)揮作用,還需要使他們獲得深度信息。例如:自動(dòng)感應(yīng)水龍頭需要識(shí)別與手的距離、機(jī)器人和自動(dòng)駕駛汽車需要檢測(cè)到與物體的距離以避免碰
    的頭像 發(fā)表于 12-08 01:01 ?731次閱讀
    攝像頭<b class='flag-5'>捕獲</b> 2D <b class='flag-5'>圖像</b>,深度傳感器拉長(zhǎng)距離

    高通AI Hub:輕松實(shí)現(xiàn)Android圖像分類

    高通AI Hub為開(kāi)發(fā)者提供了個(gè)強(qiáng)大的平臺(tái),以優(yōu)化、驗(yàn)證和部署在Android設(shè)備上的機(jī)器學(xué)習(xí)模型。這篇文章將介紹如何使用高通AI Hub進(jìn)行圖像分類的程式碼開(kāi)發(fā),并提供
    的頭像 發(fā)表于 11-26 01:03 ?930次閱讀
    高通<b class='flag-5'>AI</b> Hub:輕松實(shí)現(xiàn)Android<b class='flag-5'>圖像</b>分類

    AI圖像識(shí)別攝像機(jī)

    隨著科技的迅猛發(fā)展,人工智能(AI)在各個(gè)領(lǐng)域的應(yīng)用越來(lái)越廣泛,其中圖像識(shí)別技術(shù)尤為引人注目。AI圖像識(shí)別攝像機(jī)作為這技術(shù)的重要應(yīng)用
    的頭像 發(fā)表于 11-08 10:38 ?879次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>圖像</b>識(shí)別攝像機(jī)

    AI大模型的訓(xùn)練數(shù)據(jù)來(lái)源分析

    AI大模型的訓(xùn)練數(shù)據(jù)來(lái)源廣泛且多元化,這些數(shù)據(jù)源對(duì)于構(gòu)建和優(yōu)化AI模型至關(guān)重要。以下是對(duì)AI大模型訓(xùn)練數(shù)據(jù)來(lái)源的分析: 、公開(kāi)數(shù)據(jù)集 公開(kāi)數(shù)據(jù)集是
    的頭像 發(fā)表于 10-23 15:32 ?3693次閱讀

    AI大模型在圖像識(shí)別中的優(yōu)勢(shì)

    AI大模型在圖像識(shí)別中展現(xiàn)出了顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)主要源于其強(qiáng)大的計(jì)算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對(duì)AI大模型在圖像識(shí)別中優(yōu)勢(shì)的介紹:
    的頭像 發(fā)表于 10-23 15:01 ?2446次閱讀

    圖像采集卡:增強(qiáng)視覺(jué)數(shù)據(jù)采集

    。什么是圖像采集卡?圖像采集卡,是種專門(mén)用于捕獲和處理來(lái)自不同來(lái)源的視頻信號(hào)或圖像的硬件組件。它們充當(dāng)成像設(shè)備(例如相機(jī)或視頻源)與計(jì)算機(jī)
    的頭像 發(fā)表于 09-24 11:06 ?694次閱讀
    <b class='flag-5'>圖像</b>采集卡:增強(qiáng)視覺(jué)數(shù)據(jù)采集

    Freepik攜手Magnific AI推出AI圖像生成器

    近日,設(shè)計(jì)資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這里程碑式的發(fā)布標(biāo)志著
    的頭像 發(fā)表于 08-30 16:23 ?1592次閱讀

    是德DSOX4032A示波器波形捕獲

    在電子工程領(lǐng)域,示波器是不可或缺的工具之一。而其中,是德DSOX4032A示波器以其卓越的性能和精準(zhǔn)的測(cè)量能力備受青睞。今天,我們就來(lái)深入了解下是德DSOX4032A示波器的波形捕獲率。
    的頭像 發(fā)表于 08-30 15:38 ?591次閱讀
    是德DSOX4032A示波器波形<b class='flag-5'>捕獲</b>率