99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

百度與科大訊飛的競(jìng)爭(zhēng)正在從語音交互延伸到視覺交互等多模態(tài)技術(shù)上

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-03-22 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近兩年來,隨著人們?cè)絹碓筋l繁使用智能產(chǎn)品,所產(chǎn)生的數(shù)據(jù)越來越龐大,這些數(shù)據(jù)又被大公司所利用,龐大的數(shù)據(jù)也將催生“機(jī)器人大腦”。

目前市面上已經(jīng)誕生出越來越多的機(jī)器人產(chǎn)品,如:早教機(jī)器人、陪護(hù)機(jī)器人、商場(chǎng)機(jī)器人、銀行機(jī)器人、法務(wù)機(jī)器人等等,但是在實(shí)際的場(chǎng)景應(yīng)用中,機(jī)器人并不能帶來真正的智能。

最主要的功能就是體現(xiàn)在機(jī)器人大腦,用專業(yè)術(shù)語講就是“語義”,我們?cè)谡Z義的采集上還處在非常初級(jí)的階段,如果處理不了語義理解,那機(jī)器人在實(shí)際場(chǎng)景中的應(yīng)用就是一個(gè)“呆子”。

讓機(jī)器人開口說話,除了語義之外,語音也是關(guān)鍵的技術(shù),國(guó)內(nèi)科大訊飛在語音技術(shù)上的造詣,讓國(guó)內(nèi)很多做機(jī)器人的企業(yè)受惠,其語音處理技術(shù)基本上已經(jīng)能滿足人們?nèi)粘I钪械氖褂眯枨蟆?/p>

但是國(guó)內(nèi)機(jī)器人產(chǎn)業(yè)接下來的發(fā)展將會(huì)開始加速,在這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上,不管是百度,還是科大訊飛所傳遞的信息就是已做好全面出擊的準(zhǔn)備。

雖然國(guó)內(nèi)語音語義的發(fā)展正在加速,但是對(duì)機(jī)器人企業(yè)而言,速度還不夠快,目前不管是百度,還是科大訊飛所提供的語音語義還是不能滿足機(jī)器人在實(shí)際應(yīng)用中的要求。

城市漫步總經(jīng)理李正說:“在人們與機(jī)器人對(duì)話的過程中,一些簡(jiǎn)單的問題,機(jī)器人是可以回答,但是稍微復(fù)雜一些的問題,機(jī)器人就回答不了,BAT或科大訊飛所提供的語義,讓機(jī)器人處在小孩3歲左右的智力水平。對(duì)很多機(jī)器人企業(yè)而言,目前的瓶頸也是在這里,很難有所突破?!?/p>

科大訊飛銷售總監(jiān)廖凱說:“其實(shí)訊飛也很苦惱,語音助理已經(jīng)通過國(guó)家各種考試,很難說它的智力不行,訊飛高考機(jī)器人基于目前的成長(zhǎng)速度,到2020年會(huì)考上一本,去年的數(shù)據(jù)顯示,語文考了90多分,數(shù)學(xué)考了110多分。”

只能說人們?nèi)粘=涣髦?,所體現(xiàn)的語言很復(fù)雜,目前的大數(shù)據(jù)還不能夠支撐人們復(fù)雜的日常交流。

百度自然語言技術(shù)開放負(fù)責(zé)人張晶晶說:“人工智能聰明程度其實(shí)很大程度上取決于數(shù)據(jù),百度為什么在人工智能領(lǐng)域國(guó)內(nèi)領(lǐng)先,因?yàn)楸澈笫驱嫶蟮臄?shù)據(jù),比如百度搜索,每天有60億次搜索,這些數(shù)據(jù)支撐百度深度語義理解,像這種過億用戶的APP,百度有14個(gè),這些數(shù)據(jù)支撐了百度大腦每時(shí)每刻都在進(jìn)化。”

“國(guó)內(nèi)各大平臺(tái),如:百度UNIT、訊飛AIUI、小i機(jī)器人、思必馳等,其實(shí)各家的側(cè)重點(diǎn)不同,因此,最終的測(cè)試結(jié)果也會(huì)不同,像百度的對(duì)話效果只有達(dá)到95%以上才會(huì)放出來。”

但是在這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上,機(jī)器人企業(yè)對(duì)各大平臺(tái)所提供的語義依然不是特別滿意。

或許國(guó)內(nèi)各大機(jī)器人企業(yè)過于依賴BAT等企業(yè),希望依靠BAT大企業(yè)的投入完善語音語義技術(shù),但是百度已經(jīng)在語音語義上投入了3億元,雖然技術(shù)積累很快,但是目前的瓶頸是依然還不能支撐機(jī)器人日常復(fù)雜的對(duì)話交流。

狗尾草聯(lián)合創(chuàng)始人張博說:“3至5歲小孩,同一個(gè)問題,在每個(gè)年齡段尋求的答案都不同,所以對(duì)語義的要求非常高,如果真要做好語義理解,就需要把語義理解做的足夠細(xì),再接入知識(shí)圖譜,如果是批量的知識(shí)圖譜,那就需要各大平臺(tái)開放知識(shí)庫,讓機(jī)器人企業(yè)去調(diào)用,滿足更高級(jí)開發(fā)的產(chǎn)品需求?!?/p>

從這次1號(hào)機(jī)器人網(wǎng)研討會(huì)上反饋,現(xiàn)階段讓各大平臺(tái)完全開放知識(shí)庫不現(xiàn)實(shí),像百度、科大訊飛、小i機(jī)器人等投入巨資打造知識(shí)庫,機(jī)器人企業(yè)想調(diào)用深層次語義,就需要支付相應(yīng)的報(bào)酬。

當(dāng)然很多機(jī)器人企業(yè)對(duì)語音還是另有看法,比如AI與UI,明明很多場(chǎng)景直接通過UI就可以解決的事情,干嘛非要用語音,把簡(jiǎn)單的事情復(fù)雜化。

這個(gè)問題的著重點(diǎn)在于,目前看來語音確實(shí)還不是最好用的產(chǎn)品,但是長(zhǎng)遠(yuǎn)看語音將會(huì)是最便捷的交互方式。

當(dāng)汽車和火車剛發(fā)明的時(shí)候,跑起來還沒有馬車快,但是終究汽車和火車是發(fā)展方向。

科大訊飛廖凱說:“人與機(jī)器發(fā)生交互的時(shí)候,輸入輸出信息有兩種,我們從機(jī)器身上獲取的信息,最簡(jiǎn)單的方式就是視覺,一目了然;但我們輸出的信息最自然的方式是語音。這是語音的特性,未來一定會(huì)顛覆傳統(tǒng)以鍵盤或觸屏的輸出方式?!?/p>

接下來,我們回到產(chǎn)品上來,對(duì)機(jī)器人企業(yè)而言,現(xiàn)階段就算依靠BAT等企業(yè)的語音語義技術(shù),也不能讓產(chǎn)品具備高智慧,充其量只能達(dá)到小孩3歲左右的智力水平。

所以未來的方向在于細(xì)分場(chǎng)景,比如:訂機(jī)票、訂酒店等,采用百度和科大訊飛的語音語義可以非常成熟的完成,讓用戶從查詢機(jī)票到預(yù)訂票到購買機(jī)票等全過程,期間進(jìn)行的多輪復(fù)雜人機(jī)對(duì)話可達(dá)7層以上。

因此,在一些細(xì)分商用場(chǎng)景,語音已經(jīng)可以做到替代客服的工作,對(duì)機(jī)器人企業(yè)而言,如何讓機(jī)器人+語音語義+使用場(chǎng)景落地才是接下來重點(diǎn)思考的方向。

百度張晶晶認(rèn)為,通過百度大數(shù)據(jù)分析,兒童故事機(jī)的市場(chǎng)規(guī)模很大,目前正是更新?lián)Q代的時(shí)間節(jié)點(diǎn),因此,百度對(duì)兒童領(lǐng)域的投入會(huì)有所加大。

科大訊飛廖凱說:“今年大型商用機(jī)器人會(huì)有所發(fā)展,目前訊飛曉曼機(jī)器人已經(jīng)入駐紅星美凱龍、居然之家,以及一些零售商場(chǎng)。曉曼機(jī)器人目前已經(jīng)可以做到導(dǎo)航領(lǐng)路、提供資訊、針對(duì)商場(chǎng)還提供了一套機(jī)器人營(yíng)銷方案,通過大數(shù)據(jù)幫助商家提高客戶的轉(zhuǎn)化率?!?/p>

目前國(guó)內(nèi)大型商用機(jī)器人研發(fā)投入大,但是相對(duì)售價(jià)高、利潤(rùn)高,很多機(jī)器人企業(yè)在大型商用機(jī)器人身上舍得投入,因此,對(duì)科大訊飛而言,也有更強(qiáng)的動(dòng)力去做技術(shù)的迭代。

如果從競(jìng)爭(zhēng)的角度去分析,目前百度和科大訊飛提供的語音語義方案是旗鼓相當(dāng)。

但是接下來的競(jìng)爭(zhēng)將會(huì)更加深入,涉及到多模態(tài)技術(shù)交互。

科大訊飛在AIUI的構(gòu)架下,加入手勢(shì)識(shí)別、圖像識(shí)別,使得人機(jī)交互技術(shù)更加復(fù)雜;百度也是一樣,在提供語音交互的基礎(chǔ)上加入圖像識(shí)別,提供一站式服務(wù)。

因此,百度與科大訊飛的競(jìng)爭(zhēng)正在從語音交互延伸到視覺交互等多模態(tài)技術(shù)上,對(duì)機(jī)器人企業(yè)而言,全新的時(shí)代即將來臨,在主流人工智能企業(yè)激烈的競(jìng)爭(zhēng)下,能夠享受到的技術(shù)紅利是,可以以低成本的方案去創(chuàng)造一臺(tái)全新的機(jī)器人。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29748

    瀏覽量

    212903
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    841

    瀏覽量

    62458
  • 自然語言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    13656

原文標(biāo)題:百度與科大訊飛競(jìng)爭(zhēng)將從語音擴(kuò)散到視覺

文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    超擬人交互API上線

    讓AI感知用戶情緒,從冰冷服務(wù)進(jìn)化成為心意相通的助手,這并非存在于《Her》或《鋼鐵俠》科幻電影。大模型加持的語音交互全新升級(jí),能夠輕松應(yīng)對(duì)輪對(duì)話,而且實(shí)現(xiàn)情緒響應(yīng)和個(gè)性定制。
    的頭像 發(fā)表于 07-10 15:21 ?404次閱讀

    汽車模態(tài)交互測(cè)試:智能交互的深度驗(yàn)證

    在汽車智能座艙測(cè)試的關(guān)鍵進(jìn)程中,北京沃華慧通測(cè)控技術(shù)有限公司展現(xiàn)出了獨(dú)特的價(jià)值與優(yōu)勢(shì)。作為一家專注于測(cè)控技術(shù)領(lǐng)域的企業(yè),沃華慧通在智能座艙測(cè)試方面積累了豐富的經(jīng)驗(yàn)和專業(yè)的技術(shù)能力。其研發(fā)的測(cè)試設(shè)備能夠精準(zhǔn)模擬各種復(fù)雜的車載環(huán)境,
    的頭像 發(fā)表于 06-25 09:00 ?837次閱讀
    汽車<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>交互</b>測(cè)試:智能<b class='flag-5'>交互</b>的深度驗(yàn)證

    打破交互困局:科大這樣出手

    十年深耕,科大智能交互如何引領(lǐng)未來
    的頭像 發(fā)表于 06-17 11:50 ?468次閱讀
    打破<b class='flag-5'>交互</b>困局:<b class='flag-5'>科大</b><b class='flag-5'>訊</b><b class='flag-5'>飛</b>這樣出手

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    隨著千行業(yè)數(shù)智化進(jìn)程的不斷加速,模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語音、視頻多樣化的交互
    發(fā)表于 03-21 14:12 ?284次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑智能<b class='flag-5'>交互</b>新體驗(yàn)

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗(yàn)

    隨著千行業(yè)數(shù)智化進(jìn)程的不斷加速,模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語音、視頻多樣化的交互
    的頭像 發(fā)表于 03-20 19:03 ?433次閱讀
    移遠(yuǎn)通信智能模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑智能<b class='flag-5'>交互</b>新體驗(yàn)

    ?模態(tài)交互技術(shù)解析

    模態(tài)交互 模態(tài)交互( Multimodal Interaction )是指通過多種感官通道(
    的頭像 發(fā)表于 03-17 15:12 ?2054次閱讀

    科大Air 2電紙書和掌閱Ocean4 Plus區(qū)別

    首先說說科大Air 2,這款設(shè)備的核心亮點(diǎn)在于它的AI功能和辦公屬性。8.2英寸的墨水屏,分辨率高達(dá)1920*1440,顯示效果非常細(xì)膩,閱讀時(shí)眼睛不會(huì)感到疲勞。它的屏占比達(dá)到了88.5%,
    發(fā)表于 03-03 14:01

    科大推出大模型極速超擬人交互軟硬件方案

    隨著大模型技術(shù)的不斷發(fā)展,大模型的應(yīng)用越來越受到行業(yè)的重視。如何在智能硬件的語音交互快速應(yīng)用和普及大模型,一直是業(yè)內(nèi)熱議和探索的話題。
    的頭像 發(fā)表于 01-16 11:07 ?776次閱讀

    科大即將發(fā)布星火深度推理模型X1

    ,標(biāo)志著科大飛在AI技術(shù)領(lǐng)域的又一次重大突破。星火深度推理模型X1將為科大
    的頭像 發(fā)表于 01-08 10:30 ?757次閱讀

    科大AI虛擬人交互平臺(tái)榮獲行業(yè)最高評(píng)級(jí)

    近日,科大的AI虛擬人交互平臺(tái)順利完成中國(guó)信通院人工智能研究所組織的大模型數(shù)字人基礎(chǔ)能力分級(jí)測(cè)試,并獲得最高等級(jí)L5認(rèn)證,系國(guó)內(nèi)首批。
    的頭像 發(fā)表于 12-13 11:39 ?875次閱讀

    科大發(fā)布星火4.0 Turbo大模型及星火多語言大模型

    近日,科大正式推出了其最新研發(fā)成果——星火4.0 Turbo大模型。這一發(fā)布不僅標(biāo)志著科大
    的頭像 發(fā)表于 10-24 13:58 ?911次閱讀

    科大發(fā)布星火4.0 Turbo:七大能力超GPT-4 Turbo

    10月24日,在科大全球1024開發(fā)者節(jié),科大
    的頭像 發(fā)表于 10-24 11:39 ?1082次閱讀

    2024科大全球1024開發(fā)者節(jié)官宣

    在這場(chǎng)屬于開發(fā)者的年度人工智能盛會(huì)上,不僅有產(chǎn)學(xué)研大咖現(xiàn)場(chǎng)分享,升級(jí)行業(yè)大模型及更多應(yīng)用產(chǎn)品,首發(fā)模態(tài)視覺交互及超擬人虛擬人交互能力,
    的頭像 發(fā)表于 10-14 10:01 ?1245次閱讀

    科大將首發(fā)模態(tài)視覺交互及超擬人虛擬人交互

    近日,科大傳來喜訊,第七屆世界聲博會(huì)暨2024科大全球1024開發(fā)者節(jié)將于10月24日至
    的頭像 發(fā)表于 10-11 16:48 ?678次閱讀

    科大發(fā)布星火極速超擬人交互,重塑智能對(duì)話新體驗(yàn)

    8月19日,科大震撼宣布了一項(xiàng)關(guān)于其明星產(chǎn)品——星火語音大模型的重大革新,即將推出的“星火極速超擬人交互”功能,預(yù)示著人機(jī)
    的頭像 發(fā)表于 08-20 16:46 ?738次閱讀