99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于有屏設(shè)備的語(yǔ)音交互體驗(yàn)實(shí)驗(yàn)研究

傳感器技術(shù) ? 來(lái)源:未知 ? 作者:工程師郭婷 ? 2018-07-28 12:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

第二屆百度AI開(kāi)發(fā)者大會(huì)在北京舉行,百度AI交互設(shè)計(jì)院在首次舉辦的AI設(shè)計(jì)分論壇上,分享了《AI時(shí)代的人因工程》主題演講,他們認(rèn)為:在AI時(shí)代,全新的設(shè)計(jì)將會(huì)重構(gòu)我們身邊的工具、生產(chǎn)力、生活甚至心理學(xué)。AI時(shí)代的人因工程,是關(guān)于人的能力、行為、限制的特點(diǎn),也關(guān)于人的社會(huì)、文化、心理,是真正以人類為中心的系統(tǒng)工程。他們還將腦電、肌電和眼動(dòng)等生理測(cè)量方法引入了人因工程研究中,將研究方法進(jìn)行創(chuàng)新迭代,不斷助力百度的AI產(chǎn)品進(jìn)行“重構(gòu)”。百度開(kāi)發(fā)者大會(huì)剛剛結(jié)束,百度AI交互設(shè)計(jì)院又隨即推出了最新的研究報(bào)告《多維對(duì)話——走向視聽(tīng)融合的語(yǔ)音交互新體驗(yàn)研究》,進(jìn)一步用扎實(shí)的研究彰顯了他們?cè)贏I交互設(shè)計(jì)領(lǐng)域的專業(yè)實(shí)力。

過(guò)去四十年,人與機(jī)器的交互方式在不斷進(jìn)化,幾乎每十年就會(huì)有一次重大革新。來(lái)到人工智能時(shí)代,生活中越來(lái)越多的設(shè)備開(kāi)始支持語(yǔ)音交互,語(yǔ)音交互逐漸成為人們傳達(dá)意圖和與設(shè)備交流的優(yōu)先選擇(Voice First)。與傳統(tǒng)交互相比,語(yǔ)音交互解放了雙手和雙眼,人們可以低成本與設(shè)備互動(dòng);而且,語(yǔ)音是多維的,除了言語(yǔ)本身的信息,言語(yǔ)中還蘊(yùn)含著豐富情感,允許人們與設(shè)備進(jìn)行更充分的互動(dòng)。

語(yǔ)音交互也有局限性。語(yǔ)音交互是非可視化的,容易增加人們的記憶負(fù)擔(dān),設(shè)想語(yǔ)音查詢信息的場(chǎng)景,你可能需要集中精力聽(tīng),如果不留神就容易錯(cuò)過(guò)一些內(nèi)容。鑒于此,正如人工智能專家吳恩達(dá)提到的,人與機(jī)器交流最高效的方式是語(yǔ)言,而機(jī)器與人最高效的交流方式是語(yǔ)言加上視覺(jué),即需要在聽(tīng)覺(jué)基礎(chǔ)上融入視覺(jué)信息彌補(bǔ)語(yǔ)音交互的不足。從語(yǔ)音向視覺(jué)延伸,在語(yǔ)音交互中融入可視化信息,已經(jīng)是業(yè)界探索下一代語(yǔ)音交互范式的重要趨勢(shì)。以智能音箱為例,除了無(wú)屏音箱以外,市場(chǎng)上開(kāi)始出現(xiàn)帶屏幕的音箱。

百度人工智能交互設(shè)計(jì)院本期以有屏智能設(shè)備為研究對(duì)象,聚焦語(yǔ)音交互反饋和內(nèi)容輸出環(huán)節(jié)的體驗(yàn)??紤]到屏幕尺寸差異可能對(duì)反饋和內(nèi)容輸出體驗(yàn)的影響,研究選擇了兩種不同屏幕尺寸的設(shè)備,分別是智能音箱(7英寸)和智能電視(55英寸)。本期的主要研究問(wèn)題包括:

1)有屏設(shè)備的指令上屏反饋體驗(yàn),主要指用戶輸入語(yǔ)音指令后,文本指令上屏的延遲時(shí)間以及文本指令在屏幕上呈現(xiàn)的合理時(shí)間;

2)有屏設(shè)備內(nèi)容輸出的音量干擾體驗(yàn),主要指用戶在特定場(chǎng)景下(如聽(tīng)音樂(lè)/看視頻),插入其它任務(wù)后(如查詢百科),不同內(nèi)容輸出時(shí)的音量合理設(shè)置。

關(guān)于有屏設(shè)備的語(yǔ)音交互體驗(yàn)實(shí)驗(yàn)研究

有屏設(shè)備的指令上屏體驗(yàn)研究

與無(wú)屏設(shè)備相比,顯示屏的融入使語(yǔ)音交互過(guò)程有更豐富的反饋形式。以語(yǔ)音識(shí)別階段為例,在無(wú)屏設(shè)備上,用戶通常無(wú)法直接知道輸入指令的識(shí)別結(jié)果。而有屏設(shè)備直接在屏幕上顯示指令的識(shí)別結(jié)果,用戶可以方便的查看識(shí)別結(jié)果的正確或錯(cuò)誤情況,例如上屏后的指令"我要聽(tīng)周杰倫的青花瓷"。然而,目前很多設(shè)備在指令上屏?xí)r存在一定程度的延遲現(xiàn)象,本實(shí)驗(yàn)對(duì)指令上屏合理的延遲時(shí)間和呈現(xiàn)時(shí)間進(jìn)行研究。

1、指令上屏延遲時(shí)間實(shí)驗(yàn)

由于市場(chǎng)上的有屏設(shè)備多數(shù)采用實(shí)時(shí)上屏方式,即用戶輸入語(yǔ)音指令的同時(shí)就開(kāi)始在屏幕上呈現(xiàn)識(shí)別結(jié)果,因此,本實(shí)驗(yàn)只研究實(shí)時(shí)上屏。在實(shí)驗(yàn)中我們使用實(shí)時(shí)逐字上屏的方式,并以控制首字上屏延遲時(shí)間為主要變量(注:首字上屏延遲時(shí)間指從用戶開(kāi)始說(shuō)到第一個(gè)字上屏的時(shí)間間隔),我們?cè)O(shè)置了不同的首字延遲時(shí)間,以此獲取用戶對(duì)指令上屏速度的滿意度評(píng)價(jià)(5點(diǎn)量表:1-非常不滿意,2-比較不滿意,3-一般,4-比較滿意,5-非常滿意)。在實(shí)驗(yàn)中,我們分別提供了3種不同長(zhǎng)度的指令。

實(shí)驗(yàn)結(jié)果表明,首字延遲時(shí)間越短,用戶的滿意度越高,不同屏幕尺寸設(shè)備的首字延遲時(shí)間滿意度略有差異,我們將"4-比較滿意"看做用戶滿意的得分下限,將"3-一般"看做用戶可接受的得分下限,不同設(shè)備間用戶滿意和可接受的上屏?xí)r間如下:

1)對(duì)于有屏音箱,用戶滿意的首字延遲時(shí)間下限在500ms左右,可接受的首字延遲時(shí)間下限在1500-1600ms左右;

2)對(duì)于智能電視,用戶滿意的首字延遲時(shí)間下限在600-700ms左右,可接受的首字延遲時(shí)間下限在1100-1200ms左右;

結(jié)合對(duì)市場(chǎng)上其它設(shè)備的研究發(fā)現(xiàn),部分設(shè)備的首字上屏?xí)r間明顯比用戶滿意的時(shí)間下限長(zhǎng),少數(shù)甚至比可接受的下限還要長(zhǎng)。關(guān)于指令上屏速度,產(chǎn)品仍有改善和優(yōu)化的空間,即語(yǔ)音識(shí)別ASR(Automatic Speech Recognition)技術(shù)除了在不斷提升識(shí)別準(zhǔn)確率以外,同時(shí)也需要關(guān)注識(shí)別速度指標(biāo)的提升。

2、指令上屏呈現(xiàn)時(shí)間實(shí)驗(yàn)

除了指令上屏?xí)r間,我們進(jìn)一步對(duì)指令上屏后合理的呈現(xiàn)時(shí)間進(jìn)行研究,以避免指令呈現(xiàn)時(shí)間太短導(dǎo)致用戶無(wú)法看清,或者呈現(xiàn)時(shí)間太長(zhǎng)導(dǎo)致整個(gè)交互過(guò)程拖沓冗余。在實(shí)驗(yàn)中,我們以文字呈現(xiàn)時(shí)間為主要變量(注:文字呈現(xiàn)時(shí)間指文本指令最后一個(gè)字上屏后到全部指令消失的時(shí)間間隔),獲取用戶對(duì)不同呈現(xiàn)時(shí)間的滿意度評(píng)價(jià)。由于語(yǔ)音識(shí)別涉及語(yǔ)言模型技術(shù),實(shí)際的指令上屏并不是逐字的方式,因此,本部分實(shí)驗(yàn)我們也模擬了逐塊上屏的方式,以指令"我想看劉德華2010年以前主演的香港電影"為例,"劉德華"被整體識(shí)別后才上屏。在實(shí)驗(yàn)中,我們也分別提供了3種不同長(zhǎng)度的指令。

實(shí)驗(yàn)結(jié)果表明,存在最優(yōu)的文字上屏呈現(xiàn)時(shí)間,不同屏幕尺寸設(shè)備之間,最優(yōu)的文字上屏呈現(xiàn)時(shí)間無(wú)顯著差異。不同上屏方式間存在差異,逐字上屏和逐塊上屏的最優(yōu)呈現(xiàn)時(shí)間分別如下:

1)逐字上屏方式下,最優(yōu)的指令呈現(xiàn)時(shí)間為200-500ms的區(qū)間;

2)逐塊上屏方式下,最優(yōu)的指令呈現(xiàn)時(shí)間為400-700ms的區(qū)間。

關(guān)于有屏設(shè)備的語(yǔ)音交互體驗(yàn)實(shí)驗(yàn)研究

由于逐塊上屏方式更接近真實(shí)產(chǎn)品的上屏方式,因此建議主要參考400-700ms的呈現(xiàn)時(shí)間。需要說(shuō)明的是,由于實(shí)時(shí)上屏的方式允許用戶在輸入語(yǔ)音指令過(guò)程中就可以查看已經(jīng)上屏的文字,這與整體識(shí)別后上屏的方式明顯不同,因此,如果產(chǎn)品采用的是整體識(shí)別后上屏的方式,不建議參考本部分實(shí)驗(yàn)的結(jié)論。

有屏設(shè)備的音量干擾體驗(yàn)研究

有屏設(shè)備除了使語(yǔ)音交互有更豐富的反饋以外,屏幕的引入也擴(kuò)展了設(shè)備過(guò)去不具備的功能,例如視頻內(nèi)容消費(fèi)和視頻通訊能力等。同時(shí)設(shè)備的使用也在經(jīng)歷從過(guò)去單一任務(wù)到多個(gè)任務(wù)的變化,當(dāng)看視頻時(shí),你可以隨時(shí)插入任務(wù)查找信息,例如看電視劇《扶搖》時(shí)查詢演員楊冪的信息。本部分實(shí)驗(yàn)主要研究用戶插入任務(wù)后,前景內(nèi)容和背景內(nèi)容間的音量干擾體驗(yàn),如當(dāng)前景內(nèi)容正在語(yǔ)音播報(bào)信息時(shí),背景視頻或音樂(lè)的合理音量范圍,以避免過(guò)高的背景音對(duì)用戶獲取信息產(chǎn)生干擾。

1、音量干擾實(shí)驗(yàn)

在實(shí)驗(yàn)中,用戶被要求分別在看視頻和聽(tīng)音樂(lè)兩種場(chǎng)景下進(jìn)行信息查詢。我們?cè)O(shè)置了兩種初始音量(注:初始音量是用戶看視頻/聽(tīng)音樂(lè)的音量):60和65分貝,用戶查詢?nèi)宋锘虬倏菩畔⒑?,通過(guò)設(shè)置不同的背景音量(注:此時(shí)前景內(nèi)容為語(yǔ)音播報(bào)信息,背景內(nèi)容為視頻或音樂(lè)),獲取用戶對(duì)背景音量的滿意度評(píng)價(jià)。同時(shí)結(jié)合實(shí)驗(yàn)后問(wèn)卷了解用戶對(duì)前景和背景信息展示的態(tài)度。由于不同設(shè)備間音量刻度范圍存在差異,實(shí)驗(yàn)中對(duì)有屏音箱和智能電視的背景音量進(jìn)行了分別設(shè)置。

實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),無(wú)論背景是視頻還是音樂(lè),用戶都不喜歡背景完全靜音(注:下圖中"0"代表背景完全靜音)。針對(duì)有屏音箱和智能電視,當(dāng)初始音量約為60分貝時(shí),背景音量舒適范圍略有差異,具體結(jié)果如下:

1)針對(duì)有屏音箱,背景視頻音量下降至36-53分貝范圍,背景音樂(lè)音量下降至39-56分貝范圍時(shí),用戶主觀感覺(jué)較舒適;

關(guān)于有屏設(shè)備的語(yǔ)音交互體驗(yàn)實(shí)驗(yàn)研究

2)針對(duì)智能電視,背景視頻音量下降至39-53分貝范圍,背景音樂(lè)音量下降至36-53分貝范圍時(shí),用戶主觀感覺(jué)較舒適。

關(guān)于有屏設(shè)備的語(yǔ)音交互體驗(yàn)實(shí)驗(yàn)研究

實(shí)驗(yàn)中我們同時(shí)研究了初始音量為65分貝時(shí)背景音量的舒適范圍,因?qū)嶒?yàn)結(jié)果與上述趨勢(shì)基本一致,篇幅所限,暫不一一展開(kāi)。

此外,結(jié)合實(shí)驗(yàn)后的問(wèn)卷調(diào)研結(jié)果發(fā)現(xiàn),關(guān)于背景的播放狀態(tài),背景為音樂(lè)時(shí)用戶更傾向繼續(xù)播放,而背景為視頻時(shí)有屏音箱端傾向視頻暫停的用戶更多。主要是由于有屏音箱端背景視頻被完全覆蓋,因此,用戶認(rèn)為背景視頻暫停較好,以避免錯(cuò)過(guò)感興趣的視頻內(nèi)容。

關(guān)于有屏設(shè)備的語(yǔ)音交互體驗(yàn)實(shí)驗(yàn)研究

關(guān)于有屏設(shè)備的語(yǔ)音交互體驗(yàn)實(shí)驗(yàn)研究

關(guān)于前景內(nèi)容的播放狀態(tài),無(wú)論屏幕尺寸差異和背景媒體類型,多數(shù)用戶希望能夠?qū)η熬靶畔⑦M(jìn)行語(yǔ)音播報(bào),而不僅僅是在屏幕上以文字或圖文的形式展示。

關(guān)于有屏設(shè)備的語(yǔ)音交互體驗(yàn)實(shí)驗(yàn)研究

本文針對(duì)有屏設(shè)備的語(yǔ)音交互體驗(yàn)進(jìn)行研究,重點(diǎn)探索整合視覺(jué)系統(tǒng)后交互反饋和內(nèi)容輸出環(huán)節(jié)的體驗(yàn)問(wèn)題。對(duì)指令上屏的延遲時(shí)間和指令呈現(xiàn)時(shí)間給出了我們的研究結(jié)果和設(shè)計(jì)建議,以及不同內(nèi)容輸出時(shí)前景和背景的合理音量設(shè)置等。

從語(yǔ)音向視覺(jué)的延伸,語(yǔ)音交互的邊界和外延仍將不斷變化。語(yǔ)音交互與傳統(tǒng)的交互方式并不是互斥的、非此即彼的關(guān)系,未來(lái)的人機(jī)交互將融入聽(tīng)覺(jué)、視覺(jué)、觸覺(jué)、味覺(jué)、嗅覺(jué)等多模態(tài)的交互方式。未來(lái)的交互范式必然不是這些交互方式的簡(jiǎn)單堆砌和羅列,而是在考慮特定場(chǎng)景、人的因素、環(huán)境條件等因素后有序的、合理的組合和設(shè)計(jì)。百度人工智能交互設(shè)計(jì)院也將會(huì)持續(xù)的關(guān)注多模態(tài)交互領(lǐng)域的研究和設(shè)計(jì),并不斷輸出我們的研究成果和觀點(diǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279743
  • 智能電視
    +關(guān)注

    關(guān)注

    9

    文章

    1392

    瀏覽量

    96699
  • 語(yǔ)音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28614
  • 智能音箱
    +關(guān)注

    關(guān)注

    31

    文章

    1787

    瀏覽量

    79784

原文標(biāo)題:走向視聽(tīng)融合的語(yǔ)音交互新體驗(yàn)研究

文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    普強(qiáng)智能語(yǔ)音技術(shù)重新定義車載交互邊界

    普強(qiáng)憑借自主研發(fā)的智能語(yǔ)音技術(shù),為某國(guó)內(nèi)頭部車企提供的語(yǔ)音前處理、喚醒詞、ASR、TTS等技術(shù)模塊,構(gòu)建覆蓋泰語(yǔ)、俄語(yǔ)、韓語(yǔ)、日語(yǔ)等多語(yǔ)種的語(yǔ)音交互解決方案,助力其海外車型實(shí)現(xiàn)無(wú)障礙人
    的頭像 發(fā)表于 07-11 14:00 ?340次閱讀

    芯資訊|廣州唯創(chuàng)電子WTK6900P語(yǔ)音識(shí)別芯片:離線語(yǔ)音交互的革新者

    在智能設(shè)備全面普及的浪潮中,語(yǔ)音交互技術(shù)正逐步從“云端依賴”向“本地化高效處理”演進(jìn)。廣州唯創(chuàng)電子推出的WTK6900P語(yǔ)音識(shí)別芯片,憑借其本地化離線
    的頭像 發(fā)表于 05-22 09:22 ?244次閱讀
    芯資訊|廣州唯創(chuàng)電子WTK6900P<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:離線<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的革新者

    OBOO鷗柏丨AI數(shù)字人觸摸查詢觸控人臉識(shí)別語(yǔ)音交互一體機(jī)上市

    OBOO鷗柏丨AI數(shù)字人觸摸查詢觸控人臉識(shí)別語(yǔ)音交互一體機(jī)上市分析OBOO鷗柏品牌推出的AI數(shù)字人觸摸查詢觸控人臉識(shí)別語(yǔ)音
    的頭像 發(fā)表于 05-21 20:22 ?292次閱讀
    OBOO鷗柏丨AI數(shù)字人觸摸<b class='flag-5'>屏</b>查詢觸控人臉識(shí)別<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>一體機(jī)上市

    智能座艙:車載語(yǔ)音交互測(cè)試內(nèi)容

    隨著汽車智能化的飛速發(fā)展,車載語(yǔ)音交互系統(tǒng)已從早期的輔助功能逐漸演變?yōu)橹悄茏摰暮诵?b class='flag-5'>交互方式之一。駕駛者通過(guò)語(yǔ)音指令即可輕松完成導(dǎo)航設(shè)置、音樂(lè)播放、電話撥打,甚至車輛部分功能的控制,這
    的頭像 發(fā)表于 04-24 15:29 ?1054次閱讀
    智能座艙:車載<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>測(cè)試內(nèi)容

    智能語(yǔ)音交互方案在客服領(lǐng)域的應(yīng)用

    在當(dāng)今數(shù)字化浪潮中,客服領(lǐng)域正經(jīng)歷著前所未有的變革,智能語(yǔ)音交互方案憑借其高效、便捷的特性,成為推動(dòng)這一變革的核心力量。其中,語(yǔ)音識(shí)別模型優(yōu)化私部署方案與語(yǔ)音合成聲音定制方案作為兩大核
    的頭像 發(fā)表于 04-11 14:35 ?289次閱讀

    WT3000T8-32N語(yǔ)音合成TTS芯片:小體積、強(qiáng)性能,重塑智能語(yǔ)音交互體驗(yàn)

    領(lǐng)域帶來(lái)顛覆性創(chuàng)新。這款芯片不僅是傳統(tǒng)語(yǔ)音模塊的升級(jí)替代者,更是開(kāi)啟下一代智能設(shè)備語(yǔ)音交互的鑰匙。一、四大核心優(yōu)勢(shì),定義行業(yè)新標(biāo)桿1.軍工級(jí)性能:32位處理器賦能
    的頭像 發(fā)表于 03-21 09:20 ?423次閱讀
    WT3000T8-32N<b class='flag-5'>語(yǔ)音</b>合成TTS芯片:小體積、強(qiáng)性能,重塑智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>體驗(yàn)

    重慶大學(xué):研究用于語(yǔ)音識(shí)別和交互的機(jī)器學(xué)習(xí)輔助可穿戴傳感系統(tǒng)

    背景介紹 人體會(huì)產(chǎn)生豐富的生物信號(hào),這些信號(hào)可以被人體檢測(cè)、數(shù)字化、分析并與外界設(shè)備交互。其中,人類的語(yǔ)音尤其具有豐富的時(shí)域、頻域和幅度信息傳輸能力。這種豐富的信息承載能力使聲音成為
    的頭像 發(fā)表于 03-14 14:59 ?1120次閱讀
    重慶大學(xué):<b class='flag-5'>研究</b>用于<b class='flag-5'>語(yǔ)音</b>識(shí)別和<b class='flag-5'>交互</b>的機(jī)器學(xué)習(xí)輔助可穿戴傳感系統(tǒng)

    WTV380-8S語(yǔ)音芯片:智能清潔設(shè)備的“語(yǔ)音助手”,小體積大能量,重塑人機(jī)交互體驗(yàn)

    隨著智能家居的普及,掃地機(jī)器人、擦窗機(jī)器人、洗地機(jī)等清潔設(shè)備正從“功能型”向“智能交互型”躍遷。用戶不僅需要高效的清潔能力,更期待直觀的語(yǔ)音提示、多傳感器協(xié)同以及穩(wěn)定可靠的性能。WTV380-8S
    的頭像 發(fā)表于 03-14 09:12 ?352次閱讀
    WTV380-8S<b class='flag-5'>語(yǔ)音</b>芯片:智能清潔<b class='flag-5'>設(shè)備</b>的“<b class='flag-5'>語(yǔ)音</b>助手”,小體積大能量,重塑人機(jī)<b class='flag-5'>交互</b>體驗(yàn)

    基于WTVxxx語(yǔ)音芯片的智能清潔機(jī)器人語(yǔ)音交互系統(tǒng)設(shè)計(jì)方案介紹

    ?一、產(chǎn)品概述與設(shè)計(jì)需求隨著智能家居設(shè)備的普及,擦窗機(jī)器人和掃地機(jī)器人逐漸成為家庭清潔的重要工具。為提升用戶體驗(yàn),語(yǔ)音交互功能成為產(chǎn)品差異化的關(guān)鍵需求。廣州唯創(chuàng)電子WTVxxx系列語(yǔ)音
    的頭像 發(fā)表于 03-06 08:27 ?354次閱讀
    基于WTVxxx<b class='flag-5'>語(yǔ)音</b>芯片的智能清潔機(jī)器人<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)設(shè)計(jì)方案介紹

    【智能語(yǔ)音交互新標(biāo)桿】WTK6900HC語(yǔ)音識(shí)別芯片:重新定義離線語(yǔ)音控制體驗(yàn)

    在萬(wàn)物智聯(lián)時(shí)代,離線語(yǔ)音控制技術(shù)正以革命性姿態(tài)重塑智能設(shè)備交互方式。WTK6900HC語(yǔ)音識(shí)別芯片憑借其突破性的技術(shù)創(chuàng)新,為智能清潔設(shè)備領(lǐng)域
    的頭像 發(fā)表于 03-05 09:26 ?405次閱讀
    【智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新標(biāo)桿】WTK6900HC<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:重新定義離線<b class='flag-5'>語(yǔ)音</b>控制體驗(yàn)

    RK3568國(guó)產(chǎn)處理器實(shí)驗(yàn)平臺(tái):語(yǔ)音識(shí)別控制實(shí)驗(yàn)

    )GUI的設(shè)計(jì)實(shí)現(xiàn):LCD顯示界面以及與用戶的交互;(3)編輯控制代碼;(4)編譯程序;(5)運(yùn)行程序。CI122模組根據(jù)原理圖,可知本實(shí)驗(yàn)中使用的語(yǔ)音控制模塊是
    的頭像 發(fā)表于 01-02 19:04 ?1061次閱讀
    RK3568國(guó)產(chǎn)處理器<b class='flag-5'>實(shí)驗(yàn)</b>平臺(tái):<b class='flag-5'>語(yǔ)音</b>識(shí)別控制<b class='flag-5'>實(shí)驗(yàn)</b>

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別的智能杯墊

    語(yǔ)音命令Q 識(shí)別,適用于智能家居控制、玩具、人機(jī)交互等多個(gè)領(lǐng)域。該模塊以其高識(shí)別率、低功耗和易于集成的特點(diǎn)受到廣大開(kāi)發(fā)者的青睞。 主要技術(shù)及功能有: 磁力攪拌、重量采集、語(yǔ)音識(shí)別、IPS顯示
    發(fā)表于 01-02 18:15

    基于智能語(yǔ)音交互的智能呼叫中心工作機(jī)制

    作為實(shí)現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語(yǔ)音交互技術(shù),它通過(guò)集成自然語(yǔ)言處理(NLP)、語(yǔ)音識(shí)別(ASR)和語(yǔ)音合成(TTS)等先進(jìn)技術(shù),實(shí)現(xiàn)了與客戶的智能
    的頭像 發(fā)表于 12-03 16:44 ?711次閱讀
    基于智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的智能呼叫中心工作機(jī)制

    智能語(yǔ)音的驅(qū)動(dòng)力:揭秘8腳語(yǔ)音芯片在智能設(shè)備中的非凡角色

    語(yǔ)音技術(shù)滲透生活,8腳語(yǔ)音芯片以微縮體積、低功耗、卓越性能成智能設(shè)備語(yǔ)音功能核心,集成識(shí)別、合成、壓縮解碼等功能,實(shí)現(xiàn)精準(zhǔn)語(yǔ)音
    的頭像 發(fā)表于 12-02 14:23 ?528次閱讀

    人工智能教學(xué)實(shí)驗(yàn)箱_國(guó)產(chǎn)處理器:5-29 語(yǔ)音識(shí)別控制實(shí)驗(yàn)

    的設(shè)計(jì)實(shí)現(xiàn):LCD顯示界面以及與用戶的交互; (3)編輯控制代碼; (4)編譯程序; (5)運(yùn)行程序。 根據(jù)原理圖,可知本實(shí)驗(yàn)中使用的語(yǔ)音控制模塊是基于啟英泰倫CI122模組的, CI112X
    發(fā)表于 10-15 17:09