99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓萬物聽說:亞馬遜Alexa語音交互系統(tǒng)背后的聲音

姚小熊27 ? 來源:與非網(wǎng) ? 作者:夏珍 ? 2020-06-17 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“宿命”之說

“目前音頻壓縮算法的碼率日趨降低,研究空間相對(duì)較窄,主要是在某種算法的基礎(chǔ)上對(duì)特定應(yīng)用的改進(jìn)和定制。音頻信號(hào)的研究還可以在下列更廣闊的方向開展下去:基于信號(hào)模型的音頻內(nèi)容描述、特征提取、分類與檢索。這些研究可以作為多媒體數(shù)據(jù)庫研究的一個(gè)子課題,實(shí)現(xiàn)音頻數(shù)據(jù)庫的組織和管理,基于內(nèi)容的音頻點(diǎn)播等。在人機(jī)交互方面,音頻內(nèi)容的描述可以用于音頻一視頻信號(hào)處理(Audio 一 Visual Signal Processing),實(shí)現(xiàn)音視頻信號(hào)交互、信號(hào)對(duì)應(yīng)、信號(hào)關(guān)連等應(yīng)用。”

這段文字來源于 2003 年一篇題為《基于正弦+噪聲模型的寬帶音頻信號(hào)的表示與壓縮》的文章,是今天筆者要介紹的主人公——宋少鵬的碩士畢業(yè)論文節(jié)選。細(xì)讀這段文字,一個(gè)即將畢業(yè)的學(xué)生對(duì)音頻信號(hào)未來的發(fā)展是有積極想法的,我們似乎就可以清晰地看到這個(gè)年輕人將走上的職業(yè)生涯道路。

時(shí)間是最好的證明,這個(gè)從華南理工大學(xué)無線電系畢業(yè)的小伙子近 20 年來真的就只做了一件事,這件事就是音頻信號(hào)處理。常有人問他為什么喜歡這個(gè)領(lǐng)域、認(rèn)定這個(gè)方向的時(shí)候,他都會(huì)笑著答道,“兒時(shí)的興趣,我一直對(duì)聲波、電波充滿興趣,小時(shí)候聽黑膠唱片,聽磁帶,就一直想鉆進(jìn)去看看是誰在里面唱歌。此外,我的中文名字宋少鵬的拼音首字母縮寫是 SSP,而音頻信號(hào)處理(Sound Signal Processing)的英文首字母縮寫也是 SSP,因此這是一種宿命,很早就注定了的?!?/p>

我的職業(yè)生涯一路向前,沒有轉(zhuǎn)折

上面講到 2003 年宋少鵬碩士畢業(yè),這一年他放棄了大公司的 offer,選擇進(jìn)入一家以色列芯片公司 Zoran 做軟件開發(fā),鉆研音頻 DSP 技術(shù)。值得一提的是,全球第一個(gè)全套杜比單芯片解決方案就來自這家公司。

2010 年,他又去了微軟亞洲硬件中心,從事硬件產(chǎn)品的研發(fā)制造,經(jīng)手產(chǎn)品包括智能攝像頭、Kinnet 體感設(shè)備等。

就在 2012 年左右,他發(fā)現(xiàn)智能手機(jī)、電視、汽車都在向聯(lián)網(wǎng)化發(fā)展,由于給用戶帶來了豐富的內(nèi)容、社交和娛樂體驗(yàn),這些產(chǎn)業(yè)得到蓬勃發(fā)展。與此同時(shí),音頻設(shè)備卻還沒有聯(lián)網(wǎng),這在一個(gè)專業(yè)音頻從業(yè)者眼中,便是機(jī)遇。而眼前急切要弄清楚的是:如何聯(lián)網(wǎng)?如何承載娛樂和社交?

帶著這些思考,還在微軟供職的宋少鵬便尋找機(jī)會(huì)開始嘗試,這次嘗試不算成功,在他看來,原因有兩點(diǎn),一是當(dāng)時(shí)行業(yè)環(huán)境還不太成熟,二是大公司的體制存在一定的限制。

宋少鵬在后來接受利器的采訪時(shí)被問到職業(yè)生涯的轉(zhuǎn)折點(diǎn),他直言不諱地說:“我的職業(yè)生涯一路向前,沒有轉(zhuǎn)折。”因此,回溯到上述那次不太成功的嘗試,摸清原因,認(rèn)準(zhǔn)方向也是他職業(yè)道路上的收貨,當(dāng)然不止于此,他還結(jié)識(shí)了一幫志同道合的朋友。于是在 2013 年的某一天,他帶著這個(gè)團(tuán)隊(duì)毅然決然的開始了他們的創(chuàng)業(yè)闖蕩。

2014 年,米唐在深圳這個(gè)遠(yuǎn)離中國(guó)的政治和經(jīng)濟(jì)中心的灣區(qū)成立了,他喜歡那里自發(fā)式、民營(yíng)式、創(chuàng)新型的經(jīng)濟(jì)模式,大家都來自江西、湖南、江蘇、四川、中國(guó)各地,移民所帶來的一些共同的特質(zhì),比如說勇敢、不屈服、創(chuàng)新,這些都與他的團(tuán)隊(duì)惺惺相惜。

從產(chǎn)品到解決方案,都在用心做“耳朵”

公司成立初期,產(chǎn)業(yè)的不成熟,加上創(chuàng)業(yè)公司交付能力的有限,使得米唐沒辦法短時(shí)間內(nèi)在語音交互領(lǐng)域拿出產(chǎn)品化的東西,基于訊飛 SDK 和谷歌 SDK 的嘗試又均不能滿足這個(gè)團(tuán)隊(duì)對(duì)產(chǎn)品體驗(yàn)的要求,而一家公司要生存下去就必須要有良好的資金回流,于是他們的第一款產(chǎn)品“方糖音箱”放棄了語音的交互,只保留了兩項(xiàng)特殊的“體感”操作方式:輕拍音箱頂部開始播放音樂或暫停,向左或向右傾斜切換上下曲目。

這款音箱通過 WiFi 連接上網(wǎng),可脫離手機(jī)獨(dú)立工作,并內(nèi)置了不少音樂電臺(tái),比如豆瓣電臺(tái)、荔枝 FM、還有一些國(guó)際電臺(tái),同時(shí)它還能記錄個(gè)人喜好,進(jìn)行智能推薦。若是用戶在互動(dòng)中能會(huì)心一笑,那在宋少鵬的眼中,除了趣味更是一種關(guān)懷帶來的暖意。

“產(chǎn)品就像藝術(shù)品,源于生活,高于生活,要從生活中抽象提煉需求,發(fā)掘人性。”這與宋少鵬以人性、人文觀點(diǎn)來思考產(chǎn)品設(shè)計(jì)的觀點(diǎn)高度契合。但生活要繼續(xù),公司更需發(fā)展,經(jīng)濟(jì)基礎(chǔ)決定上層建筑,即使方糖在 2015 年就開始銷往海外,并推出了同樣設(shè)計(jì)的藍(lán)牙音箱,以謀取更多的利潤(rùn),一年數(shù)萬臺(tái)的銷量還是顯得捉襟見肘。

作為一家始終觀察著這個(gè)領(lǐng)域的創(chuàng)業(yè)企業(yè),2015 年底,他們看到了亞馬遜的 Echo 和背后的 Alexa 語音交互系統(tǒng)。最初亞馬遜 Echo 以 MVP(最小可用原型)的形態(tài)交付用戶,語音識(shí)別和語義理解都僅能滿足流媒體播放的簡(jiǎn)單需求,但是經(jīng)過一兩年的打磨,到了 2016 年,Echo 的體驗(yàn)就好了很多,它既可以提供音頻內(nèi)容,也可以提供生活服務(wù),包括音樂、電臺(tái)、有聲書、新聞、天氣、鬧鐘、日程等。這時(shí)候亞馬遜也將 Alexa 語音交互平臺(tái)開放出來,于是米唐團(tuán)隊(duì)在第一時(shí)間找到了亞馬遜。大概花了三四個(gè)月的時(shí)間,在眾多想接入 Alexa 的競(jìng)爭(zhēng)者中,方糖成為首個(gè)通過亞馬遜認(rèn)證的第三方音箱產(chǎn)品。

“通過亞馬遜的認(rèn)證后,Alexa 團(tuán)隊(duì)的人就主動(dòng)找到了我,問我一年能夠賣多少,我說幾萬臺(tái),亞馬遜就說做他們的技術(shù)方案商,可以幫米唐一年賣幾百萬個(gè)解決方案”,宋少鵬回憶稱這是亞馬遜幫團(tuán)隊(duì)找到了方向。于是,一個(gè)擅長(zhǎng)做技術(shù)的團(tuán)隊(duì),開始從做 C 端產(chǎn)品轉(zhuǎn)向做 B 端的方案,并決意將自己定位為聚焦海外市場(chǎng)的語音交互解決方案提供商。

“讓萬物聽說”是使命所在

目前,米唐的業(yè)務(wù)已擴(kuò)展到家用電器、汽車和消費(fèi)電子產(chǎn)品等多個(gè)領(lǐng)域,而其核心競(jìng)爭(zhēng)力是他們的遠(yuǎn)場(chǎng)語音交互算法,在響應(yīng)速度、識(shí)別率、去噪、聲源定位和產(chǎn)品良率方面均做得還不錯(cuò)。

“作為創(chuàng)業(yè)狗,在哪都能工作。出差路上的飛行和堵車時(shí)的 YY 是獲得靈感的方式,出差的時(shí)候會(huì)帶一本書,和一個(gè)趁早筆記本。”宋少鵬如是說,“當(dāng)你做一個(gè)事情,真正站在場(chǎng)景和用戶的角度去思考,才有可能在價(jià)值上有所突破,而當(dāng)你受制于既得利益時(shí),其實(shí)會(huì)做很多束縛手腳的事情?!?/p>

未來的米唐會(huì)發(fā)展成怎樣,沒人可以預(yù)判,但“讓萬物聽說”會(huì)成為它和它背后的這個(gè)團(tuán)隊(duì)不變的使命。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    2984

    瀏覽量

    119630
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28624
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2696

    瀏覽量

    84692
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    聯(lián)網(wǎng)設(shè)備也能‘開口說話’?Aircall實(shí)時(shí)通話功能讓智能交互觸手可及

    成為能‘聽懂’需求、‘說出’答案的智能伙伴?!?在萬物互聯(lián)的時(shí)代,語音通話是最自然的交互方式。 ? Air8000工業(yè)引擎Aircall功能:將復(fù)雜的通話流程簡(jiǎn)化為三次點(diǎn)擊,為聯(lián)網(wǎng)設(shè)
    的頭像 發(fā)表于 07-07 09:26 ?158次閱讀
    <b class='flag-5'>物</b>聯(lián)網(wǎng)設(shè)備也能‘開口說話’?Aircall實(shí)時(shí)通話功能讓智能<b class='flag-5'>交互</b>觸手可及

    從‘指令接收器’到‘語音伙伴’:Aircall聯(lián)網(wǎng)設(shè)備實(shí)時(shí)通話能力落地!

    萬物互聯(lián)的時(shí)代,語音通話是最自然的交互方式。 Air8000工業(yè)引擎Aircall功能: 將復(fù)雜的通話流程簡(jiǎn)化為三次點(diǎn)擊,為聯(lián)網(wǎng)設(shè)備賦予實(shí)時(shí)通話能力。其簡(jiǎn)潔的API設(shè)計(jì)大幅降低開發(fā)門
    的頭像 發(fā)表于 07-06 16:12 ?77次閱讀
    從‘指令接收器’到‘<b class='flag-5'>語音</b>伙伴’:Aircall<b class='flag-5'>讓</b><b class='flag-5'>物</b>聯(lián)網(wǎng)設(shè)備實(shí)時(shí)通話能力落地!

    華為攜手產(chǎn)業(yè)伙伴共贏萬物智聯(lián)新時(shí)代未來

    ,IoT與AI融合共生智能無處不在、無所不達(dá)。他進(jìn)一步在發(fā)言中表示“實(shí)現(xiàn)萬物智聯(lián)需要具備三大關(guān)鍵要素:全場(chǎng)景物聯(lián),所有對(duì)象可連接;全超寬網(wǎng)絡(luò),所有數(shù)據(jù)聯(lián)云聯(lián)算;全智能加持,
    的頭像 發(fā)表于 06-23 16:53 ?464次閱讀

    芯資訊|廣州唯創(chuàng)電子WTV系列語音芯片:以技術(shù)創(chuàng)新賦能智能語音交互

    萬物互聯(lián)的智能化時(shí)代,語音交互技術(shù)已成為人機(jī)交互的重要橋梁。廣州唯創(chuàng)電子深耕語音芯片領(lǐng)域多年,憑借自主研發(fā)的WTV系列
    的頭像 發(fā)表于 05-21 08:45 ?213次閱讀
    芯資訊|廣州唯創(chuàng)電子WTV系列<b class='flag-5'>語音</b>芯片:以技術(shù)創(chuàng)新賦能智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>

    從智能穿戴到智能家居:晶振如何賦能萬物互聯(lián)

    當(dāng)你輕觸智能手表查看心率,或是通過語音指令智能家居開啟燈光,背后都有一個(gè)微小卻至關(guān)重要的元件在默默發(fā)力——晶振。在萬物互聯(lián)的時(shí)代浪潮下,從貼身的智能穿戴設(shè)備到全屋智能生態(tài)
    的頭像 發(fā)表于 04-22 11:08 ?225次閱讀
    從智能穿戴到智能家居:晶振如何賦能<b class='flag-5'>萬物</b>互聯(lián)

    麻了!6440萬物聯(lián)網(wǎng)智慧路燈,我會(huì)……

    麻了!6440萬物聯(lián)網(wǎng)智慧路燈,我會(huì)……
    的頭像 發(fā)表于 04-10 08:43 ?290次閱讀
    麻了!6440<b class='flag-5'>萬物</b>聯(lián)網(wǎng)智慧路燈,我會(huì)……

    WT3000T8-32N語音合成TTS芯片:小體積、強(qiáng)性能,重塑智能語音交互體驗(yàn)

    萬物互聯(lián)的智能化浪潮中,語音交互已成為人機(jī)交互的核心入口。廣州唯創(chuàng)電子推出的WT3000T8-32N語音合成芯片,憑借其4×4mm超小封裝
    的頭像 發(fā)表于 03-21 09:20 ?434次閱讀
    WT3000T8-32N<b class='flag-5'>語音</b>合成TTS芯片:小體積、強(qiáng)性能,重塑智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>體驗(yàn)

    重慶大學(xué):研究用于語音識(shí)別和交互的機(jī)器學(xué)習(xí)輔助可穿戴傳感系統(tǒng)

    生物通信、人機(jī)交互(HMI)和聯(lián)網(wǎng)(IoT)應(yīng)用(包括智能家居、遠(yuǎn)程控制、身份識(shí)別和語音系統(tǒng))的重要組成部分。然而,基于空氣振動(dòng)的語音通信
    的頭像 發(fā)表于 03-14 14:59 ?1125次閱讀
    重慶大學(xué):研究用于<b class='flag-5'>語音</b>識(shí)別和<b class='flag-5'>交互</b>的機(jī)器學(xué)習(xí)輔助可穿戴傳感<b class='flag-5'>系統(tǒng)</b>

    DeepSeek加持,宇視科技升級(jí)發(fā)布“萬物X”全鏈路智能引擎

    近日,宇視繼去年在全行業(yè)率先推出“萬物搜”后,基于AIoT行業(yè)大模型-“梧桐”多模態(tài)大模型技術(shù)底座,再度重磅升級(jí)發(fā)布「萬物X」,大模型能力價(jià)值落地廣泛真實(shí)場(chǎng)景。 「萬物X」以梧桐大模
    的頭像 發(fā)表于 03-13 15:36 ?512次閱讀

    【智能語音交互新標(biāo)桿】WTK6900HC語音識(shí)別芯片:重新定義離線語音控制體驗(yàn)

    萬物智聯(lián)時(shí)代,離線語音控制技術(shù)正以革命性姿態(tài)重塑智能設(shè)備交互方式。WTK6900HC語音識(shí)別芯片憑借其突破性的技術(shù)創(chuàng)新,為智能清潔設(shè)備領(lǐng)域帶來三大核心價(jià)值升級(jí),助力產(chǎn)品實(shí)現(xiàn)"聽得清、
    的頭像 發(fā)表于 03-05 09:26 ?409次閱讀
    【智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新標(biāo)桿】WTK6900HC<b class='flag-5'>語音</b>識(shí)別芯片:重新定義離線<b class='flag-5'>語音</b>控制體驗(yàn)

    亞馬遜升級(jí)版Alexa推遲發(fā)布

    。 此次延遲發(fā)布的原因之一,在于升級(jí)后的Alexa在測(cè)試階段暴露出了一些問題。據(jù)一位匿名的亞馬遜員工透露,盡管升級(jí)版Alexa在智能交互語音
    的頭像 發(fā)表于 02-17 14:02 ?704次閱讀

    萬物相連通訊:共繪萬物互聯(lián)藍(lán)圖

    樹立行業(yè)標(biāo)桿,講好中國(guó)故事,傳遞中國(guó)聲音,充分展現(xiàn)騰飛的中國(guó)經(jīng)濟(jì)、崛起的民族品牌和向上的企業(yè)家精神。近日,“崛起的民族品牌”專題系列節(jié)目對(duì)話深圳市萬物相連通訊有限公司(簡(jiǎn)稱:萬物相連通訊)的董事長(zhǎng)
    的頭像 發(fā)表于 01-15 11:00 ?640次閱讀
    <b class='flag-5'>萬物</b>相連通訊:共繪<b class='flag-5'>萬物</b>互聯(lián)藍(lán)圖

    解鎖個(gè)性化語音交互新時(shí)代:九芯智能語音云平臺(tái),創(chuàng)意聲音觸手可及!

    九芯智能語音云平臺(tái)提供全面高效安全的智能語音服務(wù),支持自定義語音內(nèi)容,簡(jiǎn)化燒錄流程,依托AI技術(shù),助力各行業(yè)智能化升級(jí),引領(lǐng)語音交互革命。
    的頭像 發(fā)表于 01-02 16:51 ?903次閱讀
    解鎖個(gè)性化<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新時(shí)代:九芯智能<b class='flag-5'>語音</b>云平臺(tái),<b class='flag-5'>讓</b>創(chuàng)意<b class='flag-5'>聲音</b>觸手可及!

    亞馬遜基于人工智能的Alexa發(fā)布計(jì)劃延期至明年

    11月1日外媒報(bào)道稱,亞馬遜已將基于人工智能技術(shù)全新打造的正版Alexa發(fā)布計(jì)劃延期至明年。   亞馬遜最初于去年9月公開了新版Alexa的規(guī)劃,意在通過集成AI大模型,顯著增強(qiáng)
    的頭像 發(fā)表于 11-01 15:19 ?1019次閱讀

    聯(lián)網(wǎng)系統(tǒng)中音頻方案的“大腦”_語音芯片

    01 聯(lián)網(wǎng)系統(tǒng)中為什么要使用語音芯片 聯(lián)網(wǎng)系統(tǒng)中使用語音芯片的原因可以歸結(jié)為以下幾個(gè)方面:
    的頭像 發(fā)表于 09-26 14:26 ?961次閱讀
    <b class='flag-5'>物</b>聯(lián)網(wǎng)<b class='flag-5'>系統(tǒng)</b>中音頻方案的“大腦”_<b class='flag-5'>語音</b>芯片