99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于云知聲開源全棧語音交互方案概念詳解

云知聲 ? 來源:djl ? 作者:云知聲 ? 2019-08-08 16:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

其實(shí)現(xiàn)在外面好多合作伙伴都說我們特別‘獨(dú)’,不過等你們的東西做出來,大家就不會(huì)這么說啦。”云知聲聯(lián)合創(chuàng)始人、芯片負(fù)責(zé)人李霄寒經(jīng)常用這句話作為開頭來鼓勵(lì)自己的芯片團(tuán)隊(duì)盡快完成 Turnkey 整體音箱方案。因?yàn)樵?5 月份云知聲首款面向物聯(lián)網(wǎng)AI 芯片—— UniOne 的發(fā)布會(huì)上,在 UniOne 上實(shí)現(xiàn) Turnkey 音箱方案并將其整體開源,已經(jīng)作為一個(gè)重大舉措發(fā)布了。

談起之前和合作伙伴的合作,李霄寒還是比較感慨的,云知聲之所以能成為國內(nèi)唯一實(shí)現(xiàn) IVM (智能硬件模組)在白電領(lǐng)域大規(guī)模出貨的 AI 公司,其中最關(guān)鍵的一條就是云知聲提供了軟硬件云+端一體化解決方案,為客戶提供了一站式解決方案。但是這種模式,讓很多希望和云知聲展開合作的技術(shù)方案公司感覺云知聲不太愿意和大家一起玩,所以有人半開玩笑半認(rèn)真地說云知聲比較“獨(dú)”。

但是另一方面,李霄寒認(rèn)為前兩年的“獨(dú)”,恰恰是對合作伙伴的負(fù)責(zé)。因?yàn)槊嫦?a target="_blank">智能家居實(shí)現(xiàn) AI 落地,牽涉到非常多的環(huán)節(jié),比如需要積累可以量產(chǎn)化的結(jié)構(gòu)經(jīng)驗(yàn);比如需要通過引擎、硬件平臺(tái)選型以及系統(tǒng)優(yōu)化,滿足家電廠商整體的功耗要求;再比如適配云知聲引擎,并在價(jià)格和性能方面達(dá)到最佳配置的通用芯片選型。這些都需要經(jīng)過團(tuán)隊(duì)之間日常的緊密的合作,有時(shí)候甚至需要針對某些硬件特點(diǎn)做相應(yīng)的引擎代碼級別修改,才能真正實(shí)現(xiàn)最佳效果。

“如果僅僅提供一個(gè)引擎給自己的合作伙伴,再提供一些 SDK 層面的適配和支持,其實(shí)對自己的合作伙伴,包括對自己的團(tuán)隊(duì),都是不負(fù)責(zé)任的。因?yàn)榇蠹屹Y源都是有限而寶貴的,引擎原廠沒有足夠的硬件、系統(tǒng)和產(chǎn)品經(jīng)驗(yàn),是無法高效支撐合作伙伴,最終大家做了很多合作,可能只是一場熱鬧,而無法做到量產(chǎn)出貨?!边@是李霄寒的結(jié)論。

正是在這種思想的指導(dǎo)下,云知聲一面提供著 IVM 的整體解決方案,一面把自己在 IVM 實(shí)際落地場景下積累的經(jīng)驗(yàn)和參數(shù),落實(shí)到自有 AI 芯片 UniOne 的設(shè)計(jì)中,期望通過芯片最大可能地把家居場景下的關(guān)鍵部分進(jìn)行固化,再將該芯片之上的全棧語音交互進(jìn)行開源,大大降低技術(shù)門檻、縮短上市時(shí)間,從而確保合作伙伴與云知聲的合作都有收獲。

“不過這么做壓力很大”,作為資深金庸迷,李霄寒有時(shí)候在內(nèi)部開玩笑,說基于 UniOne 整體開源交互方案出來之前,自己經(jīng)常想起《倚天屠龍記》里面趙敏說的那兩句話“周公恐懼流言日,王莽禮謙下士時(shí)”,不過這也更加促進(jìn)了自己領(lǐng)導(dǎo)的芯片團(tuán)隊(duì)加班加點(diǎn)。

碎片化IoT市場 VS基于UniOne的統(tǒng)一戰(zhàn)線

兵無常勢,水無常形, UniOne 出來后,云知聲也進(jìn)入到自己的“芯時(shí)代”,遠(yuǎn)講降噪的 2Mic、4Mic 算法的各個(gè)參數(shù),離線喚醒達(dá)到最佳喚醒率/誤喚醒率的閾值,離線識(shí)別命令的模型大小和反應(yīng)速度,都已經(jīng)調(diào)到了最佳狀態(tài)并且固化在 UniOne 中。在這種情況下,和合作伙伴一起做,就在一個(gè)非常穩(wěn)固并且高起點(diǎn)地基礎(chǔ)上了。面向很多潛在地客戶,云知聲均有一套經(jīng)過驗(yàn)證過的參數(shù),可以保證最終產(chǎn)品的性能,如果后續(xù)云知聲算法有升級,也可以通過刷新 UniOne 中的固件來確保效果。

與此同時(shí), UniOne 上目前實(shí)現(xiàn)的音箱整體交互方案也將開源。大家可以先感受一下當(dāng)前的效果。

“ Turnkey 方案的開源,必將大大促進(jìn)整體智能硬件產(chǎn)品的開發(fā)”,談及這點(diǎn),李霄寒信心滿滿。原因主要來源于以下三個(gè)方面:

一、 智能硬件的產(chǎn)品經(jīng)理非常稀缺,尤其是懂語音交互設(shè)計(jì)的產(chǎn)品經(jīng)理。語音交互(VUI)與之前屏幕為主要展示的圖形界面交互(GUI)差別非常大,前者是扁平結(jié)構(gòu),一句話直達(dá)系統(tǒng)任何一個(gè)圖形界面,可以做任何一個(gè)操作。而后者是樹形結(jié)構(gòu),需要一步步點(diǎn)擊。這兩種交互各有優(yōu)勢,而VUI 目前市面上人才不多,又由于其扁平結(jié)構(gòu)的特性,在設(shè)計(jì)的時(shí)候,需要從系統(tǒng)整體層面來考慮,而不是簡簡單單一個(gè) App 層面。如此總總,都大大增加了 VUI 設(shè)計(jì)難度。

“產(chǎn)品交互設(shè)計(jì)如果都不好,最終開發(fā)的產(chǎn)品效果就可想而知了?!倍鳛樵浦晞?chuàng)始團(tuán)隊(duì)的李霄寒,在十多年前就在 Motorola 中國研究中心從事人機(jī)交互相關(guān)的研究工作,從 Motorola 手機(jī)上的語音交互到云知聲車載到格力空調(diào)、斐訊音箱,李霄寒帶領(lǐng)云知聲團(tuán)隊(duì)積累了豐富的 VUI 設(shè)計(jì)和開發(fā)經(jīng)驗(yàn),而這些經(jīng)驗(yàn)?zāi)Y(jié)而成的整體語音交互方案,將隨著 UniOne 一起作為 Turnkey 方案整體開源,這一切將大大降低行業(yè)門檻。

二、 語音交互方案開源將大大縮短開發(fā)周期。作為一個(gè)系統(tǒng)級的功能,語音交互方案將處理音頻驅(qū)動(dòng),處理與系統(tǒng)其他應(yīng)用的交互,處理各個(gè)案件和喚醒事件,而且必須足夠健壯穩(wěn)定,這些都隨著云知聲開源方案得到解決。合作伙伴可以只做淺層次的定制化改造,比如喚醒詞修改;也可以做深層次開發(fā),比如基于云知聲架構(gòu)框架增加自己的對話 Session ;也可以在看懂整體方案情況下,完全重寫。

三、 云知聲經(jīng)過考驗(yàn)的實(shí)施團(tuán)隊(duì),提及云知聲的競爭優(yōu)勢,很多客戶都對云知聲的服務(wù)表示認(rèn)可,這與云知聲有一支經(jīng)驗(yàn)豐富并且善于和客戶配合的實(shí)施團(tuán)隊(duì)密不可分。而在“芯時(shí)代”,這支團(tuán)隊(duì)將為愿意采用云知聲 UniOne 的合作伙伴提供整體開源方案的技術(shù)支持,包括代碼培訓(xùn)、工具開發(fā)等,盡一切可能降低合作伙伴熟悉整體開源方案的學(xué)習(xí)曲線陡峭度。

正如在 UniOne 芯片發(fā)布會(huì)上李霄寒所強(qiáng)調(diào)的,IoT 是一個(gè)碎片化的市場,面對這個(gè)碎片化的市場,如何以一個(gè)高效的方式應(yīng)對,是云知聲,也是云知聲的合作伙伴需要認(rèn)真面對并深度思考的?,F(xiàn)在云知聲給出了自己的回答,通過凝結(jié)自己場景落地經(jīng)驗(yàn)的 UniOne 芯片,將其上的全棧語音交互方案進(jìn)行開源,結(jié)成統(tǒng)一戰(zhàn)線。各個(gè)合作伙伴可以在開源方案上將精力更多地放在自己熟悉的細(xì)分市場定制化方向,更快更好更多的出貨。而云知聲聚焦在自己性能改進(jìn)和芯片迭代,更高性能更低成本。

“9月份,大家一起來”,李霄寒非常高興自己終于可以在9月份的 UniOne Turnkey 方案開源研討會(huì)上甩掉戴在自己和云知聲頭上兩年多的“獨(dú)”的帽子了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52505

    瀏覽量

    440811
  • 語音交互
    +關(guān)注

    關(guān)注

    3

    文章

    307

    瀏覽量

    28615
  • 云知聲
    +關(guān)注

    關(guān)注

    0

    文章

    230

    瀏覽量

    8774
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    在港交所成功上市

    近日,智能科技股份有限公司(以下簡稱“”)于香港聯(lián)合交易所主板掛牌上市,股份代號(hào):0
    的頭像 發(fā)表于 07-03 17:41 ?498次閱讀

    AGI龍頭企業(yè)港股上市,市值達(dá)147億港元

    為147.44億港元。 ? 圖:創(chuàng)始人董事長CEO黃偉博士在現(xiàn)場致辭表示:從今天起,我們將以香港為支點(diǎn),將中國AGI產(chǎn)品帶向全世界——用更敏捷的創(chuàng)新、更好的商業(yè)化和更開放的心胸,讓人類智慧與機(jī)器智能共振全球! ?
    的頭像 發(fā)表于 06-30 11:44 ?1572次閱讀
    AGI龍頭企業(yè)<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>港股上市,市值達(dá)147億港元

    與商湯科技達(dá)成戰(zhàn)略合作

    近日,智能科技股份有限公司(以下簡稱“”)與上海商湯智能科技有限公司(以下簡稱“商湯
    的頭像 發(fā)表于 06-20 14:52 ?457次閱讀

    攜手南寧軌道打造智慧生活新范本

    報(bào)事報(bào)修系統(tǒng)基于獸牙智能體平臺(tái),定制開發(fā)了專屬智能體。系統(tǒng)全面覆蓋公共報(bào)修、家政服務(wù)、知識(shí)問答、投訴建議四大應(yīng)用場景,真正實(shí)現(xiàn)了“語音下單—自動(dòng)派單—實(shí)時(shí)反饋”的
    的頭像 發(fā)表于 06-09 14:48 ?472次閱讀

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 開源六軸機(jī)械臂產(chǎn)品

    識(shí)別聯(lián)調(diào)。 進(jìn)迭時(shí)空致力于為智能機(jī)器人提供完整優(yōu)化的RISC-V AI軟硬件解決方案,第一代RISC-V AI CPU芯片K1已完成AI視覺感知、AI語音處理、自動(dòng)避障、路徑規(guī)劃
    發(fā)表于 04-25 17:59

    獸牙AI Agent功能上新

    在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,傳統(tǒng)AI被動(dòng)執(zhí)行指令的模式已難以滿足高效協(xié)作的需求。當(dāng)AI開始像人類一樣思考、規(guī)劃并主動(dòng)解決問題,一場關(guān)于智能體的革新正悄然發(fā)生。近日,獸牙AI企業(yè)級智
    的頭像 發(fā)表于 04-03 17:51 ?1142次閱讀

    入選工信部2024年未來產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例

    近日,工業(yè)和信息化部高新技術(shù)司發(fā)布《2024年未來產(chǎn)業(yè)創(chuàng)新發(fā)展優(yōu)秀典型案例公示》,"基于大模型和語音交互技術(shù)的醫(yī)療文書自動(dòng)生成系統(tǒng)"成
    的頭像 發(fā)表于 03-31 16:48 ?525次閱讀

    開源——ESP32語音交互系統(tǒng)(AI小智)開發(fā)教程

    人機(jī)交互功能 二、擴(kuò)展板設(shè)計(jì)1. 硬件清單主控單元:零ESP32(雙核處理器,支持Wi-Fi/BLE,豐富外設(shè)接口) 語音輸入:INMP441數(shù)字麥克風(fēng)(I2S接口,高信噪比) 音頻輸出
    發(fā)表于 03-29 16:30

    Atlas超算平臺(tái)的核心亮點(diǎn)

    在大數(shù)據(jù)與人工智能領(lǐng)域日新月異的今天,高效、可靠的分布式文件系統(tǒng)及其計(jì)算加速方案已成為眾多企業(yè)和科研機(jī)構(gòu)關(guān)注的焦點(diǎn)。的Atlas超算平臺(tái)以其“基于Fluid + Alluxio的
    的頭像 發(fā)表于 01-07 16:08 ?593次閱讀

    與TCL引領(lǐng)新風(fēng)空調(diào)語音交互新時(shí)代

    近日,收到一份特別的新年禮物——一封來自TCL的感謝信,再次溫暖了團(tuán)隊(duì)的心。信中特別
    的頭像 發(fā)表于 01-02 10:14 ?596次閱讀

    近期斬獲多項(xiàng)年度大獎(jiǎng)

    在科技迅猛發(fā)展的當(dāng)下,人工智能(AI)已成為推動(dòng)各行業(yè)革新的核心動(dòng)力。,以其卓越的技術(shù)實(shí)力和敏銳的市場洞察,在AI領(lǐng)域中脫穎而出,成為行業(yè)的領(lǐng)航者。近日,
    的頭像 發(fā)表于 12-24 10:26 ?546次閱讀

    曙光開啟智能時(shí)代

    近日,“可信 云中生智”曙光戰(zhàn)略發(fā)布會(huì)召開。曙光從首創(chuàng)“城市”進(jìn)化到實(shí)現(xiàn)“
    的頭像 發(fā)表于 12-19 15:11 ?645次閱讀

    與上海儀電物聯(lián)簽署戰(zhàn)略合作協(xié)議

    近日,(上海)智能科技有限公司(以下簡稱“”)與上海儀電物聯(lián)技術(shù)股份有限公司(以下簡
    的頭像 發(fā)表于 11-29 18:02 ?934次閱讀

    與國信領(lǐng)英簽署戰(zhàn)略合作協(xié)議

    智能科技股份有限公司(以下簡稱“”)與蘇州國信領(lǐng)英教育科技有限公司(以下簡稱“國信領(lǐng)
    的頭像 發(fā)表于 10-12 14:16 ?742次閱讀

    推出山海多模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,多模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,以創(chuàng)新之姿,推出了其匠心獨(dú)運(yùn)的山海多模態(tài)大模型,正式宣告“Her時(shí)代
    的頭像 發(fā)表于 08-27 15:20 ?629次閱讀