99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

傳音AI技術(shù)部在ASRU 2023 MADASR低資源語音識別比賽斬獲多項(xiàng)佳績

傳音控股 ? 來源:傳音控股 ? 2023-12-21 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

國際頂級語音會議ASRU 2023(IEEE Workshop on Automatic Speech Recognition and Understanding,簡稱ASRU)于12月16日-20日順利舉辦。傳音AI技術(shù)部在ASRU 2023 MADASR(Model ADaptation for ASR in low-resource Indian languages,簡稱MADASR)關(guān)于孟加拉語和博杰普爾語的低資源語音識別比賽中斬獲多項(xiàng)佳績,在受限和非受限的4個賽道、2個語種與WER、CER 2個評價(jià)指標(biāo)共16個細(xì)分子賽道上獲得2個第一名、6個第二名和5個第三名。

ASRU研討會是語音與語言處理學(xué)術(shù)圈的頂級會議,由IEEE語音和語言處理技術(shù)委員會主辦,每兩年舉行一次,歷史悠久,影響廣泛。此次MADASR比賽是ASRU 2023的重要賽事,由IBM、布爾諾理工大學(xué)、微軟研究院、愛丁堡大學(xué)和印度科學(xué)研究所舉辦,旨在以孟加拉語和博杰普爾語為例,探索低資源語言的語音識別難題。比賽吸引了中科院自動化所、愛沙尼亞塔林理工大學(xué)、印度坎普爾理工學(xué)院、印度科學(xué)研究所-馬德拉斯語音實(shí)驗(yàn)室、印度科學(xué)研究所-孟買數(shù)字音頻處理實(shí)驗(yàn)室、印度浦那高級計(jì)算發(fā)展中心等多家國內(nèi)外知名高校和研究機(jī)構(gòu)參賽。

自動語音識別(Automatic Speech Recognition,簡稱ASR)主要用于將人類語音轉(zhuǎn)換為計(jì)算機(jī)可讀的文本或命令,實(shí)現(xiàn)人機(jī)交互和自然語言處理。近年來,得益于基于自監(jiān)督學(xué)習(xí)的聲學(xué)模型(如 wav2vec2)和大規(guī)模多語言訓(xùn)練(如 Whisper),自動語音識別性能大幅提高,然而低資源語言由于音頻和文本數(shù)據(jù)有限,仍面臨巨大的挑戰(zhàn)。

在ASRU 2023 MADASR比賽中,傳音AI技術(shù)部開發(fā)的語音識別系統(tǒng),在算法層面使用了兩種方案,一種是基于U2(Unified-2 pass)框架的編碼器和解碼器結(jié)構(gòu),使用短時連接分類(Connectionist Temporal Classification)和注意力重打分(Attention Rescore);另一種是基于Whisper的改進(jìn)和微調(diào)的結(jié)構(gòu)。該系統(tǒng)顯著提升了低資源語言語音識別的準(zhǔn)確性和效率,克服了語音數(shù)據(jù)的稀缺難題,其解決方案將為其他低資源語言提供參考。

b69609e2-9faf-11ee-8b88-92fbcf53809c.jpg

b6ad96a2-9faf-11ee-8b88-92fbcf53809c.jpg

據(jù)Ethnologue網(wǎng)站統(tǒng)計(jì),世界上有7000多種語言,其中90%的語種使用人數(shù)少于10萬人,不同語種尤其是小語種之間的溝通交流仍面臨極大挑戰(zhàn)。傳音長期深耕新興市場,面對新興市場智能語音技術(shù)空白,不斷加強(qiáng)多語種數(shù)據(jù)建設(shè),開發(fā)小語種語音識別、語義理解、知識圖譜、語音合成等算法模型,除了提供多語種語音轉(zhuǎn)寫的服務(wù)能力,未來還將提供大語言模型生成式交互和跨語種翻譯能力,使不同語種之間的交流更順暢,讓更多的小語種使用群體受益。

傳音始終以新興市場的消費(fèi)者為中心,重視新興市場用戶的需求。未來,傳音將繼續(xù)結(jié)合行業(yè)技術(shù)發(fā)展趨勢和本地消費(fèi)者洞察,在AI技術(shù)研究和智能終端應(yīng)用領(lǐng)域發(fā)力,通過技術(shù)為用戶、為社會創(chuàng)造更多價(jià)值,讓盡可能多的人盡早享受科技和創(chuàng)新帶來的美好生活。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 語音識別
    +關(guān)注

    關(guān)注

    39

    文章

    1781

    瀏覽量

    114224
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1308

    瀏覽量

    25155
  • 傳音
    +關(guān)注

    關(guān)注

    0

    文章

    79

    瀏覽量

    6417

原文標(biāo)題:傳音AI技術(shù)部在ASRU 2023 MADASR低資源語音識別比賽斬獲多項(xiàng)佳績

文章出處:【微信號:TranssionHoldings,微信公眾號:傳音控股】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    影像黑科技:讓不同膚色的你看見真實(shí)的自己!

    Canalys(現(xiàn)并入Omdia)的最新數(shù)據(jù)顯示,2025年第一季度,全球可穿戴腕帶設(shè)備市場同比增長13%,出貨量達(dá)4660萬臺。其中,非洲TWS、可穿戴腕帶設(shè)備的市場份額持續(xù)第一。而這只是
    的頭像 發(fā)表于 06-27 09:26 ?303次閱讀
    <b class='flag-5'>傳</b><b class='flag-5'>音</b>影像黑科技:讓不同膚色的你看見真實(shí)的自己!

    “破壁者”:以中國AI技術(shù)賦能非洲數(shù)字化轉(zhuǎn)型

    當(dāng)前,人工智能技術(shù)非洲國家加快運(yùn)用,而中國科技出海企業(yè)控股在這其中扮演著關(guān)鍵角色。作為占據(jù)非洲智能手機(jī)市場超過40%份額的“非洲之王”,
    的頭像 發(fā)表于 04-29 16:30 ?463次閱讀
    “破壁者”<b class='flag-5'>傳</b><b class='flag-5'>音</b>:以中國<b class='flag-5'>AI</b><b class='flag-5'>技術(shù)</b>賦能非洲數(shù)字化轉(zhuǎn)型

    接入 DeepSeek、聯(lián)合阿里云,AI戰(zhàn)略玩出新高度!

    近日,全球移動通信大會(MWC)上,控股旗下手機(jī)品牌TECNO以“CreatetheAIFuture”為主題,展示了智能眼鏡、三折疊屏手機(jī)、太陽能充電、AI變色屏等多項(xiàng)黑科技,引發(fā)
    的頭像 發(fā)表于 03-19 15:20 ?617次閱讀
    接入 DeepSeek、聯(lián)合阿里云,<b class='flag-5'>傳</b><b class='flag-5'>音</b><b class='flag-5'>AI</b>戰(zhàn)略玩出新高度!

    天馬供折疊屏!TECNO三折概念機(jī)PHANTOM ULTIMATE 2亮相MWC

    頂尖的極簡超輕薄設(shè)計(jì),搭載了多項(xiàng)三折領(lǐng)域突破性的創(chuàng)新技術(shù),彰顯了致力于探索和創(chuàng)新最先進(jìn)的新技術(shù)、革新用戶體驗(yàn)的承諾。作為一款面向未來的三
    發(fā)表于 03-07 09:39

    語音識別技術(shù)通信領(lǐng)域中的應(yīng)用實(shí)例

    語音識別技術(shù)也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計(jì)算機(jī)對
    的頭像 發(fā)表于 02-21 17:12 ?700次閱讀

    詳解語音識別技術(shù)通信領(lǐng)域中的應(yīng)用

    語音識別技術(shù)也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計(jì)算機(jī)對
    的頭像 發(fā)表于 02-21 17:05 ?781次閱讀
    詳解<b class='flag-5'>語音</b><b class='flag-5'>識別</b><b class='flag-5'>技術(shù)</b><b class='flag-5'>在</b>通信領(lǐng)域中的應(yīng)用

    東風(fēng)Honda汽車質(zhì)量再次斬獲佳績

    東風(fēng)Honda 旗下多款車型憑借出眾品質(zhì)、可靠性能,2024年度中國汽車質(zhì)量排行榜中斬獲佳績
    的頭像 發(fā)表于 02-11 14:08 ?351次閱讀

    南芯科技榮獲控股“技術(shù)創(chuàng)新獎”

    2022年以來,南芯科技已經(jīng)連續(xù)獲得控股頒發(fā)的多項(xiàng)殊榮,包括“鼎力支持獎”和“精誠合作獎”。此次榮獲“技術(shù)創(chuàng)新獎”,更是對南芯科技尖端
    的頭像 發(fā)表于 01-24 15:09 ?642次閱讀

    南芯科技榮膺控股2024年度技術(shù)創(chuàng)新獎

    近日,南芯科技(證券代碼:688484)榮膺控股頒發(fā)的“技術(shù)創(chuàng)新獎”,是南芯繼 2022 年“鼎力支持獎”和 2023 年“精誠合作獎”之后再次獲得來自傳
    的頭像 發(fā)表于 01-24 14:40 ?664次閱讀

    云知聲近期斬獲多項(xiàng)年度大獎

    科技迅猛發(fā)展的當(dāng)下,人工智能(AI)已成為推動各行業(yè)革新的核心動力。云知聲,以其卓越的技術(shù)實(shí)力和敏銳的市場洞察,AI領(lǐng)域中脫穎而出,成為
    的頭像 發(fā)表于 12-24 10:26 ?546次閱讀

    基于語音識別的智能會議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專注智能語音交互領(lǐng)域多年,語音識別語音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個智
    的頭像 發(fā)表于 12-20 10:35 ?586次閱讀

    華大半導(dǎo)體旗下多家企業(yè)斬獲佳績

    隨著中國電子2024年度管理創(chuàng)新成果評選圓滿落下帷幕,華大半導(dǎo)體旗下多家企業(yè)憑借出色的管理創(chuàng)新成果脫穎而出、斬獲佳績
    的頭像 發(fā)表于 12-03 15:00 ?882次閱讀

    語音識別技術(shù)醫(yī)療領(lǐng)域的應(yīng)用

    語音識別技術(shù)醫(yī)療領(lǐng)域的應(yīng)用已經(jīng)越來越廣泛,為醫(yī)療服務(wù)帶來了諸多便利和效率提升。以下是對語音識別
    的頭像 發(fā)表于 11-26 09:35 ?1207次閱讀

    ASR語音識別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語音識別技術(shù),是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類語音轉(zhuǎn)換為文本,廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個領(lǐng)域。
    的頭像 發(fā)表于 11-18 15:12 ?2065次閱讀

    控股入選2023新型實(shí)體企業(yè)TOP100

    2023“新型實(shí)體企業(yè)TOP100”成果發(fā)布暨典型企業(yè)分享交流會在北京舉辦。大會上,中國企業(yè)評價(jià)協(xié)會發(fā)布了《2023新型實(shí)體企業(yè)TOP100發(fā)展報(bào)告》及榜單。控股長期深耕智能終端制
    的頭像 發(fā)表于 09-29 16:21 ?886次閱讀