99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深度學習將對音頻處理產(chǎn)生深遠影響 亞馬遜團隊深度噪聲抑制挑戰(zhàn)賽中獲勝

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2020-09-08 09:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

該團隊的非實時系統(tǒng)是性能最好的,而它的實時系統(tǒng)在整個系統(tǒng)中排名第三,在實時系統(tǒng)中排名第二,盡管只使用了4%的CPU核心。

文 / Arvindh Krishnaswamy 原文鏈接: https://www.amazon.science/blog/amazon-team-takes-first-place-in-interspeech-2020-deep-noise-suppression-challenge

在電子語音通信中,噪音和混響不僅會損害語音清晰度,而且會導致聽者在長時間努力理解低質(zhì)量語音時感到疲勞。在COVID-19大流行期間,我們花在遠程會議上的時間越來越多,這一問題比以往任何時候都更加重要。 在今年的Interspeech會議上的深度噪聲抑制挑戰(zhàn)便是為了幫助解決這個問題的一個嘗試,分別在實時語音增強和非實時語音增強上進行比賽。在19個團隊中,Amazon取得了最好的結果,在非實時賽道上獲得了第一名(階段1 |階段2-final),在實時賽道上獲得了第二名。

上面是一個有噪聲的語音樣本(上圖) 下面是被研究者的系統(tǒng)抑制了噪聲的同一個樣本(下圖) 為了滿足真實世界的需求,我們將實時輸入限制在CPU使用量的4%(在i7-8565U內(nèi)核上測量),這遠遠低于競賽所允許的最大限度。 然而,我們的實時輸入非常接近(0.03平均意見分數(shù))的第一名,并且擊敗了其他非實時的輸入。 Amazon團隊實時和非實時噪聲抑制結果的音頻示例可以在這里找到。 我們還發(fā)表了兩篇論文(paper1-offline | paper2-real)來更詳細地描述我們的技術方法。 在Interspeech中獲勝的技術已經(jīng)在Alexa通信公告和Drop in Everywhere功能中發(fā)布,并且從今天開始,我們的客戶也可以通過使用Amazon Chime蘋果macOS和微軟Windows客戶端來進行視頻會議和在線會議。

優(yōu)化的感知 傳統(tǒng)的語音增強算法使用人工調(diào)整的語音和噪聲模型,通常假設噪聲是恒定的。 對于某些類型的噪音(例如汽車噪音),在噪音不太大或低混響的環(huán)境下,這種方法工作得相當好。不幸的是,它們經(jīng)常在非平穩(wěn)噪音上失敗,比如鍵盤噪音和雜音。因此,研究人員轉(zhuǎn)向了深度學習方法。

語音增強不僅需要從噪音和混響中提取原始語音,而且需要以一種人類耳朵感覺自然和愉快的方式進行。這使得自動回歸測試變得困難,并使深度學習語音增強系統(tǒng)的設計復雜化。 我們的實時系統(tǒng)實際上通過直接優(yōu)化了語音的感知特征(spectral envelope and voicing),利用了人類的感知因素同時忽略了與感知無關的方面。由此產(chǎn)生的算法產(chǎn)生了最先進的語音質(zhì)量,同時保持非常高的計算效率。 對于非實時系統(tǒng),我們采取了一種不妥協(xié)的方法,使用改進的U-Net深度卷積網(wǎng)絡從增強的語音壓縮每一點可能的質(zhì)量,從而贏得了輸入挑戰(zhàn)。

一描繪經(jīng)被允許使用的研究人員的實時系統(tǒng)的百分比中央處理器核心降噪后的一語音樣本的平均意見分數(shù)(MOS)的變化的圖像 在深度噪聲抑制的挑戰(zhàn)中,經(jīng)過處理的音頻示例被盲發(fā)送給人類聽眾,由他們對其進行評分,產(chǎn)生平均意見分數(shù)(MOS)。 在實時應用程序中,復雜性和質(zhì)量之間總是需要權衡的。 右邊的圖顯示了我們?nèi)绾瓮ㄟ^增加CPU需求來進一步提高實時提交的質(zhì)量,或者通過犧牲一些質(zhì)量來進一步節(jié)省CPU的使用。 紅點表示提交挑戰(zhàn)的實時系統(tǒng),圖像顯示了MOS分數(shù)相對于不同CPU負載的變化。

人們普遍認為,深度學習最終將對音頻處理產(chǎn)生深遠影響。 雖然仍有很多挑戰(zhàn),比如數(shù)據(jù)增強,感知相關的損失函數(shù)或者處理看不見的情況,但未來依然非常令人興奮。

原文標題:亞馬遜團隊在Interspeech 2020深度噪聲抑制挑戰(zhàn)賽中獲得第一名

文章出處:【微信公眾號:LiveVideoStack】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11075

    瀏覽量

    216951
  • MOS
    MOS
    +關注

    關注

    32

    文章

    1358

    瀏覽量

    96959
  • 噪音
    +關注

    關注

    1

    文章

    170

    瀏覽量

    24209
  • 亞馬遜
    +關注

    關注

    8

    文章

    2694

    瀏覽量

    84645
  • 深度學習
    +關注

    關注

    73

    文章

    5560

    瀏覽量

    122769

原文標題:亞馬遜團隊在Interspeech 2020深度噪聲抑制挑戰(zhàn)賽中獲得第一名

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍,推動視頻畫質(zhì)升級

    近日,在計算機視覺領域最具影響力的國際競賽CVPRNTIRE2025,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲高效超分辨率挑戰(zhàn)賽
    的頭像 發(fā)表于 06-24 17:03 ?357次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動視頻畫質(zhì)升級

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    近日,在計算機視覺領域最具影響力的國際競賽 CVPR NTIRE 2025,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 202
    的頭像 發(fā)表于 06-24 16:08 ?780次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬獲CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    ASML杯光刻「芯 」勢力知識挑戰(zhàn)賽正式啟動

    ASML光刻「芯」勢力知識挑戰(zhàn)賽由全球半導體行業(yè)領先供應商ASML發(fā)起,是一項面向中國半導體人才與科技愛好者的科普賽事。依托ASML在光刻領域的技術積累與行業(yè)洞察,賽事致力于為參賽者打造一個深度探索光刻技術的知識競技窗口,同時培養(yǎng)優(yōu)秀科技「芯」勢力,共同推動摩爾定律演進。
    的頭像 發(fā)表于 06-23 17:04 ?642次閱讀
    ASML杯光刻「芯 」勢力知識<b class='flag-5'>挑戰(zhàn)賽</b>正式啟動

    平頭哥半導體亮相AICAS 2025挑戰(zhàn)賽技術研討會

    近日,歷時兩個多月,600余支參賽隊伍激烈角逐,AICAS 2025全球技術挑戰(zhàn)賽初賽階段賽程已順利結束,中技術研討于2月22日在杭州圓滿召開。本次研討會作為AICAS全球技術挑戰(zhàn)賽的重要環(huán)節(jié),在初賽和復賽之間架起橋梁,為參賽
    的頭像 發(fā)表于 02-25 11:23 ?703次閱讀

    軍事應用深度學習挑戰(zhàn)與機遇

    人工智能尤其是深度學習技術的最新進展,加速了不同應用領域的創(chuàng)新與發(fā)展。深度學習技術的發(fā)展深刻影響了軍事發(fā)展趨勢,導致戰(zhàn)爭形式和模式發(fā)生重大變化。本文將概述
    的頭像 發(fā)表于 02-14 11:15 ?529次閱讀

    EDA精英挑戰(zhàn)賽果公布!思爾芯“戰(zhàn)隊”薪火相承斬獲“麒麟杯”

    2024國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽12月7-8日,2024國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設計精英挑戰(zhàn)賽
    的頭像 發(fā)表于 12-11 01:03 ?936次閱讀
    EDA精英<b class='flag-5'>挑戰(zhàn)賽</b><b class='flag-5'>賽</b>果公布!思爾芯“戰(zhàn)隊”薪火相承斬獲“麒麟杯”

    GPU在深度學習的應用 GPUs在圖形設計的作用

    隨著人工智能技術的飛速發(fā)展,深度學習作為其核心部分,已經(jīng)成為推動技術進步的重要力量。GPU(圖形處理單元)在深度學習
    的頭像 發(fā)表于 11-19 10:55 ?1610次閱讀

    深度學習RNN的優(yōu)勢與挑戰(zhàn)

    循環(huán)神經(jīng)網(wǎng)絡(RNN)是深度學習領域中處理序列數(shù)據(jù)的基石。它們通過在每個時間步長上循環(huán)傳遞信息,使得網(wǎng)絡能夠捕捉時間序列數(shù)據(jù)的長期依賴關系。然而,盡管RNN在某些任務上表現(xiàn)出色,它們
    的頭像 發(fā)表于 11-15 09:55 ?1320次閱讀

    NPU在深度學習的應用

    設計的硬件加速器,它在深度學習的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優(yōu)化的
    的頭像 發(fā)表于 11-14 15:17 ?1893次閱讀

    GPU深度學習應用案例

    GPU在深度學習的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度
    的頭像 發(fā)表于 10-27 11:13 ?1338次閱讀

    50萬獎金池!開放原子大賽——第二屆OpenHarmony創(chuàng)新應用挑戰(zhàn)賽正式啟動

    第二屆OpenHarmony創(chuàng)新應用挑戰(zhàn)賽作為開放原子大賽旗下的重要項,聚焦 OpenHarmony應用開發(fā),致力提升開發(fā)者的動手實踐能力與開發(fā)創(chuàng)新應用的能力。 項要求開發(fā)者
    發(fā)表于 10-24 15:40

    AI深度噪音抑制技術

    AI深度噪音抑制技術通過深度學習算法實現(xiàn)了對音頻噪聲
    的頭像 發(fā)表于 10-17 10:45 ?1513次閱讀
    AI<b class='flag-5'>深度</b>噪音<b class='flag-5'>抑制</b>技術

    FPGA做深度學習能走多遠?

    的發(fā)展前景較為廣闊,但也面臨一些挑戰(zhàn)。以下是一些關于 FPGA 在深度學習應用前景的觀點,僅供參考: ? 優(yōu)勢方面: ? 高度定制化的計算架構:FPGA 可以根據(jù)
    發(fā)表于 09-27 20:53

    思爾芯題正式發(fā)布,邀你共戰(zhàn)EDA精英挑戰(zhàn)賽!

    題發(fā)布COMPETITIONRELEASE2024國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設計精英挑戰(zhàn)賽”)現(xiàn)已正式拉開帷幕。作為核心出題企業(yè)之一思爾芯(S2C),已
    的頭像 發(fā)表于 08-03 08:24 ?1108次閱讀
    思爾芯<b class='flag-5'>賽</b>題正式發(fā)布,邀你共戰(zhàn)EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>!

    深度學習算法在集成電路測試的應用

    隨著半導體技術的快速發(fā)展,集成電路(IC)的復雜性和集成度不斷提高,對測試技術的要求也日益增加。深度學習算法作為一種強大的數(shù)據(jù)處理和模式識別工具,在集成電路測試領域展現(xiàn)出了巨大的應用潛力。本文將從
    的頭像 發(fā)表于 07-15 09:48 ?1847次閱讀