99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種用于音樂(lè)源分離的新型深度學(xué)習(xí)系統(tǒng)

倩倩 ? 來(lái)源:互聯(lián)網(wǎng)分析沙龍 ? 2020-03-22 15:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Facebook Research最近發(fā)布了Demucs,這是一種用于音樂(lè)源分離的新型深度學(xué)習(xí)系統(tǒng)。根據(jù)人類(lèi)對(duì)分離后聲音總體質(zhì)量的評(píng)估,Demucs的性能優(yōu)于先前報(bào)道的結(jié)果。

音樂(lè)源分離是經(jīng)過(guò)大量研究的一種應(yīng)用,稱(chēng)為盲源分離。該過(guò)程包括在不借助元信息的情況下從一組混合信號(hào)中分離出一組源信號(hào)。對(duì)于音樂(lè),各個(gè)組成部分可能包括人聲或其他樂(lè)器軌道。當(dāng)空中交通管制員開(kāi)始在單個(gè)揚(yáng)聲器上聽(tīng)到多個(gè)飛行員的混合聲音時(shí)出現(xiàn)問(wèn)題時(shí),源分離領(lǐng)域首先受到了廣泛關(guān)注。這導(dǎo)致英國(guó)科學(xué)家科林·切里(Colin Cherry)在1953年將這種效應(yīng)稱(chēng)為“雞尾酒會(huì)問(wèn)題”。

在源分離領(lǐng)域的現(xiàn)有研究的推動(dòng)下,研究科學(xué)家于2000年代初開(kāi)始使用AI分離音樂(lè)中的聲音。如今,短時(shí)傅立葉變換產(chǎn)生的頻譜圖(STFT)是最新音樂(lè)源分離的核心。這些系統(tǒng)在每個(gè)幀和每個(gè)源的幅度譜上產(chǎn)生一個(gè)掩碼,并且通過(guò)在掩碼頻譜圖上運(yùn)行逆STFT的同時(shí)重新使用輸入混合相位,來(lái)生成輸出音頻。

建立在頻譜圖分析基礎(chǔ)上的系統(tǒng)在諸如中音鋼琴或連奏小提琴之類(lèi)的樂(lè)器的源分離方面表現(xiàn)出色,因?yàn)樗鼈兛梢援a(chǎn)生一致的頻率和振鈴。但是,這些系統(tǒng)很難隔離敲擊聲音,因?yàn)榍脫魳?lè)器所產(chǎn)生的殘留噪聲會(huì)產(chǎn)生更寬的頻率范圍,并且當(dāng)與多個(gè)樂(lè)器的重疊相結(jié)合時(shí),信息就會(huì)丟失,并且掩蓋操作將使信息不再可逆。

Demucs是一種深度學(xué)習(xí)模型,可直接對(duì)原始輸入波形進(jìn)行操作并為每個(gè)源生成一個(gè)波形。U-net體系結(jié)構(gòu)使用卷積編碼器和解碼器,該解碼器和解碼器基于跨步卷積較大的步幅。波形模型的工作方式與常見(jiàn)的計(jì)算機(jī)視覺(jué)模型相似,因?yàn)樗鼈兌际褂?a href="http://www.socialnewsupdate.com/tags/神經(jīng)網(wǎng)絡(luò)/" target="_blank">神經(jīng)網(wǎng)絡(luò)在推斷更高級(jí)別的模式之前先檢測(cè)基本模式。

基于頻譜圖的模型優(yōu)于Wave-U-Net,后者是Demucs之前最先進(jìn)的基于波形的模型。Demucs建立在Wave-U-Net體系結(jié)構(gòu)的基礎(chǔ)上,具有可調(diào)整的超參數(shù)和較長(zhǎng)的短期內(nèi)存,允許網(wǎng)絡(luò)處理整個(gè)數(shù)據(jù)序列,而不是單個(gè)數(shù)據(jù)點(diǎn)。

這些改進(jìn)幫助系統(tǒng)解決了一個(gè)聲音超過(guò)另一個(gè)聲音的問(wèn)題,因?yàn)榻獯a器足夠聰明,可以填充柔和的音符。

人類(lèi)在MusDB數(shù)據(jù)集上評(píng)估Demucs,并將其與其他最新的源分離系統(tǒng)的結(jié)果進(jìn)行比較。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 傅立葉變換
    +關(guān)注

    關(guān)注

    3

    文章

    105

    瀏覽量

    32896
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122781
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    一種新型寬帶鞭狀套筒天線

    電子發(fā)燒友網(wǎng)站提供《一種新型寬帶鞭狀套筒天線.pdf》資料免費(fèi)下載
    發(fā)表于 05-28 14:05 ?0次下載

    一種新型激光雷達(dá)慣性視覺(jué)里程計(jì)系統(tǒng)介紹

    針對(duì)具有挑戰(zhàn)性的光照條件和惡劣環(huán)境,本文提出了LIR-LIVO,這是一種輕量級(jí)且穩(wěn)健的激光雷達(dá)-慣性-視覺(jué)里程計(jì)系統(tǒng)。通過(guò)采用諸如利用深度與激光雷達(dá)點(diǎn)云關(guān)聯(lián)實(shí)現(xiàn)特征的均勻深度分布等先進(jìn)
    的頭像 發(fā)表于 04-28 11:18 ?349次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>激光雷達(dá)慣性視覺(jué)里程計(jì)<b class='flag-5'>系統(tǒng)</b>介紹

    一種新型直流電機(jī)控制器

    以前控制直流電機(jī)多由單片機(jī)完成。該方式缺點(diǎn)是接口繁瑣、速度慢,且不易在高溫、高壓等惡劣環(huán)境下工作[1]。采用一種新型直流電機(jī)控制器——DSP 控制器解決了單片機(jī)控制的缺點(diǎn),其具備很多優(yōu)點(diǎn),該控制器
    發(fā)表于 03-25 15:25

    BP神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)的關(guān)系

    ),是一種多層前饋神經(jīng)網(wǎng)絡(luò),它通過(guò)反向傳播算法進(jìn)行訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)由輸入層、個(gè)或多個(gè)隱藏層和輸出層組成,通過(guò)逐層遞減的方式調(diào)整網(wǎng)絡(luò)權(quán)重,目的是最小化網(wǎng)絡(luò)的輸出誤差。 二、深度學(xué)習(xí)
    的頭像 發(fā)表于 02-12 15:15 ?848次閱讀

    一種新型高效率的服務(wù)器電源系統(tǒng)

    一種新型高效率的服務(wù)器電源系統(tǒng)
    發(fā)表于 12-19 16:45 ?1次下載

    NPU在深度學(xué)習(xí)中的應(yīng)用

    設(shè)計(jì)的硬件加速器,它在深度學(xué)習(xí)中的應(yīng)用日益廣泛。 1. NPU的基本概念 NPU是一種專(zhuān)門(mén)針對(duì)深度學(xué)習(xí)算法優(yōu)化的處理器,它與傳統(tǒng)的CPU和G
    的頭像 發(fā)表于 11-14 15:17 ?1898次閱讀

    pcie在深度學(xué)習(xí)中的應(yīng)用

    與主機(jī)系統(tǒng)連接,提供必要的計(jì)算支持。 2. PCIe技術(shù)概述 PCIe是一種點(diǎn)對(duì)點(diǎn)串行連接,用于計(jì)算機(jī)內(nèi)部硬件組件之間的連接。它以其高速數(shù)據(jù)傳輸能力和低延遲特性而聞名,是連接高性能硬件(如GPU)的理想選擇。 高速數(shù)據(jù)傳輸 :P
    的頭像 發(fā)表于 11-13 10:39 ?1340次閱讀

    一種基于深度學(xué)習(xí)的二維拉曼光譜算法

    近日,天津大學(xué)精密儀器與光電子工程學(xué)院的光子芯片實(shí)驗(yàn)室提出了一種基于深度學(xué)習(xí)的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發(fā)表于 11-07 09:08 ?723次閱讀
    <b class='flag-5'>一種</b>基于<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>的二維拉曼光譜算法

    GPU深度學(xué)習(xí)應(yīng)用案例

    能力,可以顯著提高圖像識(shí)別模型的訓(xùn)練速度和準(zhǔn)確性。例如,在人臉識(shí)別、自動(dòng)駕駛等領(lǐng)域,GPU被廣泛應(yīng)用于加速深度學(xué)習(xí)模型的訓(xùn)練和推理過(guò)程。 二、自然語(yǔ)言處理 自然語(yǔ)言處理(NLP)是深度
    的頭像 發(fā)表于 10-27 11:13 ?1339次閱讀

    激光雷達(dá)技術(shù)的基于深度學(xué)習(xí)的進(jìn)步

    、激光雷達(dá)技術(shù)概述 激光雷達(dá)技術(shù)是一種基于激光的遙感技術(shù),通過(guò)發(fā)射激光脈沖并接收反射回來(lái)的光來(lái)測(cè)量物體的距離和速度。與傳統(tǒng)的雷達(dá)技術(shù)相比,激光雷達(dá)具有更高的分辨率和精度,能夠提供更詳細(xì)的三維空間
    的頭像 發(fā)表于 10-27 10:57 ?1056次閱讀

    一種新型電流模式控制集成電路

    電子發(fā)燒友網(wǎng)站提供《一種新型電流模式控制集成電路.pdf》資料免費(fèi)下載
    發(fā)表于 10-24 10:20 ?0次下載
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>電流模式控制集成電路

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對(duì)兩者關(guān)系的介紹: 、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :
    的頭像 發(fā)表于 10-23 15:25 ?2874次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    ,共同進(jìn)步。 歡迎加入FPGA技術(shù)微信交流群14群! 交流問(wèn)題() Q:FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?現(xiàn)在用FPGA做深度學(xué)習(xí)加速成為
    發(fā)表于 09-27 20:53

    一種新型全光學(xué)智能光譜儀

    近日,北京理工大學(xué)光電學(xué)院許廷發(fā)教授科研團(tuán)隊(duì)與清華大學(xué)林星助理教授團(tuán)隊(duì)聯(lián)合開(kāi)發(fā)了一種新型全光學(xué)智能光譜儀(Opto-Intelligence Spectrometer, OIS)。
    的頭像 發(fā)表于 07-31 06:18 ?668次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>新型</b>全光學(xué)智能光譜儀

    PyTorch深度學(xué)習(xí)開(kāi)發(fā)環(huán)境搭建指南

    PyTorch作為一種流行的深度學(xué)習(xí)框架,其開(kāi)發(fā)環(huán)境的搭建對(duì)于深度學(xué)習(xí)研究者和開(kāi)發(fā)者來(lái)說(shuō)至關(guān)重要。在Windows操作
    的頭像 發(fā)表于 07-16 18:29 ?2502次閱讀