99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出端到端語(yǔ)音翻譯技術(shù),讓優(yōu)質(zhì)高效的機(jī)器翻譯不再遙遙無(wú)期

電子工程師 ? 來(lái)源:YXQ ? 2019-05-17 16:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

40年前,英國(guó)科幻作家Douglas Adams在他的《銀河系漫游指南》中這樣描述巴別魚(yú)(bable fish):迷你黃色生物,水蛭狀,以聲音中的語(yǔ)言概念為食,消化后排出跟寄主同頻的腦波。只要塞到耳朵里去,就可以聽(tīng)懂各種語(yǔ)言。

而在這個(gè)充滿嬉皮風(fēng)格的科幻作品中,來(lái)自地球的Arthur Dent也因?yàn)檫@條丑陋的魚(yú),能夠完美地理解并與他遇到的各種外星種族交流。

自小說(shuō)誕生,巴別魚(yú)便成為了即時(shí)語(yǔ)音翻譯的代名詞。但在當(dāng)時(shí),人類(lèi)的翻譯技術(shù)距離這一目標(biāo)仍遙不可及。

直到2014年,加拿大蒙特利爾大學(xué)的Kyunghyun Cho、Yoshua Bengio等人發(fā)布了一篇在機(jī)器翻譯領(lǐng)域應(yīng)用神經(jīng)網(wǎng)絡(luò)的論文——Neural Machine Translation by Jointly Learning to Align and Translate。

神經(jīng)網(wǎng)絡(luò)的出現(xiàn),讓優(yōu)質(zhì)高效的機(jī)器翻譯不再遙遙無(wú)期。

每次技術(shù)的突破都讓我們離巴別魚(yú)更近一步,直到今天,谷歌的發(fā)布了一項(xiàng)新研究Translatotron,這是一種可以實(shí)現(xiàn)端到端的語(yǔ)音轉(zhuǎn)語(yǔ)音的翻譯技術(shù)。該工具放棄了將語(yǔ)音翻譯成文本在返回語(yǔ)音的步驟,可以直接從一種語(yǔ)言轉(zhuǎn)換稱(chēng)另外一種語(yǔ)言,并同時(shí)保持說(shuō)話著的語(yǔ)調(diào)和節(jié)奏。

告別Siri,我們先來(lái)感受一下翻譯的調(diào)調(diào):

通過(guò)結(jié)合揚(yáng)聲器編碼器網(wǎng)絡(luò),使得Translatotron能夠在翻譯的語(yǔ)音中保留原始揚(yáng)聲器的聲音特征,這使得翻譯的語(yǔ)音聽(tīng)起來(lái)更自然,更少刺耳。

更多聲音樣本可以在Translatotron的Google Research的Github頁(yè)面上找到。

此功能利用了谷歌之前specker verification 和 speaker adaptation for TTS 的研究。揚(yáng)聲器編碼器在specker verification任務(wù)上預(yù)先訓(xùn)練,學(xué)習(xí)從簡(jiǎn)短的示例話語(yǔ)對(duì)揚(yáng)聲器特性進(jìn)行編碼。即使內(nèi)容是不同的語(yǔ)言,該編碼上調(diào)節(jié)頻譜圖解碼器也可使得合成具有類(lèi)似揚(yáng)聲器特性的語(yǔ)音。

Translatotron模型

其實(shí)語(yǔ)音翻譯的端到端模型的早在2016年就開(kāi)始出現(xiàn)了,當(dāng)時(shí)研究人員證明了使用單個(gè)序列到序列模型進(jìn)行語(yǔ)音到文本翻譯的可行性。

2017年,谷歌研究員們證明了這種端到端模型可以勝過(guò)cascade模型。之后又進(jìn)一步改進(jìn)許多端到端語(yǔ)音到文本翻譯模型的方法。

最終在2019年,谷歌的研究員們?cè)赼rXiv發(fā)表Translatotron模型,通過(guò)證明單個(gè)序列到序列模型可以直接將語(yǔ)言從一種語(yǔ)言翻譯成另一種語(yǔ)言的語(yǔ)音,而不依賴(lài)于任何一種語(yǔ)言的中間文本表示。

Translatotron基于序列到序列網(wǎng)絡(luò)將源光譜圖作為輸入并生成目標(biāo)語(yǔ)言中的翻譯內(nèi)容的光譜圖輸出。它還使用了另外兩個(gè)經(jīng)過(guò)單獨(dú)訓(xùn)練的組件:神經(jīng)聲碼器將輸出頻譜圖轉(zhuǎn)換為時(shí)域波形,使用揚(yáng)聲器編碼器來(lái)保持合成的翻譯語(yǔ)音中源說(shuō)話者的語(yǔ)音的特征。

在訓(xùn)練期間,序列到序列模型使用多任務(wù)目標(biāo)來(lái)在生成目標(biāo)譜圖的同時(shí)預(yù)測(cè)源和目標(biāo)轉(zhuǎn)錄物。

Translatotron的模型結(jié)構(gòu)

該團(tuán)隊(duì)稱(chēng),翻譯的準(zhǔn)確性并不如傳統(tǒng)翻譯系統(tǒng)那么好,傳統(tǒng)系統(tǒng)有更多時(shí)間來(lái)磨練其準(zhǔn)確性。但Translatotron是第一個(gè)能夠?qū)⒄Z(yǔ)言從一種語(yǔ)言直接翻譯成另一種語(yǔ)言的語(yǔ)音的端到端模型。他們希望這項(xiàng)工作可以作為未來(lái)端到端語(yǔ)音轉(zhuǎn)語(yǔ)音翻譯系統(tǒng)研究的起點(diǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    108153
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    39

    文章

    1782

    瀏覽量

    114248

原文標(biāo)題:巴別魚(yú)雛形,谷歌推出端到端語(yǔ)音翻譯技術(shù),還能模仿你說(shuō)話

文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    時(shí)空壺 T1 離線翻譯機(jī):解鎖無(wú)網(wǎng)生活溝通自由

    頻頻“掉鏈子”。時(shí)空壺T1離線翻譯機(jī),憑借強(qiáng)大的側(cè)AI模型與離線翻譯能力,為人們?cè)诙嘣顖?chǎng)景中打破語(yǔ)言壁壘,帶來(lái)高效、穩(wěn)定且流暢的溝通體驗(yàn)。一、全場(chǎng)景適配,出
    的頭像 發(fā)表于 06-05 10:30 ?315次閱讀
    時(shí)空壺 T1 離線<b class='flag-5'>翻譯</b>機(jī):解鎖無(wú)網(wǎng)生活溝通自由

    小米汽車(chē)智駕技術(shù)介紹

    后起之秀,小米在宣布造車(chē)前被非常多的人質(zhì)疑,但在“真香”定律下,小米創(chuàng)下了很多友商所不能及的成就。作為科技企業(yè),小米也在智能駕駛領(lǐng)域也不斷研發(fā)及突破,并推送了自動(dòng)駕駛系統(tǒng)。 小米
    的頭像 發(fā)表于 03-31 18:17 ?3534次閱讀
    小米汽車(chē)<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>智駕<b class='flag-5'>技術(shù)</b>介紹

    AI助力實(shí)時(shí)翻譯耳機(jī)

    你是否曾經(jīng)因?yàn)檎Z(yǔ)言障礙而無(wú)法與外國(guó)人順暢交流?或者在旅行中因?yàn)檎Z(yǔ)言不通而錯(cuò)過(guò)了一些精彩的經(jīng)歷?現(xiàn)在,隨著AI技術(shù)的發(fā)展,實(shí)時(shí)翻譯耳機(jī)可以幫你輕松解決這些問(wèn)題。 1 什么是實(shí)時(shí)翻譯耳機(jī) 實(shí)時(shí)翻譯
    的頭像 發(fā)表于 01-24 11:14 ?1677次閱讀
    AI助力實(shí)時(shí)<b class='flag-5'>翻譯</b>耳機(jī)

    自動(dòng)駕駛技術(shù)研究與分析

    編者語(yǔ):「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù):C-0450,獲取本文參考報(bào)告:《自動(dòng)駕駛行業(yè)研究報(bào)告》pdf下載方式。 自動(dòng)駕駛進(jìn)入2024年,
    的頭像 發(fā)表于 12-19 13:07 ?896次閱讀

    階躍星辰發(fā)布國(guó)內(nèi)首個(gè)千億參數(shù)語(yǔ)音大模型

    近日,階躍星辰在官方公眾號(hào)上宣布了一項(xiàng)重大突破——推出Step-1o千億參數(shù)語(yǔ)音大模型。該模型被譽(yù)為“國(guó)內(nèi)首個(gè)千億參數(shù)
    的頭像 發(fā)表于 12-17 13:43 ?751次閱讀

    準(zhǔn)確性超Moshi和GLM-4-Voice,語(yǔ)音雙工模型Freeze-Omni

    GPT-4o 提供的全雙工語(yǔ)音對(duì)話帶來(lái)了一股研究熱潮,目前諸多工作開(kāi)始研究如何利用 LLM 來(lái)實(shí)現(xiàn)語(yǔ)音
    的頭像 發(fā)表于 12-17 10:21 ?928次閱讀
    準(zhǔn)確性超Moshi和GLM-4-Voice,<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>語(yǔ)音</b>雙工模型Freeze-Omni

    LLMWorld上線代碼翻譯新工具——問(wèn)丫·碼語(yǔ)翻譯俠,快來(lái)體驗(yàn)!

    01. 工具介紹 aicode.llmworld.net 問(wèn)丫·碼語(yǔ)翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語(yǔ)言之間的翻譯,包括計(jì)算機(jī)語(yǔ)言
    的頭像 發(fā)表于 12-09 11:11 ?1006次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問(wèn)丫·碼語(yǔ)<b class='flag-5'>翻譯</b>俠,快來(lái)體驗(yàn)!

    爆火的如何加速智駕落地?

    編者語(yǔ):「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù):C-0551,獲取本文參考報(bào)告:《智能汽車(chē)技術(shù)研究報(bào)告》pdf下載方式。 “
    的頭像 發(fā)表于 11-26 13:17 ?1162次閱讀
    爆火的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>如何加速智駕落地?

    Waymo利用谷歌Gemini大模型,研發(fā)端自動(dòng)駕駛系統(tǒng)

    邁新步,為其機(jī)器人出租車(chē)業(yè)務(wù)引入了一種基于谷歌多模態(tài)大語(yǔ)言模型(MLLM)“Gemini”的全新訓(xùn)練模型——“多模態(tài)自動(dòng)駕駛模型”(E
    的頭像 發(fā)表于 10-31 16:55 ?1727次閱讀

    智己汽車(chē)“”智駕方案推出,老司機(jī)真的會(huì)被取代嗎?

    隨著智能駕駛技術(shù)的發(fā)展,行業(yè)已經(jīng)從早期基于簡(jiǎn)單規(guī)則和模塊化邏輯的自動(dòng)駕駛,逐步邁向依托深度學(xué)習(xí)的高復(fù)雜度智能駕駛解決方案,各車(chē)企也緊跟潮流,先后宣布了自己的智駕方案。就在近期,智
    的頭像 發(fā)表于 10-30 09:47 ?835次閱讀
    智己汽車(chē)“<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”智駕方案<b class='flag-5'>推出</b>,老司機(jī)真的會(huì)被取代嗎?

    智駕強(qiáng)者愈強(qiáng)時(shí)代來(lái)臨?

    編者語(yǔ): 「智駕最前沿」微信公眾號(hào)后臺(tái)回復(fù): C-0572 ,獲取本文參考報(bào)告:《信達(dá)證券:革命開(kāi)啟,強(qiáng)者愈強(qiáng)時(shí)時(shí)代即將來(lái)臨》pdf下載方式。 隨著科技進(jìn)步和汽車(chē)技術(shù)的發(fā)展,智能
    的頭像 發(fā)表于 10-24 09:25 ?988次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>讓</b>智駕強(qiáng)者愈強(qiáng)時(shí)代來(lái)臨?

    InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

    ChatGPT對(duì)技術(shù)的影響引發(fā)了對(duì)人工智能未來(lái)的預(yù)測(cè),尤其是多模態(tài)技術(shù)的關(guān)注。OpenAI推出了具有突破性的多模態(tài)模型GPT-4,使各個(gè)領(lǐng)域取得了顯著的發(fā)展。 這些AI進(jìn)步是通過(guò)大規(guī)模模型訓(xùn)練實(shí)現(xiàn)
    的頭像 發(fā)表于 10-23 11:26 ?2229次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>InfiniBand網(wǎng)絡(luò)解決LLM訓(xùn)練瓶頸

    測(cè)試用例怎么寫(xiě)

    編寫(xiě)測(cè)試用例是確保軟件系統(tǒng)從頭到尾能夠正常工作的關(guān)鍵步驟。以下是一個(gè)詳細(xì)的指南,介紹如何編寫(xiě)
    的頭像 發(fā)表于 09-20 10:29 ?976次閱讀

    實(shí)現(xiàn)自動(dòng)駕駛,唯有?

    ,去年行業(yè)主流方案還是輕高精地圖城區(qū)智駕,今年大家的目標(biāo)都瞄到了(End-to-End, E2E)。
    的頭像 發(fā)表于 08-12 09:14 ?1524次閱讀
    實(shí)現(xiàn)自動(dòng)駕駛,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    DeepL推出新一代翻譯編輯大型語(yǔ)言模型

    在人工智能與語(yǔ)言處理領(lǐng)域,DeepL再次以其創(chuàng)新實(shí)力引領(lǐng)潮流,宣布成功推出新一代面向翻譯與編輯應(yīng)用的大型語(yǔ)言模型。這一里程碑式的進(jìn)展,不僅鞏固了DeepL作為頂尖語(yǔ)言人工智能公司的地位,更標(biāo)志著機(jī)器翻譯
    的頭像 發(fā)表于 07-19 15:56 ?1016次閱讀