99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI語(yǔ)音克隆技術(shù),或是播客行業(yè)長(zhǎng)久發(fā)展的終極解決方案

如意 ? 來(lái)源:科技行者 ? 作者:科技行者 ? 2020-10-08 14:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

播客行業(yè)正朝著更加輕松自然、非正式性的音頻敘事方向發(fā)展。這種較少使用嚴(yán)肅用語(yǔ)的傳播形式,也成功拉近了主播與聽(tīng)眾間的溝通距離。

換句話說(shuō),主播們盡可能使用口語(yǔ)表達(dá),降低表述內(nèi)容的理解與反應(yīng)難度。也正是憑借著這種通俗易懂優(yōu)勢(shì),音頻敘事變得越來(lái)越流行,相關(guān)調(diào)查數(shù)據(jù)也證明了這一發(fā)展趨勢(shì)。

根據(jù)Statista公布的統(tǒng)計(jì)結(jié)果,2018年全美播客收聽(tīng)者已經(jīng)達(dá)到7500萬(wàn);預(yù)計(jì)到2024年,月收聽(tīng)用戶將增長(zhǎng)至1.64億。由此估計(jì),2019年至2023年之間播客聽(tīng)眾的復(fù)合年增長(zhǎng)率將高達(dá)17%。

2020年,四分之三的美國(guó)民眾明確知曉播客為何物,其中超過(guò)半數(shù)(55%)的受訪者已經(jīng)開(kāi)始收聽(tīng)播客。而作為全球收入最高的播客,喬·羅根(Joe Rogan)的《喬·羅根體驗(yàn)》(The Joe Rogan Experience)節(jié)目在2019年獲得高達(dá)5000萬(wàn)美元銷售額,月均下載近2億次。

目前,播客行業(yè)面對(duì)的主要問(wèn)題在于如何在維持內(nèi)容獨(dú)立性的同時(shí),獲取支持行業(yè)快速增長(zhǎng)的必要資源。終于進(jìn)入正題——人工智能等突破性技術(shù)帶來(lái)的語(yǔ)音克隆功能,也許能夠帶來(lái)重要的解決手段,或者至少是部分解決方案。

以尼克松(Nixon)項(xiàng)目為例,其以令人信服的結(jié)果證明AI技術(shù)完全能夠重現(xiàn)出與人類對(duì)象沒(méi)有任何區(qū)別的語(yǔ)音效果。麻省理工學(xué)院的一組研究人員、新聞工作者及藝術(shù)家,同語(yǔ)音克隆廠商Respeecher及VDR公司的Canny AI開(kāi)展合作,共同創(chuàng)造出模擬得出的首次登月通話記錄——只是這一次,宇航員阿姆斯特朗與奧德林未能完成任務(wù),并被困在了月球上。

他們甚至還“偽造”了時(shí)任美國(guó)總統(tǒng)的尼克松的視頻,向全世界宣告此次登月之旅的悲慘失敗。

當(dāng)播客遇上AI

計(jì)算機(jī)化語(yǔ)音的主要挑戰(zhàn),在于如何復(fù)制人類表達(dá)以及其中的種種細(xì)微差別,同時(shí)盡力避免機(jī)器音的存在。而在識(shí)別并重現(xiàn)細(xì)微聲音變化元素方面,以人工智能為基礎(chǔ)的語(yǔ)音轉(zhuǎn)換技術(shù)為我們指明了一條可行的發(fā)展道路。

蘋(píng)果Sir、Amazon Alexa、微軟Cortana以及Google Assistant等語(yǔ)音助手仍在使用文本到語(yǔ)音轉(zhuǎn)換技術(shù)。雖然這種技術(shù)的實(shí)用性確實(shí)很高,但卻很難帶來(lái)不同的語(yǔ)音類型。以Siri為例,要想實(shí)現(xiàn)老年男性的語(yǔ)音效果,除了需要引入龐大的預(yù)錄制文件之外,Siri還無(wú)法處理該音頻文件中未能包含的單詞。在這方面,AI支持下的語(yǔ)音到語(yǔ)音轉(zhuǎn)換就成了新的突破口。

如何將AI語(yǔ)音克隆應(yīng)用于播客領(lǐng)域?

人工智能不僅能夠?qū)崿F(xiàn)語(yǔ)音克隆,還能夠在任意播客節(jié)目中完美復(fù)制一切語(yǔ)音效果。其中使用的是一項(xiàng)名為“智能雞尾酒”的經(jīng)典數(shù)字信號(hào)處理算法,外加專用的深度生成建模技術(shù)——允許內(nèi)容制作者使用最適合的聲音解決以往難以實(shí)現(xiàn)的錄制效果(例如播報(bào)員有其他工作,或者需要重現(xiàn)某位已經(jīng)去世的配音演員的音色等)。

下面來(lái)看幾種語(yǔ)音克隆技術(shù)在播客制作領(lǐng)域的可行用例:

1. 讓名人加入您的節(jié)目

我們很難請(qǐng)到知名演員、作家、運(yùn)動(dòng)員等參與您的節(jié)目,但如果使用人工智能技術(shù)復(fù)制他們的聲音,就可以既輕松實(shí)現(xiàn)同樣的效果、又不必勞煩他們親自到錄音棚跑一趟。以此為基礎(chǔ),聽(tīng)眾們能夠聽(tīng)到自己喜愛(ài)的聲音,節(jié)目制作方與名人們也省去了勞頓之苦。

2. 重現(xiàn)舊日之聲

語(yǔ)音克隆能夠讓已經(jīng)去世的演員們?cè)俅潍I(xiàn)聲。想不想讓肯尼迪總統(tǒng)為歷史播客配上旁白?沒(méi)有問(wèn)題,語(yǔ)音轉(zhuǎn)換技術(shù)能夠精確重現(xiàn)他的聲音——是的,不只是“相似”,而是真正的完美還原。

3. 使用童聲朗讀,又不用強(qiáng)迫孩子們長(zhǎng)時(shí)間工作

孩子們講話總是非常有趣,這種趣味性不一定體現(xiàn)在內(nèi)容上,而更多在于他們的語(yǔ)音、語(yǔ)氣和語(yǔ)調(diào)當(dāng)中。但與孩子們一同工作可是相當(dāng)費(fèi)心費(fèi)力。通過(guò)語(yǔ)音合成技術(shù),我們可以讓專業(yè)演員念出孩子的臺(tái)詞,再將其轉(zhuǎn)換為童聲效果,大大簡(jiǎn)化節(jié)目制作流程。

4. 快速推進(jìn)節(jié)目制作進(jìn)度,保證播客及時(shí)播出

AI可以瞬間重現(xiàn)人聲,而且短時(shí)間內(nèi)就可以提供高質(zhì)量的目標(biāo)語(yǔ)音成果。

總結(jié)

2017年,全球播客市場(chǎng)帶來(lái)的廣告收入高達(dá)2.2億美元,且每年都在翻番。而用戶參與度的提升,將成為吸引潛在廣告客戶的核心動(dòng)力。更重要的是,播客中的廣告其實(shí)效果極佳,調(diào)查顯示此類廣告擁有近90%的播放完成率。

此外,廣告客戶甚至愿意為某些播客節(jié)目支付 高達(dá)30美元的CPM(廣告每千次展示成本)。單說(shuō)這個(gè)數(shù)字大家可能沒(méi)有概念,但Facebook上的每千次廣告展示成本約為6美元。

網(wǎng)絡(luò)電視正在緩慢但堅(jiān)定地取代著有線電視,播客與傳統(tǒng)廣播之間的關(guān)系似乎也是這樣。而單純從傳統(tǒng)廣播類廣告出發(fā),播客行業(yè)至少還能夠吸引到額外約200億美元收入。而正如我們?cè)谖恼麻_(kāi)頭提到,播客節(jié)目能夠吸引到大量原本根本不聽(tīng)廣播的群體,因此其利潤(rùn)增長(zhǎng)期望可謂一片光明。

這些調(diào)查數(shù)字表明,播客業(yè)務(wù)將長(zhǎng)久存在,同時(shí)也迫切需要音頻內(nèi)容制作者們找到效率更高、效果更好的節(jié)目產(chǎn)出方法。

也許AI語(yǔ)音克隆技術(shù),正是幫助播客行業(yè)在內(nèi)容獨(dú)立性與節(jié)目制作資源需求間找到完美平衡的終極解決方案。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    30

    文章

    3048

    瀏覽量

    83474
  • 語(yǔ)音
    +關(guān)注

    關(guān)注

    3

    文章

    399

    瀏覽量

    38719
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35194

    瀏覽量

    280308
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ??廣和通發(fā)布5G AI MiFi 解決方案,重新定義AI智聯(lián)萬(wàn)物

    4月25日,廣和通發(fā)布5G AI MiFi 解決方案,深度融合5G通信與AI語(yǔ)音技術(shù),是一款便攜式移動(dòng)熱點(diǎn)設(shè)備。該
    發(fā)表于 05-21 17:11 ?1041次閱讀
    ??廣和通發(fā)布5G <b class='flag-5'>AI</b> MiFi <b class='flag-5'>解決方案</b>,重新定義<b class='flag-5'>AI</b>智聯(lián)萬(wàn)物

    AI神經(jīng)網(wǎng)絡(luò)降噪算法在語(yǔ)音通話產(chǎn)品中的應(yīng)用優(yōu)勢(shì)與前景分析

    隨著人工智能技術(shù)的快速發(fā)展AI神經(jīng)網(wǎng)絡(luò)降噪算法在語(yǔ)音通話產(chǎn)品中的應(yīng)用正逐步取代傳統(tǒng)降噪技術(shù),成為提升語(yǔ)
    的頭像 發(fā)表于 05-16 17:07 ?449次閱讀
    <b class='flag-5'>AI</b>神經(jīng)網(wǎng)絡(luò)降噪算法在<b class='flag-5'>語(yǔ)音</b>通話產(chǎn)品中的應(yīng)用優(yōu)勢(shì)與前景分析

    廣和通發(fā)布5G AI MiFi解決方案

    近日,廣和通發(fā)布5G AI MiFi 解決方案,深度融合5G通信與AI語(yǔ)音技術(shù),是一款便攜式移動(dòng)熱點(diǎn)設(shè)備。該
    的頭像 發(fā)表于 04-29 09:05 ?583次閱讀

    抓住AI時(shí)代機(jī)遇,從伙伴與華為共筑行業(yè)解決方案開(kāi)始

    立足行業(yè)解決方案,才能贏得AI時(shí)代
    的頭像 發(fā)表于 04-07 17:46 ?715次閱讀
    抓住<b class='flag-5'>AI</b>時(shí)代機(jī)遇,從伙伴與華為共筑<b class='flag-5'>行業(yè)</b><b class='flag-5'>解決方案</b>開(kāi)始

    曙光超智融合解決方案已落地30多個(gè)行業(yè)

    近日,“超智融合”技術(shù)行業(yè)新熱點(diǎn),而曙光超智融合解決方案已在氣象、石油、生物醫(yī)藥等30多個(gè)行業(yè)落地,支持前沿AI應(yīng)用創(chuàng)新。
    的頭像 發(fā)表于 03-18 09:13 ?536次閱讀

    Banana Pi 與瑞薩電子攜手共同推動(dòng)開(kāi)源創(chuàng)新:BPI-AI2N

    技術(shù)、嵌入式系統(tǒng)和物聯(lián)網(wǎng)等領(lǐng)域展開(kāi)深度合作,為全球開(kāi)發(fā)者和企業(yè)用戶提供更強(qiáng)大的解決方案。 Banana Pi 長(zhǎng)期以來(lái)致力于推動(dòng)開(kāi)源硬件的發(fā)展,憑借豐富的產(chǎn)品線和強(qiáng)大的社區(qū)支持,成為開(kāi)發(fā)者和
    發(fā)表于 03-12 09:43

    九聯(lián)科技AI解決方案接入AI大模型

    在人工智能技術(shù)迅猛發(fā)展的今天,九聯(lián)科技憑借其領(lǐng)先的物聯(lián)網(wǎng)通信模組技術(shù)和創(chuàng)新的AI應(yīng)用方案,再次走在了行業(yè)
    的頭像 發(fā)表于 03-07 17:21 ?664次閱讀

    啟明智顯AI(人工智能)解決方案加速傳統(tǒng)企業(yè)智能化轉(zhuǎn)型

    啟明智顯AI解決方案,將AI技術(shù)深入傳統(tǒng)行業(yè),支持多模態(tài)交互、生成式AIoT、靈活調(diào)用AI能力,
    的頭像 發(fā)表于 02-27 17:33 ?716次閱讀
    啟明智顯<b class='flag-5'>AI</b>(人工智能)<b class='flag-5'>解決方案</b>加速傳統(tǒng)企業(yè)智能化轉(zhuǎn)型

    啟明智顯助力傳統(tǒng)行業(yè)AI智能硬件升級(jí)解決方案

    啟明智顯AI智能體解決方案,助力傳統(tǒng)行業(yè)中智能升級(jí),玩具、擺件、智能家居等多領(lǐng)域應(yīng)用
    的頭像 發(fā)表于 02-24 16:30 ?746次閱讀
    啟明智顯助力傳統(tǒng)<b class='flag-5'>行業(yè)</b><b class='flag-5'>AI</b>智能硬件升級(jí)<b class='flag-5'>解決方案</b>

    行業(yè)集結(jié):共同定制 RK3566 集成 AI 眼鏡的前沿 AR 方案

    硬編碼· 超低功耗,路由器連接?;顩r下功耗低于 150uA· 內(nèi)置語(yǔ)音喚醒 / 命令詞· 方案成熟度高,聲音和圖像上傳手機(jī)和服務(wù)器已有多個(gè)成熟案例,并有配套 APP適用場(chǎng)景與產(chǎn)品特性AI 眼鏡具備
    發(fā)表于 02-20 18:44

    廣和通正式推出AI玩具大模型解決方案

    ,即可實(shí)現(xiàn)音視頻及圖像的實(shí)時(shí)傳輸、語(yǔ)音識(shí)別、自然語(yǔ)言處理以及機(jī)器學(xué)習(xí)等多種功能。這意味著玩具能夠與用戶進(jìn)行更加豐富的互動(dòng),通過(guò)擬人、擬動(dòng)物或擬IP的形式,以視、聽(tīng)、觸等多維度的方式與用戶進(jìn)行交流。 廣和通的AI玩具大模型解決方案
    的頭像 發(fā)表于 01-24 10:36 ?1221次閱讀

    廣和通發(fā)布AI玩具大模型解決方案

    玩具行業(yè)的新篇章。 這一解決方案的最大亮點(diǎn)在于其高度的集成性和智能化。無(wú)需外接MCU,即可輕松實(shí)現(xiàn)音視頻及圖像的實(shí)時(shí)傳輸、精準(zhǔn)的語(yǔ)音識(shí)別、流暢的自然語(yǔ)言處理以及強(qiáng)大的機(jī)器學(xué)習(xí)功能。通過(guò)擬人、擬動(dòng)物或擬IP的生動(dòng)形式,該
    的頭像 發(fā)表于 01-21 14:45 ?1205次閱讀

    廣和通AI解決方案內(nèi)置大模型,讓玩具成為你的智慧伙伴

    廣和通推出AI玩具大模型解決方案,該方案深度融合豆包等AI大模型、內(nèi)置廣和通Cat.1模組,助力智能玩具實(shí)現(xiàn)AI化升級(jí)。該
    的頭像 發(fā)表于 01-21 11:03 ?609次閱讀
    廣和通<b class='flag-5'>AI</b><b class='flag-5'>解決方案</b>內(nèi)置大模型,讓玩具成為你的智慧伙伴

    廣和通推出AI玩具大模型解決方案

    廣和通推出AI玩具大模型解決方案,該方案深度融合豆包等AI大模型、內(nèi)置廣和通Cat.1模組,助力智能玩具實(shí)現(xiàn)AI化升級(jí)。該
    的頭像 發(fā)表于 01-21 10:27 ?800次閱讀

    企業(yè)AI解決方案包括哪些內(nèi)容

    企業(yè)AI解決方案是一種集成了人工智能技術(shù)的綜合性方案,旨在提高企業(yè)運(yùn)營(yíng)效率、降低成本、優(yōu)化業(yè)務(wù)流程,并提升企業(yè)的整體競(jìng)爭(zhēng)力。那么,企業(yè)AI
    的頭像 發(fā)表于 01-10 10:15 ?506次閱讀