Stability AI推出Stable audio的文本到音頻生成人工智能平臺

Stability AI是一家主要以人工智能生成的視覺效果而聞名的公司，它推出了一個名為Stable audio的文本到音頻生成人工智能平臺。

Stable Audio使用擴(kuò)散模型，與該公司更受歡迎的圖像平臺Stable diffusion的AI模型相同，但使用音頻而非圖像進(jìn)行訓(xùn)練。用戶可以使用它為任何項目生成歌曲或背景音頻。

音頻擴(kuò)散模型傾向于生成固定長度的音頻，這對音樂制作來說很糟糕，因為歌曲的長度可能不同。Stability AI的新平臺允許用戶發(fā)出不同長度的聲音，要求公司對音樂進(jìn)行訓(xùn)練，并在歌曲的開始和結(jié)束時間周圍添加文本元數(shù)據(jù)。

同時，它可以實(shí)現(xiàn)實(shí)時的音頻生成，無需等待長時間的渲染過程。Stability AI 宣稱，Stable Audio 模型可以在一秒內(nèi)渲染出 95 秒的立體聲音頻，并且只需要一個 NVIDIA A100 GPU。

并且，Stable Audio是一個開源的項目，任何人都可以免費(fèi)使用和修改。Stability AI 希望通過開源的方式促進(jìn) AI 領(lǐng)域的創(chuàng)新和發(fā)展，并讓更多人享受到 AI 技術(shù)帶來的便利和樂趣。

該公司在一份聲明中表示：“Stable Audio代表了Stability AI生成音頻研究實(shí)驗室Harmonai的尖端音頻生成研究。我們會繼續(xù)改進(jìn)我們的模型架構(gòu)、數(shù)據(jù)集和訓(xùn)練程序，以提高輸出質(zhì)量、可控性、推理速度和輸出長度?！?/p>

文本到音頻的生成并不是什么新鮮事，因為生成人工智能領(lǐng)域的其他大牌一直在玩弄這個概念。Meta于8月發(fā)布了AudioCraft，這是一套生成的人工智能模型，有助于根據(jù)提示創(chuàng)建聽起來自然的ERM、聲音和音樂。到目前為止，它只提供給研究人員和一些音頻專業(yè)人士。谷歌的MusicLM也可以讓人們產(chǎn)生聲音，但只對研究人員開放。

審核編輯：彭菁

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

音頻

音頻

+關(guān)注

關(guān)注
30

文章
3042

瀏覽量
83451
AI

AI

+關(guān)注

關(guān)注
88

文章
35164

瀏覽量
280013
人工智能

人工智能

+關(guān)注

關(guān)注
1807

文章
49029

瀏覽量
249576
模型

模型

+關(guān)注

關(guān)注
1

文章
3521

瀏覽量
50431
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1224

瀏覽量
25449

原文標(biāo)題：Stability AI發(fā)布AI音頻平臺Stable Audio

文章出處：【微信號：IEEE_China，微信公眾號：IEEE電氣電子工程師】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

IEEE電氣電子工程師
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個人主頁

Hot 經(jīng)久不衰的魅力來自輝光數(shù)碼管豐富多彩的歷史
Hot 《覺醒》是世界上第一款由大腦控制的虛擬現(xiàn)實(shí)游戲

New IEEE新突破：數(shù)學(xué)解法引領(lǐng)光子晶體激光器創(chuàng)新
New 極簡電子墨水屏設(shè)備:廉價智能手機(jī)的創(chuàng)新替代品

精選推薦
更多

文章

資料

帖子

AI通話的N種新玩法，讓科幻照進(jìn)現(xiàn)實(shí)

腦極體
23小時前

499 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（2）

三菱電機(jī)半導(dǎo)體
11小時前

389 閱讀

三菱電機(jī)SiC DIPIPM在變頻家電中的應(yīng)用（1）

三菱電機(jī)半導(dǎo)體
11小時前

382 閱讀

英飛凌TLD7002-16 OTP PRG的常見問題解析

駿龍電子
11小時前

330 閱讀

DC/DC轉(zhuǎn)換器電路板安裝過程中的焊接技巧與導(dǎo)通檢查要點(diǎn)

駿龍電子
11小時前

393 閱讀

怎樣使用運(yùn)算放大器

jinkeyyin
3

免費(fèi)

0下載

基于LTM8067_Typical Application直流到直流單輸出電源的參考設(shè)計

胡秋陽
0.87 MB

2積分

11下載

基于openharmony適配移植的列表控件封裝教程

姚小熊27
0.27 MB

免費(fèi)

0下載

Jajuk音樂播放和管理軟件

小芳
30.54 MB

免費(fèi)

0下載

AresDB基于GPU運(yùn)算的實(shí)時分析存儲引擎和查詢引擎

xymbmcu
11.47 MB

免費(fèi)

0下載

【VisionFive 2單板計算機(jī)試用體驗】3、開源大語言模型部署

左岸cpx
20小時前

68 閱讀

【M-K1HSE開發(fā)板免費(fèi)體驗】DevEco Studio應(yīng)用開發(fā)體驗(物理機(jī)器運(yùn)行失敗)

jf_1137202360
20小時前

46 閱讀

【RA-Eco-RA6M4開發(fā)板評測】開箱、Hello World（串口+OLED）

jf_57061047
20小時前

74 閱讀

省錢+環(huán)保+個性：打造一臺永不“過時”的自定義電腦！

早知
1天前

472 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗】+溫度大氣壓檢測及顯示

jinglixixi
1天前

651 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

搜索歷史

Stability AI推出Stable audio的文本到音頻生成人工智能平臺

評論