三百六十行,行行出狀元。在眾多行業(yè)中有這么一個(gè)行業(yè)迎來(lái)了一位“新人”——微軟小冰。
作為一款人工智能伴侶虛擬機(jī)器人的小冰,去了歌唱界。不僅發(fā)表個(gè)人單曲,還參與作詞作曲,經(jīng)歷了五次迭代的微軟小冰,現(xiàn)在已經(jīng)成為一個(gè)會(huì)作曲會(huì)唱歌的全能型藝人。
▌作曲寫詩(shī)寫詞樣樣精通
2017 年,微軟出版了一本由小冰原創(chuàng)的詩(shī)集《陽(yáng)光失了玻璃窗》,這是第一部 100% 由人工智能創(chuàng)造的詩(shī)集。在寫詩(shī)之后,小冰還創(chuàng)作不同類型的文體,填詞,唱歌,發(fā)表個(gè)人單曲等。
據(jù)介紹,小冰創(chuàng)作的基本原理有兩大塊,一塊是他需要學(xué)習(xí)前人的作品,包括上千位詩(shī)人的詩(shī)集、上千萬(wàn)行歌詞等等。第一步,訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的模型;第二步,有了一定的模型之后,需要給她一個(gè)觸發(fā)源,工程師們稱為創(chuàng)作沖動(dòng)。
創(chuàng)作沖動(dòng)有不同的方式,給出一張圖片或文字,基于圖片里的元素或文字內(nèi)容的理解去創(chuàng)作,例如知乎上的海量回答,學(xué)習(xí)知乎預(yù)料大數(shù)據(jù)作為觸發(fā)源,基于一個(gè)訓(xùn)練好的模型,生成對(duì)應(yīng)的歌詞。
值得注意的是,在小冰發(fā)布的單曲中,還聽(tīng)到有模擬真人呼吸的聲音,據(jù)微軟(亞洲)互聯(lián)網(wǎng)工程院微軟小冰首席語(yǔ)音科學(xué)家欒劍表示,主要是因?yàn)榭紤]到大眾的習(xí)慣,沒(méi)有換氣可能會(huì)讓人聽(tīng)著感覺(jué)很累,因?yàn)橛行r(shí)候發(fā)燒友會(huì)跟著哼唱,沒(méi)有呼吸換氣的地方,會(huì)覺(jué)得不太舒服。
在技術(shù)上實(shí)現(xiàn)呼吸換氣主要分為兩個(gè)模塊,第一個(gè)模塊,首先要預(yù)測(cè)什么地方會(huì)有呼吸的聲音,第二個(gè)模塊,怎么樣把呼吸的聲音生成出來(lái)。
關(guān)于第一個(gè),人類有兩種呼吸,一個(gè)是這個(gè)歌到了一個(gè)休止符,在語(yǔ)意的地方需要一個(gè)停頓;還有一種,這首歌可能節(jié)奏很快,中間沒(méi)有任何的停頓,這時(shí)候人類的歌手必須要在某個(gè)地方換一下氣,不然的話,人類的肺活量支撐不了。
關(guān)于換氣的聲音,其實(shí)換氣的聲音有點(diǎn)類似于人類的聲音,它就是一種沒(méi)有聲帶振蕩的聲音,我們可以把他作一種中文語(yǔ)言系統(tǒng)以外的一種新的發(fā)言的因素去建模。
▌最早實(shí)現(xiàn)全雙工對(duì)話
在 2016 年的 9 月份,微軟小冰就開(kāi)始真正的給人類打電話,到目前為止,打了超過(guò) 60 萬(wàn)通電話。在通話過(guò)程中會(huì)增加“嗯”、“啊”這樣的語(yǔ)氣詞,給人的感覺(jué)更像真人,并且做到了全雙工對(duì)話,可以互相打斷,真正做到雙方互動(dòng)的聊天。
另外,小冰運(yùn)用的領(lǐng)域是一個(gè)很開(kāi)放的領(lǐng)域。她實(shí)際上跟用戶在溝通的過(guò)程中話題,內(nèi)容,都是可以雙方提出來(lái)的。不僅是小冰拋出一個(gè)話題,就限定在這個(gè)話題里聊,而是隨時(shí)可以根據(jù)對(duì)方拋出的新話題去聊。
據(jù)欒劍介紹,小冰這種開(kāi)放領(lǐng)域的聊天難度上會(huì)更大一些。首先上下文大篇幅的語(yǔ)義理解在業(yè)界和學(xué)術(shù)界都是一個(gè)很難的課題,比如在寫詩(shī)的時(shí)候,有時(shí)候的用詞比較古怪,或者語(yǔ)句之間不太通順,但實(shí)際上可能存在有一種潛在的邏輯。
也遇到了一個(gè)技術(shù)的瓶頸,語(yǔ)意理解像是一個(gè)黑盒子,這個(gè)黑盒子,會(huì)收入一些內(nèi)容也會(huì)反饋一些內(nèi)容,反饋的內(nèi)容給人的感覺(jué)好像是理解了,但實(shí)際上他是不是真正理解了,是沒(méi)有辦法判斷的。
人也是這樣,在實(shí)際對(duì)話過(guò)程中,更多的是先給個(gè)輸入,然后給個(gè)輸出,再根據(jù)這個(gè)輸出來(lái)判斷他是不是真正理解了,但實(shí)際上這里面是有一定的套路存在的,你去判斷他是不是理解,可能是很困難的,因?yàn)槔锩娌](méi)有一個(gè)那么直觀的東西存在。
▌AI 的三個(gè)層次:運(yùn)算智能、感知智能、認(rèn)知智能
第一層,運(yùn)算智能,像算盤一樣;
第二層,感知智能,能夠感知到一個(gè)物品是什么;現(xiàn)在大多數(shù)的 AI,包括語(yǔ)音、圖象等還是停留感知智能層次上;
第三層,認(rèn)知智能;像人一樣,知道是什么,還知道為什么這樣,還可以推理,這個(gè)層次較難。
說(shuō)到底,AI 的創(chuàng)造力和人類的創(chuàng)造力之間有什么差別呢?
微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能創(chuàng)造事業(yè)部副總經(jīng)理袁晶表示,人的左腦更加偏向于計(jì)算;人的右腦是偏向創(chuàng)造力,發(fā)散思維,現(xiàn)在希望用計(jì)算的方式,讓 AI 用左腦的方式去模擬右腦的行為。
換句話講,這種創(chuàng)造在人里面只有頂尖的藝術(shù)家才能干,但是放到 AI 上,就相當(dāng)于可以簡(jiǎn)化這個(gè)學(xué)習(xí)和訓(xùn)練的過(guò)程了。
相當(dāng)于說(shuō),讓她去擬合人類創(chuàng)作者的創(chuàng)作過(guò)程,并且能以這樣的能力去幫助普通人去做一些創(chuàng)造,因?yàn)槊總€(gè)人都想去做一些創(chuàng)作的行為,只不過(guò)說(shuō)限于自己的能力,AI 能夠做到相當(dāng)于他的助手,幫助普通人,享受創(chuàng)作的樂(lè)趣。比如她可以和你一起為你新出生的孩子、或你的戀人寫首情詩(shī),也可能為你爸爸的生日創(chuàng)作一首歌曲等。
▌未來(lái)小冰將嘗試更多內(nèi)容領(lǐng)域的創(chuàng)作
袁晶表示,未來(lái)會(huì)漸漸讓小冰去嘗試往內(nèi)容生成的領(lǐng)域做一些探索,可能半年一年,很多別的公司或者機(jī)構(gòu),也會(huì)跟隨這個(gè)趨勢(shì)去做類似這樣的事情。
在袁晶看來(lái),人工智能在內(nèi)容領(lǐng)域有一些新的能力或者突破可能將會(huì)是未來(lái)的一個(gè)方向,所以也會(huì)往這個(gè)方向不斷的去做一些嘗試,包括聲音、文字、圖像等三個(gè)方面,AI 未來(lái)會(huì)充當(dāng)協(xié)助角色,幫助人類的創(chuàng)作者,去更好更快更高效的創(chuàng)作內(nèi)容。
首先 AI 創(chuàng)造的成本是很低的,要比人類的創(chuàng)造成本低很多。比如讀故事,當(dāng)我們找配音員去讀這個(gè)故事,他可能要付出一定的成本,但是如果聲音的模型訓(xùn)練好了之后可以大批量的生成,成百上千個(gè)小時(shí)的大量的用戶,所以他的成本會(huì)攤薄到很低。
小冰的聲音技術(shù)里面增加了一些韻律和風(fēng)格的變換,使得她可以去模仿人類創(chuàng)作者,在各種場(chǎng)景下面做各種不同的演藝。而機(jī)器人可以非常真實(shí)的模擬人聲,讓很多人有各種各樣的顧慮。
欒劍表示,小冰聲音的生成和使用的過(guò)程都是嚴(yán)格受控的,將來(lái)提供服務(wù)的時(shí)候,模型本身,以及合成的引擎本身,另外,小冰之前給人類打電話已經(jīng)打了60萬(wàn)個(gè),小冰都會(huì)先申明身份,明確告訴用戶我們是微軟小冰。微軟設(shè)有專門的人工智能的委員會(huì),防止人類利用人工智能技術(shù)去做傷害他人和社會(huì)的事情。
-
機(jī)器人
+關(guān)注
關(guān)注
213文章
29729瀏覽量
212822 -
人工智能
+關(guān)注
關(guān)注
1806文章
49011瀏覽量
249331
原文標(biāo)題:微軟小冰作詞又作曲,網(wǎng)友:要出道的節(jié)奏嗎?
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
工業(yè)機(jī)器人工作站的建設(shè)意義
虹科亮相第六屆粵港澳機(jī)器人與人工智能大會(huì)
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】2.具身智能機(jī)器人大模型
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)
《具身智能機(jī)器人系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器人系統(tǒng)背景知識(shí)與基礎(chǔ)模塊
從市場(chǎng)角度對(duì)機(jī)器人的基本解讀

人工智能機(jī)器人關(guān)節(jié)控制板BGA芯片底部填充用膠方案

評(píng)論