人工智能擊敗人類這個(gè)話題在今天已經(jīng)沒(méi)什么新鮮感了。28年前《終結(jié)者2》上映時(shí),天網(wǎng)和終結(jié)者代表的人工智能還是遙遠(yuǎn)未來(lái)撒到現(xiàn)實(shí)中的水滴:電影中計(jì)算機(jī)科學(xué)家偷師終結(jié)者從40年后帶來(lái)的芯片,能做的工作就是在設(shè)計(jì)一種全新結(jié)構(gòu)的處理器芯片,也就是說(shuō)還是在尋求算力的突破。以現(xiàn)在計(jì)算機(jī)科學(xué)的眼光來(lái)看,離人工智能的距離實(shí)在有點(diǎn)遠(yuǎn)。
不過(guò)也不能難為作為編劇的詹姆斯·卡梅隆?!督K結(jié)者2》之前沒(méi)幾年的1986年,美國(guó)國(guó)家科學(xué)基金會(huì)創(chuàng)建的大學(xué)骨干網(wǎng)NSFNET作為未來(lái)互聯(lián)網(wǎng)的基礎(chǔ)剛剛誕生,1990年才正式商用。1991年影片上映那年,萬(wàn)維網(wǎng)之父蒂姆·伯納斯-李剛剛在歐洲核子研究中心寫(xiě)出HTTP協(xié)議的最初版本,離真的WWW全球網(wǎng)絡(luò)大范圍進(jìn)入民用至少還要5年時(shí)間左右。
于是,至少在《終結(jié)者2》中,依然看不到任何互聯(lián)網(wǎng)的影子,離基于云計(jì)算和網(wǎng)絡(luò)的現(xiàn)代人工智能那就更遠(yuǎn)了。
這30年,其實(shí)是人類世界其實(shí)發(fā)生巨大變化的30年。在互聯(lián)網(wǎng)變成日常生活的一部分之后,人工智能看起來(lái)也正在往這個(gè)趨勢(shì)發(fā)展。每一個(gè)手機(jī)應(yīng)用和服務(wù)似乎都有點(diǎn)人工智能的成分,每個(gè)公司的宣發(fā)似乎都在說(shuō)人工智能的布局和未來(lái)。
實(shí)際上,人工智能現(xiàn)在的意思,比它剛剛誕生時(shí)要更大一些。當(dāng)年的人工智能更多的是指像終結(jié)者這樣的高級(jí)的、通用的、完全模擬人類意識(shí)的強(qiáng)人工智能,而如今的人工智能有了更多自動(dòng)化、自主學(xué)習(xí)方面的微觀涵義。
但這并不是說(shuō)AI變得不重要了,恰恰相反,被擴(kuò)展了含義的人工智能正在深入整個(gè)IT行業(yè),并且在不斷創(chuàng)造全新的場(chǎng)景和價(jià)值。聯(lián)想也是重要的參與者,并且正在學(xué)術(shù)和應(yīng)用領(lǐng)域取得突破。
就在剛剛過(guò)去的9月,聯(lián)想集團(tuán)旗下推進(jìn)技術(shù)未來(lái)發(fā)展的聯(lián)想研究院,在人工智能領(lǐng)域剛剛?cè)〉萌?xiàng)大獎(jiǎng):
“自動(dòng)自然語(yǔ)言理解”算法獲獎(jiǎng):讓人工智能來(lái)訓(xùn)練人工智能
9月初結(jié)束的2019世界人工智能大會(huì)(WAIC)黑客馬拉松中,來(lái)自聯(lián)想研究院人工智能實(shí)驗(yàn)室智能算力平臺(tái)組的參賽團(tuán)隊(duì),在自動(dòng)自然語(yǔ)言理解(AutoNLP)賽道中首秀即獲得了決賽二等獎(jiǎng) (第二名)的戰(zhàn)績(jī)。
本次AutoNLP比賽要求參賽隊(duì)伍在不同內(nèi)容主題、不同語(yǔ)言的混合字符、文本集里,不借助任何離線或在線算力優(yōu)勢(shì),進(jìn)行代碼設(shè)計(jì),并在規(guī)定時(shí)間內(nèi)完成全自動(dòng)文本分類。這其中存在著不少的挑戰(zhàn),比如單樣本長(zhǎng)度和數(shù)據(jù)集樣本量差異巨大;任務(wù)的類別數(shù)不定,且類別間可能極度不均衡,不同類樣本比率可能達(dá)到數(shù)千比一;對(duì)系統(tǒng)泛化能力要求極高等。
聯(lián)想研究院提交的方案是自動(dòng)化機(jī)器學(xué)習(xí)應(yīng)用于自然語(yǔ)言理解,方案采取了輕量級(jí)元學(xué)習(xí)思路下的自動(dòng)化深度學(xué)習(xí)框架。方案具有通用性和自適應(yīng)性,基于數(shù)據(jù)特征和任務(wù)元特征來(lái)進(jìn)行自動(dòng)學(xué)習(xí),避免在測(cè)試任務(wù)上的過(guò)擬合。
簡(jiǎn)單的說(shuō),此次獲獎(jiǎng)的算法所在的自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)是人工智能發(fā)展的新階段,它可以讓缺乏資源的公司和團(tuán)體可以以更低的門檻、甚至零門檻設(shè)計(jì)自然語(yǔ)言識(shí)別機(jī)器學(xué)習(xí)算法,從長(zhǎng)遠(yuǎn)戰(zhàn)略意義上說(shuō),自動(dòng)化機(jī)器學(xué)習(xí)是邁向強(qiáng)人工智能的必經(jīng)階段,是人工智能研究重要的戰(zhàn)略高地。
全國(guó)知識(shí)圖譜大賽第一名:讓AI讀懂人類世界的關(guān)鍵
同樣是在9月初,聯(lián)想研究院人工智能團(tuán)隊(duì)在全國(guó)知識(shí)圖譜與計(jì)算大會(huì)上取得了“人物關(guān)系抽取比賽”的第一名,以及“短文本實(shí)體鏈指比賽”的第二名。
所謂的知識(shí)圖譜,就是讓計(jì)算機(jī)理解人類詞匯、語(yǔ)句中的邏輯和知識(shí)性練習(xí)。舉例來(lái)說(shuō),想讓AI給你介紹一款新電腦,AI就必須知道這款電腦的參數(shù)、性能、售價(jià)、周邊知識(shí)等等在內(nèi)的所有聯(lián)系,這就是知識(shí)圖譜。完成這樣的訓(xùn)練,你問(wèn)任何一個(gè)和產(chǎn)品有關(guān)的問(wèn)題,AI都能給正確的答案。
當(dāng)然了,實(shí)際應(yīng)用的大多數(shù),可能都比介紹產(chǎn)品這樣的案例要更復(fù)雜。聯(lián)想研究院此次獲獎(jiǎng)的人物關(guān)系抽取比賽,就是讓計(jì)算機(jī)讀懂人類的社會(huì)結(jié)構(gòu)。
此次的人物關(guān)系抽取比賽任務(wù)包含35個(gè)類別,包括夫妻,長(zhǎng)輩,晚輩,同輩,其他親戚;以及老師、學(xué)生,戀人,朋友等。人物類型非常多元,包括歷史名人、政治人物、娛樂(lè)明星、小說(shuō)人物等,還包括部分外國(guó)人物。
算法可以實(shí)現(xiàn)的效果就是,AI讀到“賈玲師從相聲表演藝術(shù)家馮鞏”這句話,就知道他們是師徒的關(guān)系。
而短文本實(shí)體鏈指比賽,則是要求對(duì)于給定的一個(gè)中文短文本(如搜索Query、微博、用戶對(duì)話內(nèi)容、文章標(biāo)題等),識(shí)別出其中的實(shí)體,并與給定知識(shí)庫(kù)中的對(duì)應(yīng)實(shí)體進(jìn)行關(guān)聯(lián)。ERL整個(gè)過(guò)程包括實(shí)體識(shí)別和實(shí)體鏈指兩個(gè)子任務(wù)。
比如看到一條新聞“比特幣吸粉無(wú)數(shù),但央行的心另有所屬|(zhì)界面新聞 · jmedia”之后,可以輸出“比特幣、央行、界面新聞”這幾個(gè)有價(jià)值的知識(shí)實(shí)體詞匯。
簡(jiǎn)單地說(shuō),理解人物關(guān)系和知識(shí)的結(jié)構(gòu),同樣是人工智能未來(lái)發(fā)展的重要工具和方向。
副語(yǔ)言語(yǔ)音屬性評(píng)測(cè)國(guó)際第一:讓AI讀懂人類的話里有話
在9月底閉幕的國(guó)際語(yǔ)音盛會(huì)Interspeech2019上,聯(lián)想研究院AI Lab語(yǔ)音團(tuán)隊(duì)和昆山杜克大學(xué)的DKU-LENOVO聯(lián)合系統(tǒng)在今年的副語(yǔ)言語(yǔ)音屬性評(píng)測(cè)中(ComParE2019,The Interspeech 2019 Computational Paralinguistics ChallengE )奪得冠軍。
ComParE是Interspeech系統(tǒng)評(píng)測(cè)之一,從2009開(kāi)始已經(jīng)連續(xù)舉辦十年,在語(yǔ)音領(lǐng)域?qū)儆谥亓考?jí)評(píng)測(cè)。語(yǔ)音是語(yǔ)言的聲音表現(xiàn)形式,不僅包含了語(yǔ)言語(yǔ)義信息,同時(shí)也傳達(dá)了說(shuō)話人、語(yǔ)種、性別、年齡、情感、信道、嗓音、病理、生理、心理等多種豐富的副語(yǔ)言語(yǔ)音屬性信息。
ComParE的目的就是根據(jù)語(yǔ)音信號(hào),識(shí)別或檢測(cè)各類副語(yǔ)言語(yǔ)音屬性,比如情感識(shí)別、哭聲檢測(cè)、嗓音病理識(shí)別、方言語(yǔ)種識(shí)別等,每年都會(huì)有不同任務(wù)。今年參賽單位有20多家,包括Idiap Research Institute、CMU、慕尼黑大學(xué)、***清華大學(xué)等眾多知名研究機(jī)構(gòu)。
DUK-LENOVO系統(tǒng)參加了鯨魚(yú)叫聲檢測(cè)項(xiàng)目,主辦方提供部分包含鯨魚(yú)叫聲的語(yǔ)音作為訓(xùn)練數(shù)據(jù),大家在共同的測(cè)試集上檢測(cè)聲音信號(hào)中是否包含鯨魚(yú)叫聲。通過(guò)采用數(shù)據(jù)擴(kuò)展、多特征融合以及基于Fish vector的deep embedding技術(shù),DKU-LENOVO提交系統(tǒng)在測(cè)試集上達(dá)到94.8%的正確率,顯著優(yōu)于官方提供的86.6%的基線和其他單位系統(tǒng),穩(wěn)居第一。
這三項(xiàng)人工智能領(lǐng)域的大獎(jiǎng)只是聯(lián)想研究院和人工智能團(tuán)隊(duì)取得成績(jī)的一小部分。實(shí)際上過(guò)去一年多,團(tuán)隊(duì)已經(jīng)獲得了超過(guò)14個(gè)全球性人工智能競(jìng)賽的大獎(jiǎng)和最佳論文,顯示了極高的算法水平和開(kāi)發(fā)管理能力
而聯(lián)想研究院人工智能團(tuán)隊(duì)的成果,早已開(kāi)始為公司運(yùn)營(yíng)提升效能,改進(jìn)運(yùn)營(yíng)水平,擴(kuò)大盈利空間。舉例來(lái)說(shuō),聯(lián)想的工廠生產(chǎn)、售后維修保障、公司內(nèi)部運(yùn)營(yíng)都已經(jīng)部署了聯(lián)想研究院自行開(kāi)發(fā)的AI技術(shù)。而且下一步,聯(lián)想作為中國(guó)智能制造的使能者與賦能者,這些AI解決方案正在為其他行業(yè)與公司提供變革的力量。
-
聯(lián)想
+關(guān)注
關(guān)注
3文章
2688瀏覽量
63691 -
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249655 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134648
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論