近年來隨著深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,機(jī)器翻譯也取得了長足的進(jìn)步。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)越來越復(fù)雜,但我們始終無法解釋內(nèi)部發(fā)生了什么,“黑箱問題”一直困擾著我們。我們不清楚程序在翻譯過程中如何進(jìn)行決策,所以當(dāng)翻譯出錯(cuò)時(shí)也很難改正。隨著深度學(xué)習(xí)在各行各業(yè)中的廣泛應(yīng)用,深度學(xué)習(xí)的不可解釋性已經(jīng)成為其面臨的嚴(yán)峻挑戰(zhàn)之一。
今年,在德國柏林舉辦的 IEEE VAST 可視化分析大會(huì)上,來自 IBM 和哈佛大學(xué)的研究人員展示了為解決翻譯中的 AI 黑盒問題所開發(fā)的調(diào)試工具。這款名為 Seq2Seq-Vis 的工具能將人工智能的翻譯過程進(jìn)行可視化,方便開發(fā)人員對(duì)模型進(jìn)行調(diào)試。
Seq2Seq-Vis 主要針對(duì)機(jī)器翻譯中最常用的 Seq2Seq模型。這一模型能夠?qū)⑷我忾L度的序列,也就是原文的句子,映射到目標(biāo)語言。除了機(jī)器翻譯任務(wù),在自動(dòng)問答、文本摘要等任務(wù)中也都主要應(yīng)用 Seq2Seq模型。
簡單來說,Seq2Seq模型在機(jī)器翻譯中的工作原理就是把源語言映射到目標(biāo)語言,得到了目標(biāo)語言的序列(也就是初步翻譯完的句子)后再進(jìn)行優(yōu)化,保證語法和語義上的正確。雖然使用神經(jīng)網(wǎng)路模型后,機(jī)器翻譯的結(jié)果得到了很大的提升,但同時(shí)也非常復(fù)雜。
可視化機(jī)器翻譯的過程
研究人員稱研發(fā) Seq2Seq-Vis 的初衷是想有一個(gè)類似于基于規(guī)則的傳統(tǒng)翻譯軟件中的規(guī)則表,這樣開發(fā)人員可以通過在規(guī)則表中對(duì)照得到錯(cuò)誤信息就可以很簡單地修改模型。
Seq2Seq-Vis.io 網(wǎng)站上給出了一個(gè)從德語到英語的演示程序。德語的“die l?ngsten reisen fangen an , wenn es auf den stra?en dunkel wird.”翻譯成英語應(yīng)該是“The longest journeys begin when it gets dark in the streets.”,但被機(jī)器翻譯成了“the longest travel begins when it gets to the streets.”Seq2Seq-Vis 以可視化的方式呈現(xiàn)出了序列到序列模型翻譯的每一步,這樣用戶就能像查找規(guī)則表一樣來找出機(jī)器翻譯翻譯錯(cuò)誤的原因。
Seq2Seq-Vis 另一個(gè)很有用的功能是它能找出與某個(gè)字詞相關(guān)的訓(xùn)練集,這也是解決 AI 黑盒問題的一大難點(diǎn)。其實(shí)一個(gè)機(jī)器學(xué)習(xí)模型除了訓(xùn)練集一無所知,所以要解決機(jī)器翻譯中的錯(cuò)誤最終都要回到訓(xùn)練集中去。
將機(jī)器翻譯過程可視化,用戶就能確定翻譯出錯(cuò)到底是編碼器解碼器使用的訓(xùn)練樣本出了錯(cuò)還是注意力模型的設(shè)置或者其他環(huán)節(jié)出錯(cuò)了。
更正序列到序列模型
Seq2Seq-Vis 并不是第一個(gè)試圖解決 AI 黑盒問題的工具,之前有很多大公司和研究機(jī)構(gòu)都有進(jìn)行嘗試,甚至 IBM 自己也在這上面下過功夫。事實(shí)上,很多類似的工具需要的信息比 Seq2Seq-Vis 更少,比如有的工具只需要神經(jīng)網(wǎng)絡(luò)的輸出就可以,而 Seq2Seq-Vis 還需要訓(xùn)練集,整個(gè)模型的架構(gòu)和設(shè)置。但 Seq2Seq-Vis 卻是第一個(gè)既能可視化模型的決策過程也能讓開發(fā)人員直接修改模型的工具。開發(fā)人員可以通過可視化的方式對(duì)模型的決策過程進(jìn)行修改并觀察反饋來實(shí)現(xiàn)探索式的調(diào)試,比如修改輸出序列的單詞或者對(duì)注意力模型的配置進(jìn)行修改。
聽起來是不是很酷,不過Seq2Seq-Vis 的目標(biāo)群體是模型架構(gòu)師或工程師而非機(jī)器翻譯的終端用戶。因?yàn)橐屵@一工具真正發(fā)揮作用需要用戶對(duì)“序列到序列”模型有較為深入的了解。雖然目標(biāo)這一工具還只是應(yīng)用在IBM的內(nèi)部項(xiàng)目中,但它是開源的,所以大家都可以來試試。
-
人工智能
+關(guān)注
關(guān)注
1806文章
48996瀏覽量
249195 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8501瀏覽量
134562 -
機(jī)器翻譯
+關(guān)注
關(guān)注
0文章
140瀏覽量
15191
原文標(biāo)題:開源 | IBM、哈佛共同研發(fā):Seq2Seq模型可視化工具
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
VirtualLab Fusion應(yīng)用:3D系統(tǒng)可視化
可視化組態(tài)物聯(lián)網(wǎng)平臺(tái)是什么
函數(shù)HAL_I2C_Slave_Seq_Transmit_IT和HAL_I2C_Slave_Seq_Receive_IT實(shí)現(xiàn)代碼里有處理DMA請求,這是出于什么考慮?
VirtualLab Fusion中的可視化設(shè)置
VirtualLab Fusion應(yīng)用:光波導(dǎo)k域布局可視化(“神奇的圓環(huán)”)
七款經(jīng)久不衰的數(shù)據(jù)可視化工具!
光學(xué)系統(tǒng)的3D可視化
智慧能源可視化監(jiān)管平臺(tái)——助力可視化能源數(shù)據(jù)管理

焊接過程可視化的應(yīng)用前景有哪些

《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感
AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
名單公布!【書籍評(píng)測活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新
工業(yè)數(shù)據(jù)可視化管理平臺(tái)是什么
【飛凌嵌入式】基于RK3576的電力站房智能輔助與人工智能可視化網(wǎng)關(guān)方案

評(píng)論