不久之前,人們還常說,計(jì)算機(jī)視覺的辨別能力尚不如一歲大的孩子。如今看來,這句話要改寫了。計(jì)算機(jī)不僅能和大多數(shù)成年人一樣識別圖片中的物體,在馬路上駕駛汽車的安全性還高過16 歲的青少年。更神奇的是,如今的計(jì)算機(jī)不再是被動按照指令識別和駕駛,而是像自然界的生命由數(shù)百萬年前開始進(jìn)化那樣,自主地從經(jīng)驗(yàn)中學(xué)習(xí)。是數(shù)據(jù)的井噴促成了這一技術(shù)進(jìn)步。如果說數(shù)據(jù)是新時(shí)代的石油,那么學(xué)習(xí)算法就是從中提取信息的煉油廠;信息積累成知識;知識深化成理解;理解演變?yōu)橹腔?。歡迎來到深度學(xué)習(xí)的新世界。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它根植于數(shù)學(xué)、計(jì)算機(jī)科學(xué)和神經(jīng)科學(xué)。深度網(wǎng)絡(luò)從數(shù)據(jù)中學(xué)習(xí),就像嬰兒了解周圍世界那樣,從睜開眼睛開始,慢慢獲得駕馭新環(huán)境所需的技能。深度學(xué)習(xí)的起源可以追溯到20 世紀(jì)50 年代人工智能的誕生。關(guān)于如何構(gòu)建人工智能。
當(dāng)時(shí)存在兩種不同的觀點(diǎn):一種觀點(diǎn)主張基于邏輯和計(jì)算機(jī)程序,曾主宰人工智能的研究和應(yīng)用數(shù)十年;另一種觀點(diǎn)則主張直接從數(shù)據(jù)中學(xué)習(xí),經(jīng)歷了更長時(shí)間的摸索才逐漸成熟。
20 世紀(jì),計(jì)算機(jī)技術(shù)還不夠成熟,而且按照現(xiàn)在的標(biāo)準(zhǔn),數(shù)據(jù)存儲成本十分高昂,用邏輯程序來解決問題更加高效。熟練的程序員需要為每個(gè)不同的問題編寫不同的程序,問題越大,相應(yīng)的程序也就越復(fù)雜。如今,計(jì)算機(jī)能力日趨強(qiáng)大,數(shù)據(jù)資源也變得龐大且豐富,使用學(xué)習(xí)算法解決問題比以前更快、更準(zhǔn)確,也更高效。此外,同樣的學(xué)習(xí)算法還能用來解決許多不同的難題,這遠(yuǎn)比為每個(gè)問題編寫不同的程序更加節(jié)省人力。
汽車新生態(tài):無人駕駛將全面走入人們生活
在2005 年美國國防部高級研究計(jì)劃局( 以下簡稱DARPA)舉辦的自動駕駛挑戰(zhàn)賽中,一輛由斯坦福大學(xué)塞巴斯蒂安·特?。⊿ebastian Thrun)實(shí)驗(yàn)室開發(fā)的自動駕駛汽車Stanley最終贏得了200萬美元現(xiàn)金大獎。團(tuán)隊(duì)利用了機(jī)器學(xué)習(xí)技術(shù)教它如何自主地在加利福尼亞州的沙漠中穿行。132 英里的賽道中有若干狹窄的隧道和急轉(zhuǎn)彎,還包括啤酒瓶道(Beer Bottle Pass),這是一段蜿蜒曲折的山路,兩側(cè)分別是碎石遍布的陡坡和斷壁。特隆并沒有遵循傳統(tǒng)的AI 方法,即通過編寫計(jì)算機(jī)程序來應(yīng)付各種偶發(fā)事件,而是在沙漠中駕駛Stanley,讓汽車根據(jù)視覺和距離傳感器的感應(yīng)輸入,學(xué)習(xí)如何像人一樣駕駛。
特隆后來參與創(chuàng)立了高科技項(xiàng)目重點(diǎn)實(shí)驗(yàn)室Google X,并開始了進(jìn)一步研究自動駕駛汽車技術(shù)的計(jì)劃。谷歌的自動駕駛汽車自此開始,在舊金山灣區(qū)累積了350 萬英里的車程。優(yōu)步(Uber)已經(jīng)在匹茲堡投放了一批自動駕駛汽車。蘋果也步入自動駕駛領(lǐng)域,以擴(kuò)大其操作系統(tǒng)控制的產(chǎn)品范圍,并希望能夠再現(xiàn)它在手機(jī)市場上的輝煌。汽車制造商們親眼看見一個(gè)100 年來從未改變的行業(yè)在他們眼前發(fā)生了轉(zhuǎn)型,也開始奮起直追。通用汽車公司以10 億美元的價(jià)格并購了開發(fā)無人駕駛技術(shù)的硅谷創(chuàng)業(yè)公司Cruise Automation,并在2017 年投入了額外的6 億美元用于研發(fā)。2017年,英特爾以153 億美元的價(jià)格收購了Mobileye,它是一家專門為自動駕駛汽車研發(fā)傳感器和計(jì)算機(jī)視覺的公司。在價(jià)值數(shù)萬億美元的交通運(yùn)輸領(lǐng)域,參與的各方都下了極高的賭注。
自動駕駛汽車不久將擾亂數(shù)百萬卡車司機(jī)和出租車司機(jī)的生計(jì)。最終,如果一輛自動駕駛汽車能夠在一分鐘內(nèi)出現(xiàn),將你安全帶到目的地且無須停車,在城市擁有汽車就顯得不那么必要了。今天,汽車行駛時(shí)間平均僅占4%,這意味著它其余96% 的時(shí)間都需要停放在某個(gè)地方。由于自動駕駛汽車可以在城市外圍維修和停放,城市中被大量停車場占用的空間得以被重新高效利用。城市規(guī)劃者已經(jīng)開始考慮讓停車場變成公園了。街邊的停車道可以成為真正的自行車道。其他汽車相關(guān)行業(yè)也將受到影響,包括汽車保險(xiǎn)業(yè)和修理廠。超速和停車罰單將不復(fù)存在。由醉駕和疲勞駕駛導(dǎo)致的交通事故死亡人數(shù)也會相應(yīng)減少。通勤浪費(fèi)的時(shí)間也將被節(jié)省下來做其他事情。根據(jù)2014年的美國人口普查數(shù)據(jù),1.39 億上班族人均單日通勤時(shí)間達(dá)到了52分鐘,全年總計(jì)296 億小時(shí)。這驚人的340 萬年的時(shí)間本可以在人生中得到更好的利用。自動駕駛汽車會使公路通行能力翻兩番。而且,一旦大規(guī)模投入使用,沒有方向盤、可以自己開回家的自動駕駛汽車還會讓大規(guī)模汽車盜竊行為銷聲匿跡。雖然目前自動駕駛汽車仍面臨很多監(jiān)管和法律層面的障礙,但這一技術(shù)一旦開始普及,我們就將迎來一個(gè)嶄新的世界。可以預(yù)見的是,卡車大概會在10 年內(nèi)率先實(shí)現(xiàn)自動駕駛,出租車要花上15 年,而15 到25 年后,客運(yùn)無人車將全面走入人們的生活。
汽車在人類社會中的標(biāo)志性地位將以我們無法想象的方式發(fā)生變化,一種新的汽車生態(tài)也將應(yīng)運(yùn)而生。正如100 多年前汽車的出現(xiàn)創(chuàng)造了許多新的行業(yè)和就業(yè)機(jī)會,圍繞著自動駕駛汽車的發(fā)展,也出現(xiàn)了一個(gè)快速增長的生態(tài)系統(tǒng)。從谷歌獨(dú)立出來的自動駕駛公司W(wǎng)aymo,8年來已經(jīng)投入了10億美元,并在加州中部山谷搭建了一個(gè)秘密測試場所。該場所位于一個(gè)占地91 英畝的仿造小鎮(zhèn),其中還設(shè)計(jì)了騎自行車的“演員”和假的汽車事故。其目的是擴(kuò)大訓(xùn)練數(shù)據(jù)集以包含特殊和不常見的情況(也叫邊緣情況)。公路上罕見的駕駛事件經(jīng)常會導(dǎo)致事故。自動駕駛汽車的不同之處就在于,當(dāng)一輛汽車遇到罕見事件時(shí),相應(yīng)的學(xué)習(xí)體驗(yàn)會被傳遞給所有其他自動駕駛汽車,這是一種集體智能。其他自動駕駛汽車公司也在建造許多類似的測試設(shè)施。這些舉措創(chuàng)造了以前并不存在的新工作機(jī)會,以及用于汽車導(dǎo)航的傳感器和激光器的新供應(yīng)鏈。
自然語言翻譯:從語言到句子的飛躍
如今,谷歌在超過100 種服務(wù)中使用了深度學(xué)習(xí),包括街景視圖(Street View)、收件箱智能回復(fù)(Inbox Smart Reply)和語音搜索。幾年前,谷歌的工程師意識到他們需要將這些計(jì)算密集型應(yīng)用擴(kuò)展到云端。他們開始著手設(shè)計(jì)一種用于深度學(xué)習(xí)的專用芯片,并巧妙地設(shè)計(jì)了可以插入數(shù)據(jù)中心機(jī)架中的硬盤插槽的電路板。谷歌的張量處理單元(TPU)現(xiàn)在已配置在遍布全球的服務(wù)器上,讓深度學(xué)習(xí)應(yīng)用程序的性能得到了大幅改進(jìn)。
深度學(xué)習(xí)快速改變格局的一個(gè)例子是它對語言翻譯的影響。語言翻譯是人工智能的一只圣杯,因?yàn)樗蕾囉诶斫饩渥拥哪芰?。谷歌最近推出了基于深度學(xué)習(xí)的最新版谷歌翻譯(Google Translate),代表了自然語言翻譯質(zhì)量的重大飛躍。幾乎一夜之間,語言翻譯就從零散雜亂的拼湊短語,升級到了語意完整的句子。之前的計(jì)算機(jī)方法搜索的是可以被一并翻譯的詞匯組合,但深度學(xué)習(xí)會在整個(gè)句子中尋找詞匯之間的依賴關(guān)系。
下一步工作是訓(xùn)練更大規(guī)模的深度學(xué)習(xí)網(wǎng)絡(luò),針對段落來提高句子間的連貫性。文字背后都有悠久的文化歷史。俄裔作家和英文小說家,《洛麗塔》一書的作者弗拉基米爾·納博科夫(Vladimir Nabokov)曾經(jīng)得出結(jié)論,在不同語言之間翻譯詩歌是不可能的。他將亞歷山大·普希金(Aleksandr Pushkin)的詩體小說《葉甫蓋尼·奧涅金》(Eugene Onegin)直譯成了英文,并對這些詩文的文化背景做了解釋性腳注,以此論證他的觀點(diǎn)?;蛟S谷歌翻譯終有一天能夠通過整合莎士比亞的所有詩歌來翻譯他的作品。
語音識別:實(shí)時(shí)跨文化交流不再遙遠(yuǎn)
人工智能的另一只圣杯是語音識別。不久之前,計(jì)算機(jī)的獨(dú)立語音識別應(yīng)用領(lǐng)域還很有限,如機(jī)票預(yù)訂。而如今,限制已不復(fù)存在。2012 年,一名來自多倫多大學(xué)的實(shí)習(xí)生在微軟研究院(Microsoft Research)的一個(gè)夏季研究項(xiàng)目中,讓微軟的語音識別系統(tǒng)性能得到了顯著的提升。2016 年,微軟的一個(gè)團(tuán)隊(duì)宣布,他們開發(fā)的一個(gè)擁有120 層的深度學(xué)習(xí)網(wǎng)絡(luò)已經(jīng)在多人語音識別基準(zhǔn)測試中達(dá)到了與人類相當(dāng)?shù)乃健?/p>
這一突破性成果將在之后的幾年逐漸影響我們的社會,計(jì)算機(jī)鍵盤會被自然語言接口取代。隨著數(shù)字助手,如亞馬遜的Alexa、蘋果的Siri 以及微軟的Cortana 先后進(jìn)入千家萬戶,這種取代已經(jīng)在發(fā)生了。就如隨著個(gè)人電腦的普及,打字機(jī)退出了歷史舞臺,有一天電腦鍵盤也將成為博物館的展品。
當(dāng)語音識別和語言翻譯結(jié)合到一起時(shí),實(shí)時(shí)的跨文化交流將有可能實(shí)現(xiàn)。《星際迷航》中那種萬能翻譯機(jī)將觸手可及。為什么計(jì)算機(jī)語音識別和語言翻譯達(dá)到人類的水平要花這么久的時(shí)間?難道計(jì)算機(jī)的各種認(rèn)知能力同時(shí)進(jìn)入瓶頸期僅僅是巧合嗎?其實(shí)所有這些突破都源于大數(shù)據(jù)的出現(xiàn)。
AI 醫(yī)療:醫(yī)學(xué)診斷將更加準(zhǔn)確
l 深入皮膚
隨著機(jī)器學(xué)習(xí)的成熟并被應(yīng)用于可獲取大數(shù)據(jù)的許多其他問題,服務(wù)行業(yè)和其相關(guān)職業(yè)也將發(fā)生轉(zhuǎn)變?;跀?shù)百萬患者病情記錄的醫(yī)學(xué)診斷將變得更加準(zhǔn)確。最近的一項(xiàng)研究將深度學(xué)習(xí)運(yùn)用到了囊括超過2000 種不同疾病的13 萬張皮膚病學(xué)圖像中,這個(gè)醫(yī)學(xué)數(shù)據(jù)庫是以前的10 倍大。該研究的網(wǎng)絡(luò)被訓(xùn)練用于診斷“測試集”(test set,它從未見過的新圖像集)中的各種疾病。它在新圖像上的診斷表現(xiàn)與21 位皮膚科專家的結(jié)論基本一致,甚至在某些情況下還要更準(zhǔn)確。在不久的將來,任何一個(gè)擁有智能手機(jī)的人都可以拍下疑似皮膚病變的照片,并立即進(jìn)行診斷——而現(xiàn)在要完成同樣的過程,我們需要先去看醫(yī)生,耐心等待病變被專家篩查出來,然后再支付一大筆賬單。這一進(jìn)步將大大擴(kuò)大皮膚病護(hù)理的范圍,提升護(hù)理質(zhì)量。如果個(gè)體可以很快得到專家診斷,他們會在皮膚病的早期階段,也就是更容易治療的時(shí)候就開始就醫(yī)。借助深度學(xué)習(xí),所有的醫(yī)生都將更準(zhǔn)確地診斷罕見的皮膚病。
l 深入癌癥
如果專家在轉(zhuǎn)移性乳腺癌的淋巴結(jié)活檢切片圖像上判斷錯(cuò)誤,就有可能導(dǎo)致致命的后果。這是一種深度學(xué)習(xí)擅長的模式識別問題。實(shí)際上,一個(gè)經(jīng)過大量結(jié)論清晰的切片數(shù)據(jù)訓(xùn)練出來的深度學(xué)習(xí)網(wǎng)絡(luò)能達(dá)到0.925 的準(zhǔn)確度,還不錯(cuò),但還不及人類專家在同一測試集上達(dá)到的0.966。然而,把深度學(xué)習(xí)與人類專家的預(yù)測結(jié)合起來,準(zhǔn)確度達(dá)到了0.995,幾近完美。由于深度學(xué)習(xí)網(wǎng)絡(luò)和人類專家查看相同
的數(shù)據(jù)的方式不同,二者相結(jié)合的效果比單獨(dú)預(yù)測要好。這樣一來,更多的生命得以被挽救。這表明在未來,人類與機(jī)器將是合作而非競爭的關(guān)系。
l 深入睡眠
如果你有嚴(yán)重的睡眠問題(70% 的人一生中都會遇到這個(gè)問題),你要等待幾個(gè)月才能見到你的醫(yī)生(除非問題十分緊急),然后你會被轉(zhuǎn)到一個(gè)睡眠診所。在那里,你需要在身上接幾十個(gè)能在你入睡時(shí)記錄你的腦電圖(EEG)和肌肉活動的電極,接受徹夜觀察。每個(gè)晚上,你會先進(jìn)入慢波睡眠,然后定期進(jìn)入快速眼動(REM)睡眠,在此期間,你會做夢,但是失眠、睡眠呼吸暫停綜合征、不寧腿綜合征以及許多其他睡眠障礙會干擾這種睡眠模式。如果你在家里就很難入睡,那么在一張陌生的床上,全身接滿了讓人不安的醫(yī)療設(shè)備進(jìn)入睡眠狀態(tài),絕對算得上真正的挑戰(zhàn)。睡眠專家會查看你的腦電圖記錄,以30 秒為單位標(biāo)記睡眠階段,一段8 小時(shí)的睡眠要花幾個(gè)小時(shí)才能標(biāo)記完。而最終你會得到一份有關(guān)睡眠模式異常情況的報(bào)告,以及一份2000 美元的賬單。
依據(jù)1968 年由安東尼·雷希特施芬(Anthony Rechtshaffen)和艾倫·卡萊斯(Alan Kales)設(shè)計(jì)的系統(tǒng),睡眠專家將接受尋找表征不同睡眠階段特征跡象的培訓(xùn)。但是由于這些特征常常不明確,也不一致,只有75% 的情況下專家們能在數(shù)據(jù)解讀上達(dá)成一致。相比之下,我實(shí)驗(yàn)室之前的一名研究生菲利普·洛(Philip Low)使用無監(jiān)督機(jī)器學(xué)習(xí),花了不到一分鐘的計(jì)算機(jī)運(yùn)算時(shí)間,以3 秒的時(shí)間分辨率自動檢測睡眠階段,和87%的人類專家達(dá)成了一致的結(jié)論。此外,這種方式只需要在頭部的單個(gè)位置做記錄,用不到那些觸點(diǎn)和接線,也節(jié)省了大量佩戴和摘除的時(shí)間。2007 年,我們創(chuàng)立了一家公司Neurovigil,想將這項(xiàng)技術(shù)引入睡眠診所,但診所對此沒有表現(xiàn)出多大興趣,因?yàn)榭咳肆?biāo)注能產(chǎn)生更多的現(xiàn)金流。實(shí)際上,依據(jù)保險(xiǎn)號向患者開具賬單,會讓診所沒有動機(jī)采用更廉價(jià)的程序。Neurovigil 在大型制藥公司發(fā)現(xiàn)了另一個(gè)市場,這些公司在開展臨床試驗(yàn),需要測試他們的藥物對睡眠模式的影響。這項(xiàng)技術(shù)目前正在進(jìn)入長期護(hù)理設(shè)施市場,幫助解決在老年人中更普遍的進(jìn)行性睡眠問題。
睡眠診所模式是存在缺陷的,因?yàn)樵谶@樣的限制條件下不能可靠地診斷出健康問題:每個(gè)人的生理基數(shù)都不同,而偏離這個(gè)基數(shù)的信息最重要。Neurovigil 已經(jīng)有了一個(gè)小型設(shè)備iBrain,它可以在家里記錄你的腦電圖信息,將數(shù)據(jù)傳到網(wǎng)上并分析數(shù)據(jù)的長期趨勢和異常情況。這可以幫助醫(yī)生及早發(fā)現(xiàn)健康問題,在惡化前及時(shí)干預(yù)并阻止慢性疾病的發(fā)展。其他很多疾病的治療也將受益于持續(xù)監(jiān)測,如1 型糖尿病,血糖水平可以被監(jiān)測并通過胰島素進(jìn)行調(diào)節(jié)。使用能夠連續(xù)記錄數(shù)據(jù)的廉價(jià)傳感器正在對其他慢性疾病的診斷和治療產(chǎn)生重大影響。
從Neurovigil 的發(fā)展過程中可以看出:
第一,即便擁有更好更廉價(jià)的技術(shù),也不代表能輕易地將其轉(zhuǎn)化為有市場價(jià)值,甚至更優(yōu)質(zhì)的新產(chǎn)品或服務(wù);
第二,當(dāng)現(xiàn)有產(chǎn)品在市場中的地位根深蒂固,就會進(jìn)一步開發(fā)出深入應(yīng)用的二級市場,可以讓新技術(shù)產(chǎn)生更直接的影響,并爭取時(shí)間來改進(jìn),提升競爭力。太陽能和許多其他新興產(chǎn)業(yè)的技術(shù)就是這樣進(jìn)入市場的。從長遠(yuǎn)來看,已被證實(shí)具有優(yōu)勢的睡眠監(jiān)測和新技術(shù)將會覆蓋到家中的患者,并最終融入醫(yī)療實(shí)踐。?
評論