如今,人工智能已經(jīng)深入生活的方方面面,我們的社會(huì)更加依賴于算法做決策,而不是人。這些系統(tǒng)已經(jīng)在銀行、電子商務(wù)、醫(yī)療保健以及治安等領(lǐng)域顯現(xiàn)出了強(qiáng)大的潛力。
然而,人們?cè)絹碓綋?dān)心算法的控制權(quán)過多,尤其是當(dāng)人們將決定權(quán)交給機(jī)器的時(shí)候,例如自動(dòng)駕駛汽車或法庭判決等場(chǎng)合。如果因此而阻礙人工智能的使用,那么社會(huì)和經(jīng)濟(jì)就有可能無法享受人工智能帶來的各種潛在優(yōu)勢(shì)。
Hannah Fry是倫敦大學(xué)學(xué)院高級(jí)空間分析中心的數(shù)學(xué)家,多年來她一直在研究這些系統(tǒng)。不過人們對(duì)她的更多了解來自BBC的公開講座和紀(jì)錄片,她是一名數(shù)學(xué)和科學(xué)領(lǐng)域的知名人士。
在她最新的著作《Hello World》一書中,F(xiàn)ry女士揭開了這種技術(shù)的神秘面紗,她通過回顧歷史向我們解釋了如何采用數(shù)據(jù)驅(qū)動(dòng)的決策,并提供了清晰的利弊分析。使用人工智能的好處在于,AI可以更快更準(zhǔn)確地執(zhí)行任務(wù),而缺點(diǎn)是如果數(shù)據(jù)有偏差,那么輸出可能有偏差。
The Economist針對(duì)社會(huì)應(yīng)當(dāng)如何利用這項(xiàng)技術(shù),對(duì)Fry女士進(jìn)行了采訪。在本文中,首先我們會(huì)詳細(xì)報(bào)道此次采訪的內(nèi)容,而后面的部分是《Hello World》一書中有關(guān)刑事司法系統(tǒng)和“隨機(jī)森林”算法的節(jié)選。
自動(dòng)化會(huì)失誤,人類才是考慮的核心
The Economist:所有的數(shù)據(jù)都有偏差,那么我們是否應(yīng)該推遲算法系統(tǒng)的引入,直到我們確信我們已經(jīng)發(fā)現(xiàn)并解決了算法系統(tǒng)中的關(guān)鍵性問題,還是說我們應(yīng)該降低標(biāo)準(zhǔn):“盡最大努力”來發(fā)現(xiàn)和修正偏差,同時(shí)在發(fā)現(xiàn)漏洞的時(shí)候,可以隨時(shí)發(fā)布代碼和補(bǔ)???
Hannah Fry:大家在這個(gè)問題上很容易產(chǎn)生一種誤解。當(dāng)看到算法會(huì)引發(fā)別的問題時(shí),我們就想著完全拋棄這些算法,并認(rèn)為我們應(yīng)該堅(jiān)持依賴人類的決策來解決問題,直到更好的算法出現(xiàn)。然而,實(shí)際上人類也存在偏見,而且還會(huì)受到各種問題的迷惑。
其實(shí),這完全取決于你需要的精準(zhǔn)度。例如,你可以在足球比賽中引入“視頻助理裁判”,但你不能不負(fù)責(zé)任地以相同的方式在醫(yī)療保健領(lǐng)域引入一個(gè)有問題的系統(tǒng)。總的來說,總體目標(biāo)必須是建立最公平、最統(tǒng)一的系統(tǒng)。這意味你必須承認(rèn)完美是不可能的,而且權(quán)衡利弊也在所難免。然而,同時(shí)也意味著我們應(yīng)該設(shè)法鼓勵(lì)利用算法做決策,盡管它們也難免會(huì)出錯(cuò)。
The Economist:刑事司法系統(tǒng)有時(shí)會(huì)吹噓“與其讓一個(gè)無辜的人入獄,不如釋放一個(gè)罪犯”的價(jià)值觀。我們是否應(yīng)該拒絕在法庭上采用算法來做出嚴(yán)肅的決定(即宣判),因?yàn)槲覀冇肋h(yuǎn)也不確定這是否是盲目的正義?
Hannah Fry:每個(gè)刑事司法系統(tǒng)都必須在保護(hù)無辜的人被誣告和保護(hù)犯罪受害者之間找到某種平衡。實(shí)現(xiàn)這種平衡并非易事,而且司法系統(tǒng)也并非完美——而且也從未嘗試做到完美。這就是為什么“合理地懷疑”和“充分的理由”之類的詞匯是基本的法律用語:這類的系統(tǒng)必須接受絕對(duì)的確定性是無法實(shí)現(xiàn)的。
然而,即使在這些約束之下,法官的決定里面仍然可能有前后矛盾和運(yùn)氣的成分。人們無法保證做出公平和一致的決策。而法官與我們其他人一樣,有時(shí)也無法放下潛在的偏見。
如果你謹(jǐn)慎地對(duì)待這些問題,那么我認(rèn)為我們有可能通過使用算法來支持法官的決定,從而將這類問題降到最少。你必須確保以一種更公平地方式使用系統(tǒng),還要確保不會(huì)意外地加劇已經(jīng)存在的偏差。
The Economist:你是否擔(dān)心最終人類會(huì)把生活中重要的權(quán)利交給機(jī)器,就像我們已經(jīng)由于電子地圖的出現(xiàn)而喪失了方向感?
Hannah Fry:我認(rèn)為,隨著自動(dòng)化的發(fā)展,我們的確會(huì)失去一些技能。例如,現(xiàn)在我連自己的電話號(hào)碼都記不住,更不用說我以前知道的那一長(zhǎng)串電話號(hào)碼了,而且我的書法也一落千丈。但我并不覺得自己非常擔(dān)心這方面的問題。
歷史上我們也曾經(jīng)歷過擔(dān)心技能退化的問題。飛行員就曾有過這樣的經(jīng)歷:自動(dòng)駕駛越好,初級(jí)飛行員手動(dòng)控制飛機(jī)的技術(shù)就越差。以前在手術(shù)室里,初級(jí)外科醫(yī)生可以通過在開放式手術(shù)中協(xié)助咨詢顧問的方式(他們的手會(huì)接觸患者,觸摸和感覺身體)進(jìn)行訓(xùn)練,而如今他們可以觀看咨詢顧問坐在控制臺(tái)操作的微創(chuàng)手術(shù),而且還有內(nèi)部的攝像機(jī)在屏幕上放映。
如果有一天我們真的進(jìn)入無人駕駛汽車普及的階段,而我們卻不認(rèn)真考慮如何保持我們的駕駛技術(shù)的話,那么人們?cè)跊]有輔助的情況下的駕駛能力會(huì)下降,我們?nèi)匀幌M覀兡軌蛉藶榻槿?,并在緊急情況下采取行動(dòng)控制汽車。
為了避免這個(gè)問題,你可以采取一系列措施,例如時(shí)不時(shí)地故意關(guān)閉機(jī)器。但我認(rèn)為,我們應(yīng)該承認(rèn)自動(dòng)化有時(shí)也會(huì)出現(xiàn)失誤,而且我們應(yīng)該確保人類(以及他們的需求和失誤)始終應(yīng)該是我們考慮的核心。
The Economist:當(dāng)算法進(jìn)入醫(yī)學(xué)、法律和其他領(lǐng)域時(shí),算法得出的決定只能作為“建議”,人類在這個(gè)過程中仍然有最終的決定權(quán)。然而,根據(jù)行為心理學(xué)的大多數(shù)研究表明這只是一種假象:算法對(duì)人類有著非凡的影響。我們?cè)鯓硬拍軓默F(xiàn)實(shí)的角度克服這個(gè)問題呢?
Hannah Fry:通常人們都很懶惰。我們喜歡采用簡(jiǎn)單的方法,我們喜歡推卸責(zé)任,我們喜歡走捷徑,如此一來我們就不必思考了。
如果你設(shè)計(jì)的算法可以告訴你答案,而你卻希望人們會(huì)再三檢查這個(gè)答案,提出質(zhì)疑,并且還知道在適當(dāng)?shù)臅r(shí)候提出別的答案,那么實(shí)際上你在自掘墳?zāi)?。人類本身就不擅長(zhǎng)做這種事情。
但是,如果你設(shè)計(jì)的算法能夠坦然地承認(rèn)它們的不確定性——公開和坦誠地向你的用戶說明它們做決定的過程,以及在這個(gè)過程中經(jīng)歷的所有混亂和模糊,那么我們就知道什么時(shí)候我們應(yīng)該相信自己的直覺。
我認(rèn)為這是IBM的沃森最好的一個(gè)功能,它參加了美國的智力競(jìng)賽節(jié)目《危險(xiǎn)邊緣》(Jeopardy)!而且還獲勝了。雖然該節(jié)目要求選擇一個(gè)答案,但該算法在此過程中還考慮了替代方案,并表明了每種方案的正確概率。
這也是最新的衛(wèi)星導(dǎo)航的好處:它們并不會(huì)為你決定路線,而是會(huì)給你三個(gè)選擇,并告訴你利弊。你可以通過這些信息做出明智的決定,而不是盲目地交出控制權(quán)。
The Economist:有什么事情是人類能做,機(jī)器卻做不了的嗎?為了幫助人類在算法時(shí)代依然蓬勃發(fā)展,我們的社會(huì)需要做出哪些改變?
Hannah Fry:人類可以比機(jī)器更好地理解背景和細(xì)微的差別。我們的適應(yīng)性更強(qiáng)。如果你把我們帶到一個(gè)全新的環(huán)境下,我們知道如何表現(xiàn),這是最優(yōu)秀的人工智能也望塵莫及的。
除此之外,這是一個(gè)人類的世界,而不是算法的世界。因此,人類始終應(yīng)該居于新技術(shù)思想的前沿和中心。
這話看似顯而易見,然而實(shí)際情況卻并非如此。最近的趨勢(shì)有意將新算法迅速推向世界,并通過現(xiàn)實(shí)世界中的真實(shí)用戶進(jìn)行現(xiàn)場(chǎng)實(shí)驗(yàn),而不是停下來思考這些算法是否弊大于利,或發(fā)現(xiàn)它們有問題后推遲采用這些算法。(我說的就是你:社交媒體。)
我認(rèn)為社會(huì)需要堅(jiān)定立場(chǎng):有些新技術(shù)(例如新藥)需要謹(jǐn)慎使用并提前考慮最壞的情況。我認(rèn)為我們構(gòu)建的算法應(yīng)該誠實(shí)地表明它們的弱點(diǎn),并坦誠地說明完美往往都是不可能的。但最重要的是,我認(rèn)為我們構(gòu)建的算法應(yīng)該接受人類的失誤,而不是視而不見。
面向司法的數(shù)學(xué)式
它們無法衡量辯護(hù)方和起訴方的辯論,分析證據(jù),或決定被告是否真的有悔意。所以我們不能指望算法在近期內(nèi)取代法官。然而,算法也有意想不到的用處,比如使用個(gè)人的數(shù)據(jù)來計(jì)算他們今后再次犯罪的概率。而且,由于許多法官也會(huì)根據(jù)罪犯是否會(huì)再次犯罪的概率來判決,因此這種算法非常實(shí)用。
司法系統(tǒng)使用數(shù)據(jù)和算法已有將近一個(gè)世紀(jì)的歷史了,第一次的使用可以追溯到20世紀(jì)20年代美國的一宗案子。當(dāng)時(shí),根據(jù)美國的制度,被定罪的罪犯將被判處最高刑期,然后在一段時(shí)間過后才有資格獲得假釋。數(shù)萬名囚犯依據(jù)此律獲準(zhǔn)提前釋放。有些人重獲自由,而有些人則沒有。
但總的來說,他們的案例為自然實(shí)驗(yàn)提供了完美的環(huán)境:你能否預(yù)測(cè)罪犯會(huì)違反他們的假釋條款嗎?
芝加哥大學(xué)的加拿大社會(huì)學(xué)家Ernest W. Burgess對(duì)預(yù)測(cè)充滿了興趣。Burgess是量化社會(huì)現(xiàn)象的重要支持者。在他的職業(yè)生涯中,他一直在嘗試預(yù)測(cè)退休和婚姻成功產(chǎn)生的影響。1928年,他成功地建立了第一個(gè)預(yù)測(cè)工具,這個(gè)工具可以根據(jù)測(cè)量的結(jié)果(而不是直覺)預(yù)測(cè)犯人再次犯罪的概率。
Burgess利用美國伊利諾伊州三所監(jiān)獄中三千名囚犯的各種數(shù)據(jù),找出了他認(rèn)為對(duì)于決定某人是否會(huì)違反他們的假釋條款“可能有著重大影響”的21個(gè)因素。其中包括犯罪的類型、在監(jiān)獄中服刑的月份和囚犯的社會(huì)類型——他根據(jù)二十世紀(jì)早期社會(huì)科學(xué)家所關(guān)注的話題對(duì)罪犯進(jìn)行了分類:流浪漢、酒鬼、窩囊廢、鄉(xiāng)巴佬和移民。
Burgess從這21個(gè)因素出發(fā)為每個(gè)犯人打分(0或1)。獲得高分(16-21分)的人再次犯罪的概率最低,而那些得分很低(4分以下)的人則極有可能違反他們的假釋條款。
等到最終所有囚犯都被釋放后,有些人違反了假釋條款,于是Burgess抓緊這次機(jī)會(huì)檢驗(yàn)他的預(yù)測(cè)結(jié)果。通過一個(gè)基本的分析,他發(fā)現(xiàn)自己預(yù)測(cè)非常準(zhǔn)確。在他的低風(fēng)險(xiǎn)人群中有98%通過了他們的假釋,而他認(rèn)定的高危人群中有三分之二沒有通過假釋。事實(shí)證明,即使是粗略的統(tǒng)計(jì)模型也可以比專家做出更好的預(yù)測(cè)。
但Burgess的工作也受到了批評(píng)。
持懷疑態(tài)度的旁觀者質(zhì)疑,從一個(gè)地方得出的預(yù)測(cè)假釋成功的因素中有多少能夠適用于其他地方。(他們其中的一個(gè)觀點(diǎn)是:在預(yù)測(cè)現(xiàn)代化大城市內(nèi)犯罪分子再次犯罪的概率時(shí),如何確?!班l(xiāng)巴佬”會(huì)有很大的幫助。)
其他學(xué)者還指出Burgess只利用了現(xiàn)有的信息,而沒有調(diào)查其中的相關(guān)性。關(guān)于對(duì)他對(duì)囚犯進(jìn)行評(píng)分的方式也存在疑問:畢竟,他的方法只不過是根據(jù)方程式算出來的。盡管如此,這種預(yù)測(cè)能力也足以讓人震撼,1935年美國伊利諾伊州的監(jiān)獄開始借助Burgess的方法支持假釋委員會(huì)做出決定。等到了世紀(jì)之交,由Burgess的方法衍生出來的其他數(shù)學(xué)方法在全世界范圍內(nèi)得到了應(yīng)用。
再來看看現(xiàn)代,目前法庭使用的最先進(jìn)的風(fēng)險(xiǎn)評(píng)估算法遠(yuǎn)比Burgess設(shè)計(jì)的基本工具復(fù)雜得多。這些算法不僅可以協(xié)助假釋決定,而且還可以幫忙為囚犯指定干預(yù)方案,決定誰應(yīng)該獲得保釋,最近還開始支持法官做出判刑決定。這些算法的基本原則與以往一樣:了解被告的情況(年齡、犯罪歷史、犯罪的嚴(yán)重性等等),并預(yù)測(cè)讓他們獲得保釋的危險(xiǎn)程度。
那么,這些算法的工作原理是什么呢?從廣義上講,表現(xiàn)最優(yōu)秀的現(xiàn)代算法采用了一種名叫隨機(jī)森林的技術(shù),其核心的概念非常簡(jiǎn)單,就是簡(jiǎn)單的決策樹。
征詢觀眾的意見
你可能在學(xué)生時(shí)期就聽說過決策樹。
數(shù)學(xué)老師很喜歡決策樹,他們把決策樹當(dāng)成一種組織觀察的方式,例如拋硬幣或擲骰子。在構(gòu)建完成后,你可以把決策樹當(dāng)成一種流程圖:根據(jù)一系列的要素,逐步評(píng)估下一步該做什么,或者判斷當(dāng)前情況下的事態(tài)發(fā)展。
想象一下,你正在決定是否批準(zhǔn)某人的保釋。與假釋一樣,這個(gè)決定的根本只是一個(gè)簡(jiǎn)單的計(jì)算。有罪與否并不要緊。你只需要做出預(yù)測(cè):被告是否會(huì)被判入獄,是否會(huì)違反保釋協(xié)議的條款?
為了幫助你做出預(yù)測(cè),你可以參考一些之前的罪犯數(shù)據(jù),有些人在保釋期間逃跑,或再次犯罪,而有些人卻沒有。
你可以利用這些數(shù)據(jù),手工構(gòu)建一個(gè)簡(jiǎn)單的決策樹,如下圖所示,利用每個(gè)罪犯的特征來構(gòu)建流程圖。構(gòu)建完成后,你就可以利用決策樹預(yù)測(cè)罪犯的行為方式。你只需要根據(jù)犯罪者的特征沿著相關(guān)的分支前進(jìn),直到得出預(yù)測(cè)結(jié)果。只要這些結(jié)果符合之前所有人的模式,預(yù)測(cè)就是正確的。
然而,我們?cè)趯W(xué)校制作的這種決策樹也會(huì)出現(xiàn)失誤。當(dāng)然,并非每個(gè)人都和之前的模式一模一樣。而且決策樹本身也會(huì)產(chǎn)生很多錯(cuò)誤的預(yù)測(cè)。而且不僅僅是因?yàn)槲覀兊倪@個(gè)例子非常簡(jiǎn)單,即使你擁有大量之前的案例數(shù)據(jù)集,并建立極其復(fù)雜的流程圖,偏差也再所難免,最后的結(jié)果我們也只能說使用一棵決策樹總比隨便亂猜稍好一些。
然而,如果你構(gòu)建了不止一棵樹,那么一切都有可能改變。這一次我們不會(huì)一次性用光所有數(shù)據(jù),而是采用分而治之的方法。
在所謂的集合中,首先我們根據(jù)數(shù)據(jù)的隨機(jī)子集構(gòu)建數(shù)千棵小樹。然后,當(dāng)有新的被告時(shí),你只需讓每棵樹投票決定是否應(yīng)該批準(zhǔn)保釋。樹木之間可能并不完全一致,而且每棵樹依舊可能做出不準(zhǔn)的預(yù)測(cè),但你只需要取所有答案的平均值,就可以大大提高預(yù)測(cè)的精確度。
這有點(diǎn)像在“誰想成為百萬富翁”的節(jié)目中征詢觀眾的意見。雖然房間里面都是陌生人,但是他們加在一起比最聰明的人更有可能得出準(zhǔn)確的答案。(“征詢觀眾的意見”的成功率為91%,相比之下,“打電話向朋友求助”的成功率僅為65%。)
許多人所犯的錯(cuò)誤可能相互抵消,所以一群人總是比一個(gè)人更聰明。
同樣的道理也適用于一大群決策樹,它們組成一個(gè)隨機(jī)森林。因?yàn)檫@種算法的預(yù)測(cè)是基于它從數(shù)據(jù)中學(xué)習(xí)的模式,所以隨機(jī)森林又被稱作機(jī)器學(xué)習(xí)算法,這種算法在人工智能領(lǐng)域的應(yīng)用非常廣泛。(值得一提的是,該算法本質(zhì)上就是你在上學(xué)時(shí)繪制的流程圖,只不過經(jīng)過了一些數(shù)學(xué)操作,這聽起來是不是很偉大?)
事實(shí)證明,隨機(jī)森林在整個(gè)現(xiàn)實(shí)世界的應(yīng)用程序中非常有幫助性。Netflix通過隨機(jī)森林,根據(jù)你過去的喜好,預(yù)測(cè)你想要觀看的內(nèi)容; Airbnb可以檢測(cè)欺詐賬戶;而醫(yī)療界用隨機(jī)森林來診斷疾病。
在評(píng)估犯罪分子時(shí),與人類評(píng)估相比,隨機(jī)森林擁有兩大優(yōu)勢(shì)。首先,該算法可以針對(duì)相同的案例給出完全相同的答案。保證一致性的同時(shí)也不犧牲個(gè)人的司法公正。還有一個(gè)關(guān)鍵的優(yōu)勢(shì):這種算法可以得出更好的預(yù)測(cè)結(jié)果。
-
人工智能
+關(guān)注
關(guān)注
1806文章
49012瀏覽量
249388 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8960瀏覽量
140187
原文標(biāo)題:忽略這一點(diǎn),人工智能變?nèi)斯ぶ钦希?/p>
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
人工智能推理及神經(jīng)處理的未來

評(píng)論