99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習的可解釋性為何如此重要?

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-04-11 15:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

無論構(gòu)建機器學習的目的是什么,客戶總是希望能知道并理解模型的來龍去脈的。此外作為數(shù)據(jù)科學家和機器學習工作者,可解釋性對于模型的驗證和改進有著十分積極的意義。本文將從不同的角度闡述模型的可解釋性對于機器學習的重要性,并探討模型解釋的實踐方法。

機器學習的可解釋性為何如此重要?

在傳統(tǒng)統(tǒng)計學中,我們通過數(shù)據(jù)構(gòu)建并驗證假設(shè)來建立模型。通過構(gòu)建的模型我們可以得到一系列規(guī)則并應(yīng)用于業(yè)務(wù)中去。例如市場部門就可以通過構(gòu)建與競爭者數(shù)據(jù)相關(guān)的模型來決定有效的市場競爭策略和方法。這類方法屬于自頂向下的方法,其中可解釋性是整套方法的解釋,它銜接了規(guī)則和所產(chǎn)生的行為策略。很多時候因果關(guān)系不那么明確,一個堅實的模型就需要為決策提供可靠的解釋,幫助人們清晰的理解。

而對于自底向上的模式,將商業(yè)模型中的一部分委派給機器學習,甚至從機器學習中得到全新的商業(yè)想法。自底向上的數(shù)據(jù)科學一般與手工勞作的自動化過程相關(guān)。例如制造業(yè)公司可將傳感器放置在設(shè)備上收集數(shù)據(jù)并預(yù)測其需要維護的時間,這就避免了運維工程師耗時的周期性檢查和維修,他們可以高效的維護工場設(shè)備保持在運行在良好的狀態(tài)。模型的可解釋可以幫助驗證模型是否再按期望的狀態(tài)運行,同時有利于在向自動化轉(zhuǎn)變的過程中創(chuàng)造多的信任。

作為一名數(shù)據(jù)科學家,經(jīng)常需要對模型進行微調(diào)以達到最優(yōu)的表現(xiàn)。數(shù)據(jù)科學一般都是在給定x和輸出y的情況下尋找誤差最小的映射模型。雖然訓練優(yōu)秀的模型是數(shù)據(jù)科學家的核心能力,但具有更廣闊的視野也十分重要。對數(shù)據(jù)和模型的解讀對于數(shù)據(jù)科學處理流程是十分重要的,同時還能保證模型與目標問題的匹配。盡管我們經(jīng)常會在各種前沿模型的嘗試中迷失自我,但如果能夠解釋模型的發(fā)現(xiàn)并指導你的工作這將會使得數(shù)據(jù)科學的處理變得更加透徹。

對于模型的深度分析是數(shù)據(jù)的科學的根本

1. 識別并減小偏差

偏差廣泛存在于數(shù)據(jù)集中,數(shù)據(jù)科學家需要識別并修正它的影響。很多時候數(shù)據(jù)集的規(guī)??赡芎苄〔蛔阋愿采w所有的情況,或者在數(shù)據(jù)獲取過程中沒有考慮潛在的偏差。它的影響往往會在數(shù)據(jù)處理后護著在模型預(yù)測中變得明顯。偏差存在的形式各不相同,需要明確的是,處理偏差的手段并不單一,但在考慮模型的可解釋性的時候必須要考慮到偏差的存在。

2.幫助分析問題的前后聯(lián)系

在大多數(shù)問題中,我們收集到的數(shù)據(jù)僅僅是問題的粗略表示,并不能完全反映真實狀態(tài)下的復(fù)雜性??山忉屇P涂梢詭椭覀兝斫獠⒂嬃磕男┮蛩乇话侥P椭?,并根據(jù)模型預(yù)測計量問題的前后聯(lián)系。

3.改善泛化性

可解釋性越強的模型一般都會具有更好的泛化性??山忉屝圆⒉皇悄P蛯τ诿恳粋€數(shù)據(jù)點的細節(jié)描述,而是結(jié)合了堅實的模型和數(shù)據(jù)以及對于問題的理解,綜合形成對于問題更好更全面的理解。

4.倫理和法律需要

在金融和醫(yī)療等行業(yè)人們需要審視模型的決策過程,并保證模型的決策不帶有歧視和違法等行為。隨著數(shù)據(jù)隱私保護的加強,模型的可解釋性變得更加重要。同時在一些如醫(yī)療、自動駕駛等關(guān)鍵領(lǐng)域,一個錯誤會產(chǎn)生十分巨大的反響,所以模型的可解釋性變得十分重要,讓人們明白系統(tǒng)是如何工作的,決策是如何形成的。

如何解釋你的模型?

在這一領(lǐng)域通常有一個規(guī)律,模型的可解釋性隨著復(fù)雜度的增加而下降,甚至更快的下降。特征重要性一般是解釋模型的起點。即使對于黑箱般的深度學習模型,依然有一系列技術(shù)用于解釋他們?nèi)绾喂ぷ?。在文章的最后我們還將討論LIME(Local Interpretable Model-Agnostic Explanations)框架來作為分析框架構(gòu)建可解釋性。

1.特征重要性

一般線性模型

一般線性模型將特征作為x輸入并與模型的權(quán)重相結(jié)合,通過函數(shù)作用后可以預(yù)測一系列廣泛的變量。其常見的應(yīng)用包括回歸(線性回歸)、分類(邏輯回歸)和泊松過程建模(泊松回歸)。其權(quán)重來自于特征訓練后的結(jié)果,他們可以為模型提供十分簡練的解釋。

例如構(gòu)建一個文本分類器的過程中,可以繪制分類的特征圖并驗證它是否過擬合了噪聲。如果最重要的特征與你的直覺不符,這就意味著模型在噪聲上過擬合了,它在新數(shù)據(jù)上的表現(xiàn)也不會好。

隨機森林和支持向量機

即使對于樹這一類的非線性模型依然可以特征重要性中提取信息。在隨機森林中,特征重要性是驗證初始假設(shè)和評價模型學習效果的好方法。而在基于核方法的支持向量機中,可以將特征映射到核空間中進行學習。

從上圖中可以看到模型從數(shù)據(jù)中學習到了什么,什么是重要的

深度學習

深度學習模型的表現(xiàn)十分優(yōu)異,但由于缺乏可解釋性廣受詬病。這主要是由于內(nèi)部的參數(shù)共享和復(fù)雜的特征抽取與組合。這類模型在一系列機器學習任務(wù)上達到了最先進的水平,很多人都在致力于銜接器預(yù)測與輸入的關(guān)系,期待解釋模型的優(yōu)異表現(xiàn)。

機器學習可解釋的學術(shù)研究火熱

深度學習的不可解釋性是阻礙其發(fā)展的障礙,特別是在圖像和文本處理上,很難解釋模型到底學習到了什么。目前這一領(lǐng)域的主要研究方向集中在將輸出或者預(yù)測映射回輸入數(shù)據(jù)上。雖然在線性模型上十分簡單,但在深度學習中依然是懸而未決的問題。目前主要集中在梯度和注意力機制兩方面來解決。

1) 基于梯度的方法中利用方向傳播梯度的概念產(chǎn)生出一幅地圖,用于描述出輸入圖中對于輸入預(yù)測重要的部分。

視覺標注任務(wù)中在原圖顯示對于結(jié)果重要的部分

2) 基于注意力機制的方法主要用于序列數(shù)據(jù)。除了網(wǎng)絡(luò)中歸一化的權(quán)重外,注意力權(quán)重被訓練用于"輸入門"。注意力權(quán)重可以被用于決定輸入部分多少被用于最后的網(wǎng)絡(luò)輸出。除了可解釋性,文本中的注意力機制在問答系統(tǒng)中幫助系統(tǒng)更加集中于任務(wù)本身。

顯示了文本中對于問題回答重要的部分

2.LIME

LIME是一個更為通用的解釋框架。

為了保持模型的獨立性,LIME修改局域的輸入將特別的測試用例輸入模型并觀察對預(yù)測造成的影響,通過一個個特定的樣例來觀察模型的可解釋性。在文本內(nèi)容分類中,這意味著某些詞被替換后觀察輸出的結(jié)果。這就可以看到哪些修改后的結(jié)果是更為重要的。從而從側(cè)面來解釋模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134637
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122803

原文標題:聊一聊機器學習的可解釋性和一個實踐方法

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機器學習模型可解釋性的結(jié)果分析

    模型的可解釋性機器學習領(lǐng)域的一個重要分支,隨著 AI 應(yīng)用范圍的不斷擴大,人們越來越不滿足于模型的黑盒特性,與此同時,金融、自動駕駛等領(lǐng)域的法律法規(guī)也對模型的
    發(fā)表于 09-28 10:17 ?1417次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型<b class='flag-5'>可解釋性</b>的結(jié)果分析

    什么是“可解釋的”? 可解釋性AI不能解釋什么

    通過建立既可解釋又準確的模型來改良這種錯誤的二分法。關(guān)鍵是將神經(jīng)網(wǎng)絡(luò)與決策樹相結(jié)合,在使用神經(jīng)網(wǎng)絡(luò)進行低級決策時保留高級的可解釋性。
    發(fā)表于 05-31 10:51 ?8901次閱讀

    可解釋機器學習——打開機器學習黑匣子

    【資源下載】《可解釋機器學習》,打開機器學習黑匣子
    發(fā)表于 05-20 14:16

    導磁材料的影響為何如此重要

    電機設(shè)計的三要素導磁材料的影響為何如此重要如何設(shè)計轉(zhuǎn)子的幾何尺寸
    發(fā)表于 02-03 07:29

    斯坦福探索深度神經(jīng)網(wǎng)絡(luò)可解釋性 決策樹是關(guān)鍵

    深度學習的熱潮還在不斷涌動,神經(jīng)網(wǎng)絡(luò)再次成為業(yè)界人士特別關(guān)注的問題,AI 的未來大有可期,而深度學習正在影響我們的日常生活。近日斯坦福大學給我們分享咯一則他對深度神經(jīng)網(wǎng)絡(luò)可解釋性的探索的論文,我們?nèi)タ纯此侨缋斫獾陌桑?/div>
    發(fā)表于 01-10 16:06 ?4670次閱讀
    斯坦福探索深度神經(jīng)網(wǎng)絡(luò)<b class='flag-5'>可解釋性</b> 決策樹是關(guān)鍵

    機器學習模型的“可解釋性”的概念及其重要意義

    如果考察某些類型的“事后可解釋性”(post-hoc interpretable),深度神經(jīng)網(wǎng)絡(luò)具有明顯的優(yōu)勢。深度神經(jīng)網(wǎng)絡(luò)能夠學習豐富的表示,這些表示能夠可視化、用語言表達或用于聚類。如果考慮對可解釋性的需求,似乎線性模型在研
    的頭像 發(fā)表于 07-24 09:58 ?2w次閱讀

    神經(jīng)網(wǎng)絡(luò)可解釋性研究的重要性日益凸顯

    神經(jīng)網(wǎng)絡(luò)的可解釋性,從經(jīng)驗主義到數(shù)學建模
    的頭像 發(fā)表于 06-27 10:54 ?5523次閱讀

    Explainable AI旨在提高機器學習模型的可解釋性

    Google Cloud AI戰(zhàn)略總監(jiān)Tracy Frey在 今天的博客中解釋說,Explainable AI旨在提高機器學習模型的可解釋性。她說,這項新服務(wù)的工作原理是量化每個數(shù)據(jù)因
    的頭像 發(fā)表于 03-24 15:14 ?3192次閱讀

    機器學習模型可解釋性的介紹

    模型可解釋性方面的研究,在近兩年的科研會議上成為關(guān)注熱點,因為大家不僅僅滿足于模型的效果,更對模型效果的原因產(chǎn)生更多的思考,這...
    的頭像 發(fā)表于 12-10 20:19 ?1062次閱讀

    《計算機研究與發(fā)展》—機器學習可解釋性

    機器學習可解釋性 來源:《計算機研究與發(fā)展》,作者陳珂銳等 摘 要?近年來,機器學習發(fā)展迅速,尤其是深度
    發(fā)表于 01-25 08:35 ?1455次閱讀
    《計算機研究與發(fā)展》—<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的<b class='flag-5'>可解釋性</b>

    關(guān)于機器學習模型的六大可解釋性技術(shù)

    本文介紹目前常見的幾種可以提高機器學習模型的可解釋性的技術(shù)。
    的頭像 發(fā)表于 02-26 17:20 ?2541次閱讀
    關(guān)于<b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型的六大<b class='flag-5'>可解釋性</b>技術(shù)

    機器學習模型的可解釋性算法詳解

    本文介紹目前常見的幾種可以提高機器學習模型的可解釋性的技術(shù),包括它們的相對優(yōu)點和缺點。
    的頭像 發(fā)表于 02-16 16:21 ?5329次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型的<b class='flag-5'>可解釋性</b>算法詳解

    可解釋機器學習

    可解釋機器學習
    發(fā)表于 06-17 14:41 ?1次下載

    可以提高機器學習模型的可解釋性技術(shù)

    本文介紹目前常見的幾種可以提高機器學習模型的可解釋性的技術(shù),包括它們的相對優(yōu)點和缺點。
    的頭像 發(fā)表于 02-08 14:08 ?1665次閱讀

    文獻綜述:確保人工智能可解釋性和可信度的來源記錄

    本文對數(shù)據(jù)起源、可解釋AI(XAI)和可信賴AI(TAI)進行系統(tǒng)的文獻綜述,以解釋基本概念,說明數(shù)據(jù)起源文件可以用來提升基于人工智能系統(tǒng)實現(xiàn)可解釋性。此外,文中還討論了這個領(lǐng)域近期的發(fā)展模式,并對未來的研究進行展望。
    的頭像 發(fā)表于 04-28 15:55 ?1955次閱讀
    文獻綜述:確保人工智能<b class='flag-5'>可解釋性</b>和可信度的來源記錄