N-iX是一家位于烏克蘭和波蘭的軟件開發(fā)外包服務(wù)提供商,專為政府部門、金融機構(gòu)和各類企業(yè)提供數(shù)據(jù)驅(qū)動的各類服務(wù),其中包括近年來日益火熱的Fintech——智慧金融。作為一家擁有800多名技術(shù)專家、合作企業(yè)遍布全球的公司,他們對金融領(lǐng)域的機器學(xué)習又有什么見解呢?相信這篇文章能給各位讀者一個答案。
對于很多人來說,金融領(lǐng)域的機器學(xué)習可能充滿魔力,即便它背后并沒有什么魔法(好吧,也許有一點點)。但我們應(yīng)該清楚,機器學(xué)習項目的成功不是源于這項技術(shù)本身,而是更多地取決于過程中所構(gòu)建的高效基礎(chǔ)架構(gòu)、合適的數(shù)據(jù)集和正確算法的使用。
現(xiàn)如今,機器學(xué)習正在金融領(lǐng)域大展宏圖,那么渴望從新技術(shù)中獲得突破的金融機構(gòu)該關(guān)心些什么呢?這篇文章會向讀者揭示,機器學(xué)習和AI究竟能實現(xiàn)什么解決方案,以及公司該如何應(yīng)用這項技術(shù)。
定義
首先,我們可以把金融領(lǐng)域使用的狹義機器學(xué)習(ML)定義為數(shù)據(jù)科學(xué)的一個子集,它通過使用統(tǒng)計模型總結(jié)洞見,并進行預(yù)測。下圖解釋了金融領(lǐng)域的AI、數(shù)據(jù)科學(xué)和機器學(xué)習之間的關(guān)系。為了簡單起見,本文會專注于介紹機器學(xué)習。
機器學(xué)習解決方案的神奇之處在于,它們能從經(jīng)驗中學(xué)習,而無需明確編程。簡而言之,你選擇一個模型,喂給它大量數(shù)據(jù),之后它就會自動調(diào)整參數(shù)以提高預(yù)測準確率。
而數(shù)據(jù)科學(xué)家的核心工作就是將現(xiàn)有數(shù)據(jù)集用于訓(xùn)練機器學(xué)習模型,然后把訓(xùn)練好的模型應(yīng)用于現(xiàn)實生活。
此圖只反映金融領(lǐng)域情形,真正意義上的機器學(xué)習和數(shù)據(jù)科學(xué)不存在屬于/不屬于關(guān)系
這些模型是作為后臺進程運行的,并根據(jù)其訓(xùn)練方式自動提供結(jié)果。數(shù)據(jù)科學(xué)家可以根據(jù)需要經(jīng)常重新訓(xùn)練模型,保證它們的時效性和總體性能。比如Mercanto就每天都會部署重新訓(xùn)練。
通常情況下,你提供的數(shù)據(jù)越多,模型輸出結(jié)果就越準確。這一點正中金融領(lǐng)域下懷,因為龐大的數(shù)據(jù)集在金融服務(wù)行業(yè)中非常普遍,無論是交易、客戶,還是儲蓄、匯款等PB數(shù)據(jù),這些都很適合用于機器學(xué)習。
隨著技術(shù)的發(fā)展和最佳算法的開源,我們很難想象如果沒有機器學(xué)習,金融服務(wù)的未來會是什么樣。從另一個角度看,這也意味著現(xiàn)在大多數(shù)金融服務(wù)公司還沒有準備好來提取這一技術(shù)的真正價值,其中的原因主要有以下幾個:
企業(yè)往往對機器學(xué)習及其產(chǎn)品抱有不切實際的期望。
人工智能和機器學(xué)習的研發(fā)、開發(fā)成本很高。
DS/ML工程師短缺是一個主要問題,下圖展示了近幾年機器學(xué)習技術(shù)需求的暴增。
在更新數(shù)據(jù)基礎(chǔ)架構(gòu)方面,老牌金融企業(yè)不夠靈活。
我們會在后文慢慢討論如何克服這些問題,但是首先,我們先來看看為什么金融服務(wù)公司不能忽視機器學(xué)習。
為什么金融領(lǐng)域需要機器學(xué)習?
盡管面臨挑戰(zhàn),但許多金融公司還是已經(jīng)開始在業(yè)務(wù)中利用起這項技術(shù)。下面是金融公司高管親睞機器學(xué)習的原因:
自動化業(yè)務(wù)流程,降低運營成本。
提高了生產(chǎn)力,改善了用戶體驗,從而增加營收。
有利于保障、加強安全性、保密性。
有了各種各樣的開源機器學(xué)習算法和工具,公司就能更好地把它們用于財務(wù)數(shù)據(jù)分析,此外,成熟的金融服務(wù)公司往往擁有大量資金,他們也負擔得起在最先進的計算硬件上的花費。再加上金融領(lǐng)域存在大量定量歷史數(shù)據(jù),機器學(xué)習可以在這片沃土上大展拳腳。
至于落后者,隨著社會發(fā)展,現(xiàn)實會證明漠視AI和ML可能是個代價高昂的選擇。
機器學(xué)習在金融領(lǐng)域的應(yīng)用
讓我們來看看金融領(lǐng)域一些有前景的機器學(xué)習應(yīng)用。
流程自動化(Process Automation)
流程自動化是機器學(xué)習在金融領(lǐng)域最常見的應(yīng)用之一。它可以代替手動操作,由計算機自動執(zhí)行重復(fù)性任務(wù),提高企業(yè)生產(chǎn)率。
從這個角度看,機器學(xué)習機器學(xué)習使公司能夠優(yōu)化成本,改善客戶體驗并擴展服務(wù)。以下是PA的常見部署場景:
聊天機器人
呼叫中心自動化
文書工作自動化
員工培訓(xùn)游戲化等
如果這些概念太抽象,下面是一些公司的具體使用案例:
摩根大通——該公司推出了一個合約智能(COiN)平臺,可以利用自然語言處理技術(shù)處理法律文件并從中提取重要數(shù)據(jù)。如果是人工審查,處理12,000份年度商業(yè)信貸協(xié)議需要消耗約360,000個工時,但機器學(xué)習在短短幾個小時內(nèi)就完成了這個工作量。
BNY Mello——該公司把流程自動化集成到他們的銀行生態(tài)系統(tǒng)中,這項創(chuàng)新每年可為他們節(jié)省30萬美元,并且大大提升運營效率。
Wells Fargo——該公司用Facebook Messenger平臺上的AI聊天機器人和用戶通信,讓它們解決用戶密碼、賬戶方面的問題。
Privatbank——這是一家烏克蘭銀行,它在移動端和網(wǎng)絡(luò)平臺上都部署了聊天機器人客服,可以有效回答客戶的各類問題,還減少了人工客服的數(shù)量。
安全
隨著教育、用戶和第三方支付平臺數(shù)量的不斷增加,財務(wù)所面臨的安全威脅也正與日俱增。在這種情況下,機器學(xué)習堪稱檢測欺詐行為的利器。
銀行可以用機器學(xué)習實時監(jiān)控每個賬戶的數(shù)千個交易參數(shù)。算法可以通過檢查持卡人的行為動作,確定他是不是用戶本人。在金融服務(wù)中,各機構(gòu)使用的模型通常都具有高精度的特征。
如果系統(tǒng)識別出了可疑賬戶行為,它可以請求用戶提供額外的證明以驗證交易。如果系統(tǒng)認為這是欺詐行為的概率高達95%,它可以完全終止交易。作為計算機,它的評估用時只需短短幾秒,這有助于把犯罪苗頭及時扼殺,而不是在事發(fā)后才發(fā)出警報。
財務(wù)監(jiān)控是機器學(xué)習在金融領(lǐng)域的另一個安全用例。數(shù)據(jù)科學(xué)家可以訓(xùn)練一個可以檢測大量小額支付記錄的機器學(xué)習模型,用來標記可疑的洗錢行為。
此外,算法也可以顯著增強網(wǎng)絡(luò)安全性。由于機器學(xué)習在實時分析大量參數(shù)上的能力是首屈一指的,數(shù)據(jù)科學(xué)家有望利用它的這個優(yōu)勢發(fā)現(xiàn)、隔離網(wǎng)絡(luò)威脅。這也是網(wǎng)絡(luò)安全公司開始對這項技術(shù)產(chǎn)生興趣的一大原因。
Adyen、Payoneer、Paypal、Stripe和Skrill,這些金融科技公司已經(jīng)在機器學(xué)習網(wǎng)絡(luò)安全上投入了巨資。
承保和信用評分
機器學(xué)習算法完全適合被用于金融和保險中常見的承保任務(wù)。
數(shù)據(jù)科學(xué)家在數(shù)千個客戶檔案中訓(xùn)練模型,每個檔案都包含有關(guān)客戶信用評分高低的數(shù)百個數(shù)據(jù)條目。這之后,完成訓(xùn)練的模型就可以在現(xiàn)實環(huán)境中執(zhí)行相同的承保和信用評分任務(wù)。這種評分系統(tǒng)可以幫助人類員工更快、更準確地工作。
銀行和保險公司都擁有大量歷史消費者數(shù)據(jù),因此他們可以用這些數(shù)據(jù),或者用大型電信或公用事業(yè)公司生成的數(shù)據(jù)集來為客戶評分。
例如,墨西哥最大銀行BBVA Bancomer正與另一個信用評分平臺Destacame合作,為拉丁美洲客戶開發(fā)信貸準入機制。Destacame可以通過開放API訪問公用事業(yè)公司的賬單支付信息,利用這些歷史支付行為數(shù)據(jù),他們可以為客戶生成信用評分并將結(jié)果發(fā)送給銀行。
股票交易
在股票交易中,機器學(xué)習有助于做出更好的交易決策。數(shù)學(xué)模型可以通過實時監(jiān)控新聞和交易結(jié)果,檢測可能迫使股價上漲或下跌的事件,然后根據(jù)預(yù)測自動售出、持有或購入股票。
要知道,算法可以同時分析數(shù)千個數(shù)據(jù)源,這是人類交易員無法做到的。雖然機器學(xué)習模型不具備人類的“冒險”精神,始終在追逐小利,但鑒于大量的交易操作,這種小優(yōu)勢到最后通常會轉(zhuǎn)化為巨額利潤。
機器人顧問
機器人顧問,也稱智能投顧,現(xiàn)在在金融領(lǐng)域已經(jīng)是司空見慣的了。目前,這類機器學(xué)習應(yīng)用的用途主要有兩個:
投資組合管理。這是一種在線財富管理服務(wù),它使用算法和統(tǒng)計數(shù)據(jù)來分配、管理和優(yōu)化客戶的資產(chǎn)。當用戶輸入自己的當前資產(chǎn)和預(yù)期目標后,比如到50歲時擁有100萬美元,智能投顧會根據(jù)用戶的風險偏好和期望目標把資產(chǎn)按比例分配到各投資產(chǎn)品中。
金融產(chǎn)品推薦。許多在線保險服務(wù)會用智能投顧向特定用戶推薦個性化保險計劃。由于費用較低,個性化定制更準確,客戶也一般也更傾向于選擇機器人顧問,而不是個人理財顧問。
如何利用機器學(xué)習?
盡管人工智能和機器學(xué)習擁有極大優(yōu)勢,但事實上,即便是擁有雄厚財力的公司,他們也無法從這項技術(shù)中提煉出真正的價值。金融服務(wù)公司正迫切希望能抓住它帶來的獨特機會,但他們對這個技術(shù)的運作原理和應(yīng)用方式還只停留在一個模糊的概念上。
當部署機器學(xué)習模式時,他們會覺得缺少業(yè)務(wù)KPI,沒法衡量改變;如果制定了KPI,他們就會對模型產(chǎn)生各種不切實際的期望,并導(dǎo)致預(yù)算耗盡。對于企業(yè)來說,擁有適合的軟件基礎(chǔ)設(shè)施是不過的(盡管這是個良好開端),他們需要一個清晰愿景、扎實的技術(shù)人才資源,以及開發(fā)有價值的機器學(xué)習項目的決心。
一旦你充分了解這項技術(shù)將如何幫助公司實現(xiàn)業(yè)務(wù)目標,之后才是構(gòu)思、驗證。這是數(shù)據(jù)科學(xué)家的任務(wù):調(diào)研想法的可行性,幫助制定可行的KPI,并做出切合實際的估算。
請注意,如果企業(yè)要使用機器學(xué)習技術(shù),請務(wù)必收集所有需要的數(shù)據(jù)。
放棄機器學(xué)習,轉(zhuǎn)向大數(shù)據(jù)工程
通常情況下,如果一家金融公司突然覺得自己有必要開發(fā)機器學(xué)習服務(wù),那么這有很大的概率是他們只是需要數(shù)據(jù)工程建設(shè)。高級數(shù)據(jù)科學(xué)家Max Nechepurenko曾分享自己的經(jīng)驗:
在開發(fā)[數(shù)據(jù)科學(xué)]解決方案時,我建議使用奧卡姆剃刀法則,越簡單越好。大多數(shù)以機器學(xué)習為目標的公司實際上只需要數(shù)據(jù)工程,只要統(tǒng)計數(shù)據(jù)、分析數(shù)據(jù),再把結(jié)果可視化,他們的問題就迎刃而解了。
最基礎(chǔ)的數(shù)據(jù)分析工作足以讓銀行擺脫其運營中的各種瓶頸和低效率,比如消除重復(fù)性任務(wù)、提高人力資源調(diào)配效率、移動客戶端缺陷篩查等。
更重要的是,任何數(shù)據(jù)科學(xué)項目的一個最重要的組成部分是構(gòu)建協(xié)調(diào)的平臺生態(tài)系統(tǒng),讓它能從數(shù)百個來源(如CEM、Excel等)中收集孤立數(shù)據(jù)。在應(yīng)用算法前,首先,你要有數(shù)據(jù),其次,你要對數(shù)據(jù)進行適當?shù)念A(yù)處理,這通常占項目總用時的80%。
使用第三方機器學(xué)習解決方案
即便公司決定在項目中部署機器學(xué)習,你也沒有必要真的去自己開發(fā)新的算法和模型。
大多數(shù)機器學(xué)習工具都已經(jīng)被制作出來了,谷歌、微軟、亞馬遜和IBM等科技巨頭也將機器學(xué)習軟件作為一種服務(wù)出售。只要經(jīng)過訓(xùn)練,這些即用型解決方案可以解決公司所需的各種業(yè)務(wù)。如果公司自己開發(fā),你能確保最終成果會比這些巨頭的好用?
一個很好的例子是谷歌最近發(fā)布的AutoML,這類工具允許完全不懂機器學(xué)習的人根據(jù)任務(wù)目標定制機器學(xué)習模型,企業(yè)只要提供相關(guān)數(shù)據(jù)就可以了。雖然研究界內(nèi)部對此爭論不斷,但對于工業(yè)應(yīng)用來說,實用、方便、有效就行。
此外,現(xiàn)有機器學(xué)習算法并不適合所有問題,所以權(quán)衡取舍非常重要。
創(chuàng)新與整合
從頭開始開發(fā)機器學(xué)習解決方案是風險最大、成本最高且耗時最久的選擇之一。但對于某些特殊商業(yè)應(yīng)用,自己開發(fā)是唯一的方法。
需要注意的是,如果是研究和開發(fā)針對特定利基市場的機器學(xué)習模型,你必須對該市場進行深入調(diào)查。如果沒有為解決這些特定問題而開發(fā)的現(xiàn)成解決方案,那么第三方機器學(xué)習軟件很可能會產(chǎn)生不準確的結(jié)果。
為了降低難度,你會不可避免地要用到谷歌等公司的開源機器學(xué)習資源。那么企業(yè)該怎么成功推進機器學(xué)習研發(fā)項目呢?以下是我們總結(jié)的7個特征:
一個明確的目標。在收集數(shù)據(jù)前,你首先要對AI、ML實現(xiàn)的結(jié)果有大致了解。
機器學(xué)習解決方案的強大架構(gòu)設(shè)計。您需要經(jīng)驗豐富的軟件架構(gòu)師來執(zhí)行此任務(wù)。
適當?shù)拇髷?shù)據(jù)工程生態(tài)系統(tǒng) (基于Apache Hadoop或Spark)是必不可少的。它可以從金融服務(wù)公司的眾多孤立數(shù)據(jù)源中收集、集成、存儲和處理大量數(shù)據(jù),對于這個任務(wù),大數(shù)據(jù)架構(gòu)師和大數(shù)據(jù)工程師可以全權(quán)負責。
在新創(chuàng)建的生態(tài)系統(tǒng)上運行ETL過程。大數(shù)據(jù)架構(gòu)師或機器學(xué)習工程師可以執(zhí)行此任務(wù)。
最后的數(shù)據(jù)準備。完成數(shù)據(jù)預(yù)處理后,數(shù)據(jù)科學(xué)家還要進一步優(yōu)化數(shù)據(jù)分析,使其適用于特定的業(yè)務(wù)案例。
使用適當?shù)乃惴?,基于這些算法創(chuàng)建模型,微調(diào)模型以及使用新數(shù)據(jù)重新訓(xùn)練模型。
洞察力。除了智能領(lǐng)域?qū)<遥氵€需要一個好的前端來構(gòu)建易于使用的UI儀表板。
-
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249692 -
機器學(xué)習
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134656
原文標題:機器學(xué)習之金融應(yīng)用三問:Why?What?How?
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
華為構(gòu)筑AI-Powered智慧金融新聯(lián)接
華為星河AI金融網(wǎng)絡(luò)全新升級
在金融發(fā)展領(lǐng)域,嵌入式主板有什么優(yōu)點?
飛騰D2000工控主板,開啟智慧金融發(fā)展新高度
華為助力金融數(shù)字化變革
龍芯3A6000國產(chǎn)工控主板,成為智慧金融發(fā)展的“芯”力量
智慧金融自助終端創(chuàng)新發(fā)展,國產(chǎn)工控主板能發(fā)揮什么作用?
鯨啟智能機器人入選多項金融銀行機器人行業(yè)報告

國產(chǎn)工控機驅(qū)動金融行業(yè)發(fā)光發(fā)大,賦能金融領(lǐng)域的穩(wěn)定與創(chuàng)新
潤和軟件榮登2024智慧金融企業(yè)排行榜單
【「時間序列與機器學(xué)習」閱讀體驗】+ 簡單建議
【《時間序列與機器學(xué)習》閱讀體驗】+ 了解時間序列
中軟國際金融AI實驗室成立 引領(lǐng)金融科技新動力
軟通動力亮相2024中國國際金融展 筑數(shù)智金融新生態(tài)

評論