“所有在 AI 領域深耕的人,最終都會發(fā)現(xiàn)語義鴻溝仍是一個非常具有挑戰(zhàn)性的問題,這最終還需要借助知識圖譜等技術,來幫助將整體的 AI 認知取得新進展?!痹?5 月 26 日的 CTA 峰會機器學習專場,Hulu 首席研究主管謝曉輝如此說道。
某種程度上,機器學習技術的發(fā)展可能碰到了天花板,他的觀點說明知識圖譜對增強機器學習至關重要。當然,作為實現(xiàn)科學認知非常重要的一步,知識圖譜自身也有著復雜的技術和應用。
5 月 27 日,由 CSDN 與數(shù)字經(jīng)濟人才發(fā)展中心聯(lián)合主辦的CTA 核心技術及應用峰會在杭州國際博覽中心繼續(xù)進行。在知識圖譜專場,來自學界和業(yè)界的知名技術專家就知識圖譜領域的技術應用實踐、以及未來發(fā)展方向進行了全面深入的探討。他們分別是:
東南大學教授漆桂林
清華大學長聘教授李涓子
樂言科技 CTO、中文知識圖譜 zhishi.me 創(chuàng)建人王昊奮
百度知識圖譜構建與認知團隊負責人張揚
復旦大學教授、復旦大學知識工場實驗室負責人肖仰華
上海交通大學電子信息與電氣工程學院教授朱其立
螞蟻金服人工智能部技術專家劉陽陽
海知智能聯(lián)合創(chuàng)始人&CTO 丁力
北京知識圖譜科技有限公司CEO 吳剛
以下為上述各位嘉賓演講精華內(nèi)容,整理如下:
漆桂林:知識圖譜平臺化是知識圖譜成功的保證
作為本次知識圖譜論壇的出品人,東南大學教授漆桂林圍繞《知識圖譜的技術分析和平臺化路線》對相關需要關注的問題做了全局性的深入分析。
在他看來,知識圖譜平臺的出現(xiàn)極大促進了人工智能的發(fā)展,為機器提供認知思維能力和關聯(lián)分析能力?,F(xiàn)在,企業(yè)開始構建知識圖譜平臺已是必然趨勢。不過技術研發(fā)周期長、技術選項難、人才稀缺、成本高都是企業(yè)平臺化過程中的困難。未來,不僅有行業(yè)平臺,也會有公共平臺幫助降低知識圖譜技術應用的門檻,這需要我們沉淀各種數(shù)據(jù)和技術,快速構建知識圖譜以支撐行業(yè)應用,充分發(fā)揮知識圖譜的價值。
他還給出了知識圖譜構建經(jīng)驗總結(jié),主要有四點:知識圖譜項目應該緊緊把握需求驅(qū)動原則;知識圖譜項目成功與否不是看圖譜建多好,而是看需求是否滿足;每一個知識圖譜構建都是一個項目,控制成本是圖譜構建中的一個核心要素;簡單才是美,不要過于強調(diào)復雜算法(比如說很多 DL 模型)。
最后他總結(jié)稱,知識圖譜平臺化是知識圖譜成功的保證。知識圖譜平臺將跟機器學習平臺一樣,讓知識圖譜更好普及,而隨著知識圖譜平臺的發(fā)展,企業(yè)將需要更多知識工程師,而不是算法工程師,知識圖譜門檻也將降低。
李涓子:知識是人工智能的核心命題與關鍵基礎
清華大學長聘教授李涓子以《用知識為 AI 賦能》為題帶來了精彩的分享。她提到,知識是人工智能的核心命題與關鍵基礎。
專家系統(tǒng)讓人工智能應用于行業(yè),讓計算機解決領域中的問題?,F(xiàn)在到了構建一個生產(chǎn)知識的知識引擎,大規(guī)模應用知識的時代。而要實現(xiàn)機器智能,需要語言知識、常識知識、行業(yè)知識的知識。實現(xiàn)全類型知識的支持,要經(jīng)歷三個階段:增加專家系統(tǒng)的階段、統(tǒng)計學習的階段、可解釋的、魯棒性的人工智能階段,她希望實現(xiàn)一個可解釋的、魯棒的、可信的、安全的人工智能,未來主要的實現(xiàn)方法是知識驅(qū)動和數(shù)據(jù)驅(qū)動相結(jié)合的方法。
在她看來,未來可能在五到十年內(nèi)是知識圖譜逐漸成熟和發(fā)展的階段。從技術研究和整個核心技術發(fā)展與應用過程中可以看到,實現(xiàn)大規(guī)模的知識還面臨很多挑戰(zhàn),她還希望能有一個知識生態(tài),讓大家能共同貢獻知識。最后,她認為需要把知識圖譜技術平臺化,把數(shù)據(jù)轉(zhuǎn)化成知識,提供創(chuàng)新應用,發(fā)揮知識的價值。
王昊奮:知識圖譜不是一門學科,更像是一個工程
樂言科技 CTO、中文知識圖譜 zhishi.me 創(chuàng)建人王昊奮主要講述了知識驅(qū)動的智能問答在企業(yè)計算中的落地實踐。
為什么說智能問答越來越重要?因為它解決了信息過載的問題,同時知識圖譜技術的提出,使智能問答系統(tǒng)的能力更加強大。隨后,他從 IRQA(基于信息檢索的問答)、KBQA(基于知識庫的問答)、MRC(基于閱讀理解的回答)三種問答技術形態(tài)出發(fā),指出不同的 QA 技術擅長回答的問題不同,需要取長補短。
此外,王昊奮認為,知識圖譜并不是一個學科,其實更像是一個工程,它未來會結(jié)合自然語言處理、機器學習、數(shù)據(jù)庫等各方面技術的優(yōu)點和成果來去形成本身的應用。
張揚:構建易于開發(fā)者使用的開放知識圖譜平臺
百度知識圖譜構建與認知團隊負責人張揚主要回顧了百度知識圖譜的發(fā)展歷程,分為四個階段:
第一階段:2013 年以前,Pre-KG,其主要用于解決結(jié)構化數(shù)據(jù)生產(chǎn)與處理,以及穩(wěn)定的數(shù)據(jù)通路與時效性。
第二階段:2014 年-2015 年,領域知識圖譜,其主要挑戰(zhàn)在于知識表示、知識生產(chǎn)、知識更新、實體抽取、Tag 抽取等。
第三階段:2016 年-2017 年,通用知識圖譜。僅靠垂類數(shù)據(jù)無法滿足用戶在搜索推薦場景下的多樣化知識需求,這導致海量知識獲取、自動化知識表示、以及知識化搜索與推薦等方面的挑戰(zhàn)。期間,主要采用了知識抽取、知識抽取、知識化搜索、知識化推薦等方法。
第四階段:2018 年以后,多元異構知識圖譜,不僅包括關注點圖譜,還有實體圖譜、事件圖片、用戶圖片、POI 圖譜,同時將這些圖譜進行關聯(lián)。
最后張揚強調(diào),構建知識圖譜的過程具有一定工作量和門檻。百度希望構建一個開放的知識圖譜平臺,讓開發(fā)者更加聚焦于知識庫的應用,從而簡化開發(fā)過程。
肖仰華:知識圖譜技術引領下的大數(shù)據(jù)知識工程全新階段
復旦大學教授、復旦大學知識工場實驗室負責人肖仰華,詳細講述了大規(guī)模知識圖譜的構建過程,主要有三個核心要素:成本、規(guī)模、質(zhì)量。如果要更省人力進行驗證,以知識抽取為例:首先,利用弱監(jiān)督、遠程監(jiān)督的策略進行自動標注;其次,利用端到端深度學習模型降低特征工程代價;最后,利用先驗知識降低樣本依賴。
此外,他還回溯了知識工程的起源,是由符號主義推動。然后,互聯(lián)網(wǎng)時代的大規(guī)模開放應用,需要全新的知識表示,Google 知識圖譜誕生,代表著知識工程邁入大數(shù)據(jù)時代。這個時代下,傳統(tǒng)的方法已經(jīng)不適用,新的機遇與使命由數(shù)據(jù)驅(qū)動的大規(guī)模自動化知識抽取,可以利用眾包技術、高質(zhì)量的 UGC 等。
他還提到,知識將顯著增強加學習能力,包括降低機器學習模型的大樣本依賴,提高學習的經(jīng)濟性;提高機器學習模型對先驗知識的利用效率;提高機器學習模型與先驗知識的一致性。
肖仰華總結(jié)稱,大數(shù)據(jù)時代的到來,使得自動化知識獲取成為可能,知識工程有望突破知識庫的規(guī)模與質(zhì)量瓶頸。知識工程在知識圖譜技術引領下進入大數(shù)據(jù)知識工程全新階段(BigKE),BigKE 將顯著提升機器認知智能水平。
朱其立:構建電商概念的認知知識圖譜
上海交通大學電子信息與電氣工程學院教授朱其立講述了阿里巴巴電商認知圖譜構建的原因、認知圖譜的結(jié)構和算法模塊,以及主要的應用案例及前景介紹。他表示,對于電商,首先需要認識到用戶有哪些需求;其次,以商品為中心的知識體系在理解用戶需求時,存在天然缺陷。他還指出,要想來彌補這樣的語義鴻溝,需要構建開放域概念和電商概念的認知知識圖譜。
那么,在構建認知知識圖譜的過程中,團隊提出了原子概念 (Primitive Concepts)的策略。他依次講述了原子概念的分類體系、原子概念的消歧、電商概念的挖掘、電商概念的生成、以及關系構建。此外,他還指出,構建該知識圖譜需要在實體識別、文本消歧、關系識別、短文本生成等關鍵 NLP 技術上實現(xiàn)突破,目前主要應用于搜索、推薦、解釋等場景中。
劉陽陽:金融場景下知識圖譜技術的應用實踐
螞蟻金服人工智能部技術專家劉陽陽分享了螞蟻金服知識圖譜相關的進展,以及金融場景下知識圖譜技術的實踐與應用,他分別從智能理賠、智能保顧、智能推薦三個場景對此進行了說明。劉陽明表示,知識圖譜的應用更主要是深入理解業(yè)務的痛點是什么,知識圖譜在其中能解決什么問題。
丁力:構建知識圖譜的五點實踐經(jīng)驗
知識圖譜是開放人機協(xié)同管理的知識組織機制,不但為開放數(shù)據(jù)互聯(lián)與融合提供了規(guī)范,也為領域知識圖譜的積累與復用提供協(xié)同管理機制。海智智能聯(lián)合創(chuàng)始人&CTO 丁力表示,在應用層上,知識圖譜要考慮算法,另一方面還需要考慮如何在終端用戶中體現(xiàn)價值與特色,讓更多終端用戶使用平臺解決實際問題。
何時使用知識圖譜?知識圖譜作為一種面向人機協(xié)同的開放知識管理機制,有特定價值和成本。對于具體業(yè)務問題而言,知識圖譜并非唯一的解決方案,也不總是更好的解決方案。海智智能聯(lián)合創(chuàng)始人&CTO 丁力給出了五點實踐經(jīng)驗:
這是一個封閉的系統(tǒng)還是開放的系統(tǒng)。 涉及到融合外部數(shù)據(jù),尤其是文本數(shù)據(jù)與結(jié)構化數(shù)據(jù)的融合,或者后續(xù)未知的數(shù)據(jù)修訂,知識圖譜會產(chǎn)生價值。
是否涉及復雜的關系查詢。關系數(shù)據(jù)庫同樣可以處理關系查詢,知識圖譜結(jié)合圖數(shù)據(jù)處理平臺則可以高效處理對復雜子圖(多層 JOIN)的探索式查詢。
是否要作為企業(yè)內(nèi)部數(shù)據(jù)標準化的一部分。一個獨立的業(yè)務系統(tǒng)可自洽運行,但是當與企業(yè)內(nèi)部其他信息系統(tǒng)對接,需要標準化的可理解的數(shù)據(jù)接口。
系統(tǒng)可以復用規(guī)則推理、圖分析、機器學習等常見人工智能模塊,知識圖譜通過通用的數(shù)據(jù)接口和可復制的研發(fā)流程,提升系統(tǒng)構建效率
能否承擔實施知識圖譜基礎設施的成本。
此外,他還從知識圖譜的模板化解決方案、數(shù)據(jù)模型的選擇、本體概念體系的選擇三大層面講述了知識圖譜建模的技術要點。
吳剛:知識圖譜如何賦能企業(yè)智能化升級
北京知識圖譜科技有限公司 CEO 吳剛總結(jié)了五點知識圖譜項目挑戰(zhàn):數(shù)據(jù)壁壘,高質(zhì)量知識獲取難,數(shù)據(jù)結(jié)構化、知識融合難;平臺工具:技術棧長,知識圖譜構建和運維成本相對高;專業(yè)知識:知識專業(yè)性強,需行業(yè)專家技術團隊的磨合,知識模型建立;閉環(huán)系統(tǒng):半自動化學習、可迭代更新的閉環(huán)智能應用。
由此,他給出業(yè)界在做知識圖譜項目技術應用建議:控制成本、小步快走、快速迭代。這就需要具備以下能力:實踐與理論的鴻溝,從解決問題出發(fā);工程開發(fā)能力;算法落地(nlp,機器學習);數(shù)據(jù)處理(爬蟲、ETL、數(shù)據(jù)清洗、本體構建、圖譜構建)。
最后,他還給出了知識圖譜技術及應用趨勢:
知識圖譜與深度學習、語音識別、圖像識別等技術深度結(jié)合,打通感知到認知;
知識圖譜應用場景由淺至深,逐漸沉淀高質(zhì)量精細化行業(yè)知識圖譜;
企業(yè)數(shù)據(jù)壁壘逐漸打通,應用從 BI 到 AI;
全生命周期知識圖譜開放平臺化,構建與運維成本大大降低,人機協(xié)同,集成算法和行業(yè)模型,閉環(huán)迭代,半自動化自學習。
圓桌對話:知識圖譜產(chǎn)學研合作如何兼顧研究和落地?
在知識圖譜圓桌對話環(huán)節(jié),樂言科技 CTO 王昊奮發(fā)問,知識圖譜處在一個半實用、半研發(fā)的階段,如何去迭代螺旋上升?同時,現(xiàn)在在知識圖譜的項目合作上,如何兼顧陽春白雪的研究和扎扎實實的落地?在場嘉賓分享了各自觀點。
肖仰華:與人合作很重要,我覺得陽春白雪的研究和扎扎實實的落地都需要。高??梢栽谶@兩個方面發(fā)揮作用。陽春白雪探索一些新的知識表示機制、模型、算法,企業(yè)很難花時間做的事情委托高校去研究。為什么說高校也可以發(fā)揮落地作用?企業(yè)不缺某一個算法,缺的是不知道怎樣把這些算法拼起來,在工程咨詢方面可以找高校合作,但工業(yè)界不要對學校團隊有過高的期望。另外,偏研究的團隊不要期望落地,偏落地的團隊不要期望偏陽春白雪。
李涓子:知識圖譜落地肯定是企業(yè)切實的需求,學界可以幫助建立知識圖譜整體架構。而企業(yè)落地本身存在的問題,也可以把它變成研究問題。另外高校可能還應該在研究的前沿性要有一定前瞻性,比如我們還是希望能做常識知識的表示和推理,通過能夠結(jié)合知識驅(qū)動和數(shù)據(jù)驅(qū)動的方法做一些常識知識推理工作。
張揚:企業(yè)和高校其實各有各的優(yōu)勢。高校的研究可能比較前沿,企業(yè)的優(yōu)勢就是可以快速的把技術轉(zhuǎn)換成商業(yè)產(chǎn)品。企業(yè)跟高校的合作,可以把問題的邊界定義清楚,這樣項目會更加可控。
朱其立:企業(yè)和高校雙方應該坐下來,讓高校先了解企業(yè)需求,然后把這個需求抽象成一個科學問題,高校負責解決科學問題,科學問題在公開的數(shù)據(jù)上面做得比較好后,再把解決問題上獲取的知識傳遞給公司或者企業(yè)去具體實現(xiàn),在數(shù)據(jù)上做一些測試、評估。如此迭代做下去,既有陽春白雪,又有實際應用。
吳剛:像創(chuàng)業(yè)公司肯定不能像BAT的合作方式,后者有大量資金和時間支持。創(chuàng)業(yè)公司更多從應用層面出發(fā),不完全是做工程。高??赡茉趨⑴c國家大型課題或者算法有很多的積累,雙方可以結(jié)合起來,通過結(jié)合算法,少部分的工程能力,為客戶做出產(chǎn)品,最后再投錢進行更好的產(chǎn)學研合作。
至此,為其兩天的 CTA核心技術與應用峰會圓滿結(jié)束。
-
人工智能
+關注
關注
1806文章
49028瀏覽量
249518 -
機器學習
+關注
關注
66文章
8503瀏覽量
134619 -
知識圖譜
+關注
關注
2文章
132瀏覽量
8008
原文標題:為什么說深耕AI領域繞不開知識圖譜?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
上海光機所在激光燒蝕曲面元件理論研究中取得新進展

東風汽車轉(zhuǎn)型突破取得新進展
百度在AI領域的最新進展
蘭州大學:研究團隊在溫度傳感用發(fā)光材料領域取得新進展

西安光機所在太赫茲超表面逆向設計領域取得新進展

谷歌Gemini API最新進展
華為公布AI基礎設施架構突破性新進展
上海光機所在激光燒蝕波紋的調(diào)制機理研究中取得新進展

FF將發(fā)布FX品牌最新進展
Qorvo在射頻和電源管理領域的最新進展
三星自主研發(fā)知識圖譜技術,強化Galaxy AI用戶體驗與數(shù)據(jù)安全
芯片和封裝級互連技術的最新進展
AI大模型的最新研究進展
5G新通話技術取得新進展
中國科學院西安光機所智能光學顯微成像研究取得新進展

評論