專家系統(tǒng)研究現(xiàn)狀與展望
摘要:回顧了專家系統(tǒng)發(fā)展的歷史和現(xiàn)狀,對目前比較成熟的專家系統(tǒng)模型進行分析,指出各自的特點和局限性。最后對專家系統(tǒng)的熱點進行展望和對新型專家系統(tǒng)的介紹。
關鍵詞:專家系統(tǒng);知識獲?。粩?shù)據(jù)挖掘;多Agent系統(tǒng);人工神經(jīng)網(wǎng)絡
0? 引言
近三十年來人工智能(Artificial Intelligence,AI)獲得了迅速的發(fā)展,在很多學科領域都獲得了廣泛應用,并取得了豐碩的成果。作為人工智能一個重要分支的專家系統(tǒng)(Expert System,ES)[1]是在20世紀60年代初期產(chǎn)生和發(fā)展起來的一門新興的應用科學,而且正隨著計算機技術的不斷發(fā)展而日臻完善和成熟。1982年美國斯坦福大學教授費根鮑姆給出了專家系統(tǒng)的定義:“專家系統(tǒng)是一種智能的計算機程序,這種程序使用知識與推理過程,求解那些需要杰出人物的專門知識才能求解的復雜問題?!?br>一般認為,專家系統(tǒng)就是應用于某一專門領域,由知識工程師通過知識獲取手段,將領域?qū)<医鉀Q特定領域的知識,采用某種知識表示方法編輯或自動生成某種特定表示形式,存放在知識庫中,然后用戶通過人機接口輸入信息、數(shù)據(jù)或命令,運用推理機構控制知識庫及整個系統(tǒng),能像專家一樣解決困難的和復雜的實際問題的計算機(軟件)系統(tǒng)。
專家系統(tǒng)有三個特點,即:啟發(fā)性,能運用專家的知識和經(jīng)驗進行推理和判斷;透明性,能解決本身的推理過程,能回答用戶提出的問題;靈活性,能不斷地增長知識,修改原有的知識。
1 專家系統(tǒng)的產(chǎn)生與發(fā)展
專家系統(tǒng)按其發(fā)展過程大致可分為三個階段[2~4]:初創(chuàng)期(1971年前),成熟期(1972—1977年),發(fā)展期(1978年至今)。
1.1 初創(chuàng)期
人工智能早期工作都是學術性的,其程序都是用來開發(fā)游戲的。盡管這些努力產(chǎn)生了如國際象棋、跳棋等有趣的游戲[5],但其真實目的在于計算機編碼加入人的推理能力,以達到更好的理解。在這階段的另一個重要領域是計算邏輯。1957年誕生了第一個自動定理證明程序,稱為邏輯理論家。20世紀60年代初,人工智能研究者便集中精力開發(fā)通用的方法和技術,通過研究一般的方法來改變知識的表示和搜索,并且使用它們來建立專用程序。到了60年代中期,知識在智能行為中的地位受到了研究者的重視,這就為以專門知識為核心求解具體問題的基于知識的專家系統(tǒng)的產(chǎn)生奠定了思想基礎。
?1965年在美國國家航空航天局要求下,斯坦福大學研制成功了DENRAL系統(tǒng)[6],DENRAL的初創(chuàng)工作引導人工智能研究者意識到智能行為不僅依賴于推理方法,更依賴于其推理所用的知識。該系統(tǒng)具有非常豐富的化學知識,是根據(jù)質(zhì)譜數(shù)據(jù)幫助化學家推斷分子結構,被廣泛地應用于世界各地的大學及工業(yè)界的化學實驗室。這個系統(tǒng)的完成標志著專家系統(tǒng)的誕生。在此之后,麻省理工學院開始研制MACSYMA系統(tǒng)[2],它作為數(shù)學家的助手使用啟發(fā)式方法變換代數(shù)表達式,現(xiàn)經(jīng)過不斷擴充,能求解600多種數(shù)學問題,其中包括微積分、矩陣運算、解方程和解方程組等。同期,還有美國卡內(nèi)基-梅隆大學開發(fā)的用于語音識別的專家系統(tǒng)HEARSAY[7],該系統(tǒng)表明計算機在理論上可按編制的程序同用戶進行交談。20世紀70年代初,匹茲堡大學的鮑波爾和內(nèi)科醫(yī)生合作研制了第一個用于醫(yī)療的內(nèi)科病診斷咨詢系統(tǒng)INTERNIST[8]。這些系統(tǒng)的研制成功使得專家系統(tǒng)受到學術界及工程領域的廣泛關注。
1.2 成熟期
到20世紀70年代中期,專家系統(tǒng)已逐步成熟起來,其觀點逐漸被人們接受,并先后出現(xiàn)了一批卓有成效的專家系統(tǒng)。其中,最為代表的是肖特立夫等人的MYCIN系統(tǒng)[9],該系統(tǒng)用于診斷和治療血液感染和腦炎感染,可給出處方建議(提供抗菌劑治療建議),不但具有很高的性能,而且具有解釋功能和知識獲取功能。MYCIN系統(tǒng)是專家系統(tǒng)的經(jīng)典之作,它的知識表示系統(tǒng)用帶有置信度的“IF—THEN”規(guī)則來表示,并使用不確定性推理方法進行推理。MYCIN由LISP語言寫成,所有的規(guī)則都表達成LISP表達式。它是一個面向目標求解的系統(tǒng),使用反向推理方法,并利用了很多的啟發(fā)式信息。
另一個非常成功的專家系統(tǒng)是PROSPCTOR系統(tǒng)[10],它用于輔助地質(zhì)學家探測礦藏,是第一個取得明顯經(jīng)濟效益的專家系統(tǒng)。PROSPCTOR的性能據(jù)稱完全可以同地質(zhì)學家相比擬。它在知識的組織上,運用了規(guī)則與語義網(wǎng)相結合的混合表示方式,在數(shù)據(jù)不確定和不完全的情況下,推理過程運用了一種似然推理技術。除這些成功實例以外,在這一時期另外兩個影響較大的專家系統(tǒng)是斯坦福大學研制的AM系統(tǒng)及PUFF系統(tǒng)[8]。AM是一個用機器模擬人類歸納推理、抽象概念的專家系統(tǒng),而PUFF是一個肺功能測試專家系統(tǒng),經(jīng)對多個實例進行驗證,成功率達93%。諸多專家系統(tǒng)地成功開發(fā),標志著專家系統(tǒng)逐漸走向成熟。
1.3? 發(fā)展期
從20世紀80年代初,醫(yī)療專家系統(tǒng)占了主流,主要原因是它屬于診斷類型系統(tǒng)且開發(fā)比較容易。但是到了80年代中期,專家系統(tǒng)發(fā)展在應用上最明顯的特點是出現(xiàn)了大量的投入商業(yè)化運行的系統(tǒng),并為各行業(yè)產(chǎn)生了顯著的經(jīng)濟效益。其中一個著名的例子是DEC公司與卡內(nèi)基-梅隆大學合作開發(fā)的XCON-R1專家系統(tǒng)[2],它用于輔助數(shù)據(jù)設備公司(DEC)的計算機系統(tǒng)的配置設計,每年為DEC公司節(jié)省數(shù)百萬美元。專家系統(tǒng)的應用日益廣泛,處理問題的難度和復雜度不斷增大,導致了傳統(tǒng)的專家系統(tǒng)無法滿足較為復雜的情況,迫切需要新的方法和技術去支持。
從80年代后期開始,一方面隨著面向?qū)ο?、神?jīng)網(wǎng)絡和模糊技術等新技術迅速崛起,為專家系統(tǒng)注入了新的活力;另一方面計算機的運用也越來越普及,而且對智能化的要求也越來越高。由于這些技術發(fā)展的成熟,并成功運用到專家系統(tǒng)之中,使得專家系統(tǒng)得到更廣泛的運用。在這期間開發(fā)的專家系統(tǒng)按其處理問題的類型可以分為:解釋型、預測型、診斷型、設計型、規(guī)劃型、監(jiān)視型、調(diào)試型、修正型、教學型和控制型[11]。其應用領域也涉及到農(nóng)業(yè)、商業(yè)、化學、通信、計算機系統(tǒng)、醫(yī)學等多個方面,并已成為人們常用的解決問題的手段之一。
2 專家系統(tǒng)的研究現(xiàn)狀
目前已研究的專家系統(tǒng)模型有很多種,其中較為流行的有:基于規(guī)則的專家系統(tǒng)、基于案例的專家系統(tǒng)、基于框架的專家系統(tǒng)、基于模糊邏輯的專家系統(tǒng)、基于D-S證據(jù)理論的專家系統(tǒng)、基于人工神經(jīng)網(wǎng)絡的專家系統(tǒng)和基于遺傳算法的專家系統(tǒng)等。這些專家系統(tǒng)的優(yōu)缺點及技術要點如下。
2.1 基于規(guī)則的專家系統(tǒng)
基于規(guī)則推理(Rule Base Reasoning,RBR)的方法是根據(jù)以往專家診斷的經(jīng)驗, 將其歸納成規(guī)則,通過啟發(fā)式經(jīng)驗知識進行推理。它具有明確的前提,得到確定的結果。它是構建專家系統(tǒng)最常用的方法,這主要歸功于大量的成功實例和工具的出現(xiàn)。早期的專家系統(tǒng)大多數(shù)是用規(guī)則推理的方法,如DENDRAL專家系統(tǒng)、MYCIN專家系統(tǒng)、PROSPECTOR專家系統(tǒng)等。在轉(zhuǎn)化為機器語言時,用產(chǎn)生式的“IF…AND(OR)…THEN…”表示。因此這種系統(tǒng)又稱為產(chǎn)生式專家系統(tǒng)。
基于規(guī)則的方法容易使知識工程師與人類專家合作,易于被人類專家理解。規(guī)則庫中的規(guī)則具有相同的結構,即“IF…THEN…”結構,這種統(tǒng)一的格式便于管理,同時便于推理機的設計。但它也有諸多缺點,如規(guī)則間的互相關系不明顯,知識的整體形象難以把握、處理效率低、推理缺乏靈活性[12,13]。它對于復雜系統(tǒng)難以用結構化數(shù)據(jù)來表達,如果全部用規(guī)則的形式來表達,不僅提煉規(guī)則相當困難,而且規(guī)則庫將十分龐大和復雜,容易產(chǎn)生“組合爆炸”。它在實時處理方面的應用也己被證明比較困難,速度是實時性能最根本的要求,而產(chǎn)生式系統(tǒng)在處理實時任務時,其搜索、匹配時間要占全部計算時間的90%。
基于規(guī)則的專家系統(tǒng)的特點決定適合的領域為:①系統(tǒng)結構簡單,有明確的前提和結論,問題僅僅用有限地規(guī)則即可全部包含;②問題領域不存在簡潔統(tǒng)一的理論,知識是經(jīng)驗的;③問題的求解可被一系列的相對獨立的操作,或者問題的求解可視為從一個狀態(tài)向另一個狀態(tài)的轉(zhuǎn)換,一個操作或轉(zhuǎn)換可以被有效地表示為一條或多條產(chǎn)生式語句。
2.2 基于案例的專家系統(tǒng)
基于案例推理(Case Based Reasoning,CBR)的方法就是通過搜索曾經(jīng)成功解決過的類似問題,比較新、舊問題之間的特征、發(fā)生背景等差異,重新使用或參考以前的知識和信息,達到最終解決新問題的方法。它起源于1982年美國學者Roger Schank(關于人類學習和回憶的動態(tài)存儲模型的研究工作)。第一個真正意義上的基于案例的專家系統(tǒng)是1983年由耶魯大學Janet Kolodner教授領導開發(fā)的CYRUS系統(tǒng)。它以Schank的動態(tài)存儲模型和問題求解的MOP(Memory Organized Packet)理論為基礎,做與旅行相關的咨詢工作。這種類比推理比較符合人類的認知心理。
基于案例的專家系統(tǒng)具有諸多優(yōu)點: 無須顯示領域知識;無須規(guī)則提取,降低知識獲取難度;開放體系,增量式學習,案例庫的覆蓋度隨系統(tǒng)的不斷使用而組建增加[14]?;诎咐耐评矸椒ㄟm用于領域定理難以表示成規(guī)則形式, 而是容易表示成案例形式并且已積累豐富案例的領域(如醫(yī)學診斷系統(tǒng))[15]。它的難點還在于案例特征的選擇、權重分配以及處理實例修訂時的一致性檢驗(特征變量間的約束關系) 等問題。傳統(tǒng)的基于案例的方法難以表示案例間的聯(lián)系,對于大型案例庫案例檢索十分費時, 并且難以決定應選擇哪些特征數(shù)據(jù)及它們的權重[16]。
2.3 基于框架的專家系統(tǒng)
框架(Frame) 是將某類對象的所有知識組織在一起的一種通用數(shù)據(jù)結構,而相互關聯(lián)的框架連接組成框架系統(tǒng)。1975年美國麻省理工學院的著名的人工智能學者明斯基在其論文中提出了框架理論,并把它作為理解視覺、自然語言對話及其它復雜行為的基礎。在框架理論中, 框架被視作表示知識的一個基本單位。它把要描述的事務各方面的知識放在一起, 通過槽值關聯(lián)起來??蚣艿捻攲邮谴砟硞€對象的框架名,其下為代表該框架某一方面屬性的若干個槽, 槽由槽名和槽值組成。槽下還可分為若干個側(cè)面(由側(cè)面名和側(cè)面值組成)。
一個框架系統(tǒng)常被表示成一種樹形結構,樹的每一個節(jié)點是一個框架結構,子節(jié)點與父節(jié)點之間用槽連接。當子節(jié)點的某些槽值或側(cè)面值沒有被直接記錄時,可以從其父節(jié)點繼承這些值??蚣芟到y(tǒng)中可以推理出未被觀察到的事實,它將通過以下三種途徑實現(xiàn)[16,17]:①框架包含它所描述的情況或物體的多方面的信息。這些信息可以被引用,就像已經(jīng)直接觀察到這些信息一樣。②框架包含物體必須具有的屬性。在填充框架的各個槽時,要用到這些屬性。建立對某一情況的描述要求先建立對此情況的各個方面的描述。與描述這個情況的框架中的各個槽有關的信息可用來指導如何建立這些方面的描述。③框架描述它們所代表的概念的典型事例。如果某一情況在很多方面和一個框架相匹配,只有少部分相互之間存在不同之處,這些不同之處很可能對應于當前情況的重要方面,也許應該對這些不同之處做出解答。
框架表示法最突出的特點是善于表達結構性的知識,且具有良好的繼承性和自然性。因此,基于框架的專家系統(tǒng)適合于具有固定格式的事物、動作或事件。
2.4? 基于模糊邏輯的專家系統(tǒng)
模糊理論的概念由美國加利福尼亞大學著名教授扎德在他的《Fuzzy Sets》和《Fuzzy Algorithm》等著名論著中首先提出。模糊性是指客觀事物在狀態(tài)及其屬性方面的不分明性,其根源是在類似事物間存在一系列過渡狀態(tài),它們互相滲透、互相貫通,使得彼此之間沒有明顯的分界線。模糊性是客觀世界中某些事物本身所具有的一種不確定性,它與隨機性有著本質(zhì)的區(qū)別。有明確定義但不一定出現(xiàn)的事件中包含的不確定性稱為隨機性,它不因人的主觀意識變化,由事物本身的因果規(guī)律決定。而已經(jīng)出現(xiàn)但難以給出精確定義的事件中包含的不確定性稱為模糊性,是由事物的概念界限模糊和人的主觀推理與判斷產(chǎn)生的。模糊邏輯理論則是對模糊事物相互關系的研究。
基于模糊邏輯的專家系統(tǒng)的優(yōu)點在于[18]:①具有專家水平的專門知識,能表現(xiàn)專家的技能和高度的技巧以及有足夠的魯棒性;②能進行有效的推理,具有啟發(fā)性,能夠運用人類專家的經(jīng)驗和知識進行啟發(fā)性的搜索、試探性的推理;③具有靈活性和透明性。但是,模糊推理知識獲取困難,尤其是征兆的模糊關系較難確定,且系統(tǒng)的推理能力依賴模糊知識庫,學習能力差,容易發(fā)生錯誤。由于模糊語言變量是用隸屬函數(shù)表示的,實現(xiàn)語言變量與隸屬函數(shù)之間的轉(zhuǎn)換是一個難點。
2.5? 基于D-S證據(jù)理論的專家系統(tǒng)
D-S證據(jù)理論是由Dempster于1967年提出的,他首先提出了上、下界概率的定義,后由Shafer于1976年加以推廣和發(fā)展,故人們也把證據(jù)理論稱為D- S理論。證據(jù)理論可處理由不知道因素所引起的不確定性,它采用信任函數(shù)而不是概率作為度量,通過對一些事件的概率加以約束以建立信任函數(shù)而不必說明精確的難以獲得的概率,當約束限制為嚴格的概率時,它就成為概率論[19]。
基于D-S證據(jù)理論的專家系統(tǒng)的優(yōu)點在于[20]:①既能處理隨機性所導致的不確定性,又能處理由于模糊性所導致的不確定性;②系統(tǒng)可以依靠證據(jù)的積累,不斷縮小假設集;③能在不同層次上組合證據(jù)。D-S理論具有比較強的理論基礎,它能將“不知道”和“不確定”區(qū)分開來,但它也存在明顯的不足。當證據(jù)沖突度較高時,經(jīng)過其組合規(guī)則得到的結論常常有悖常理。另外,基于D-S理論的專家系統(tǒng)在數(shù)據(jù)較多時,具有潛在的指數(shù)復雜度和推理鏈較長的缺點。
2.6? 基于人工神經(jīng)網(wǎng)絡的專家系統(tǒng)
人工神經(jīng)網(wǎng)絡(Artificial Neural Network ,ANN)是仿效生物體信息處理系統(tǒng)獲得柔性信息處理能力。它是從20世紀80年代后期開始興起(有理論研究階段發(fā)展到應用階段)。它是從微觀上模擬人腦功能,是一種分布式的微觀數(shù)值模型,神經(jīng)元網(wǎng)絡通過大量經(jīng)驗樣本學習知識。更重要的是,神經(jīng)網(wǎng)絡有極強的自學習能力,對于新的模式和樣本可以通過權值的改變進行學習﹑記憶和存儲,進而在以后的運行中能夠判斷這些新的模式。
神經(jīng)網(wǎng)絡模型從知識表示、推理機制到控制方式,都與目前專家系統(tǒng)中的基于邏輯的心理模型有本質(zhì)的區(qū)別。知識從顯示變?yōu)殡[式表示,這種知識不是通過人的加工轉(zhuǎn)換成規(guī)則,而是通過學習算法自動獲取的。推理機制從檢索和驗證過程變?yōu)榫W(wǎng)絡上隱含模式對輸入的競爭,這種競爭是并行的針對特定特征的,并把特定論域輸入模式中各個抽象概念轉(zhuǎn)化為神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)。神經(jīng)網(wǎng)絡很好解決了專家系統(tǒng)中知識獲取的“瓶頸”問題,能使專家系統(tǒng)具有自學習能力。神經(jīng)網(wǎng)絡技術的出現(xiàn)為專家系統(tǒng)提供了一種新的解決途徑。特別是對于實際中難以建立數(shù)學模型的復雜系統(tǒng),神經(jīng)網(wǎng)絡更顯示出其獨特的功效。
然而, 神經(jīng)網(wǎng)絡專家系統(tǒng)也存在固有的弱點:①系統(tǒng)性能受到所選擇的訓練樣本集的限制, 訓練樣本集選擇不當,特別是在訓練樣本集很少的情形下,很難指望它具有較好的歸納推理能力;②神經(jīng)網(wǎng)絡沒有能力解釋自己的推理過程和推理依據(jù)及其存儲知識的意義;③神經(jīng)網(wǎng)絡利用知識和表達知識的方式單一,通常的神經(jīng)網(wǎng)絡只能采用數(shù)值化的知識;④神經(jīng)網(wǎng)絡只能模擬人類感覺層次上的智能活動,在模擬人類復雜層次的思維方面還有不足之處。
目前較為常用的神經(jīng)網(wǎng)絡有:誤差反傳網(wǎng)絡(BP)、小腦網(wǎng)絡(CMAC)、自組織特征映射網(wǎng)絡(SOM)、自適應共振理論(ART)、徑向基網(wǎng)絡(REF)等等。基于神經(jīng)網(wǎng)絡的專家系統(tǒng)的具體應用形式可以根據(jù)實際情況選擇不同的神經(jīng)網(wǎng)絡模型,能夠?qū)崿F(xiàn)不同的用途。因此,基于神經(jīng)網(wǎng)絡的專家系統(tǒng)是目前最流行的專家系統(tǒng)。
2.7 基于遺傳算法的專家系統(tǒng)
遺傳算法(Genetic Algorithms,GA)是一種基于自然選擇和基因遺傳學原理的優(yōu)化搜索方法。由美國John H.Holland教授在1975年提出的。遺傳算法將問題的求解表示成“染色體”,從而構成一群“染色體”。將它們置于問題的“環(huán)境”中,根據(jù)適者生存的原則,從中選擇出適應環(huán)境的“染色體”進行復制,通過交換、變異兩種基因操作產(chǎn)生出新的一代更適應環(huán)境的“染色體”群,這樣一代一代地不斷進化,最后收斂到一個最適合環(huán)境的個體上,求得問題的最優(yōu)解[21]。
遺傳算法是模擬自然選擇和遺傳機制的一種搜索和優(yōu)化算法,與一般的尋優(yōu)方法相比,遺傳算法具有很多優(yōu)點:①從許多初始點開始進行并行操作,克服了傳統(tǒng)優(yōu)化方法容易陷入局部極點的缺點,是一種全局優(yōu)化算法;②對變量的編碼進行操作,可以替代梯度算法,在模糊推理隸屬度函數(shù)形狀的選取上具有更大的靈活性;③由于具有隱含并行性,所以可通過大規(guī)模并行計算來提高計算速度;④可在沒有任何先驗知識和專家知識的情況下取得次優(yōu)或最優(yōu)解。
遺傳算法作為優(yōu)化搜索算法,一方面希望在寬廣的空間內(nèi)進行搜索,從而提高求得最優(yōu)解的概率;另一方面又希望向著解的方向盡快縮小搜索范圍,從而提高搜索效率。如何同時提高搜索最優(yōu)解的概率和效率,是遺傳算法的一個需要進一步探索的問題。
3? 專家系統(tǒng)的研究熱點
?目前,專家系統(tǒng)的研究不再滿足現(xiàn)有的各種模型與專家系統(tǒng)簡單的相結合,形成基于某種模型的專家系統(tǒng)了,而是在不斷向深層次方向發(fā)展。針對專家系統(tǒng)的核心的知識表示和知識獲取,探索更方便的、更有效的方法,解決困擾專家系統(tǒng)的知識獲取 “瓶頸”、“匹配沖突”、“組合爆炸”等問題。針對現(xiàn)在數(shù)據(jù)多,而知識少的特點,將數(shù)據(jù)挖掘引入專家系統(tǒng)之中。以及多Agent技術用于專家系統(tǒng),來提高專家系統(tǒng)的性能。
3.1 知識的表示和獲取
知識就是人類通過實踐(包括學習、模仿、試驗、生理等實踐活動)認識到的客觀世界的規(guī)律性的東西,是信息經(jīng)過加工、整理、解釋、挑選和改造而形成的。知識表示就是為描述世界所做的一組約定,是知識符號化的過程。這種描述或約定表達了計算機可以接受的人類的智能行為。知識表示是專家系統(tǒng)的關鍵點之一,一個專家系統(tǒng)的建造成功與否和采用的知識表示方法能否充分反映該領域知識有直接關系。知識獲取又稱機器學習,是將客觀世界中知識轉(zhuǎn)化為專家系統(tǒng)中知識的過程。它是專家系統(tǒng)不可缺少的一個組成部分。如何獲取足夠的、完整的和明確的知識是專家系統(tǒng)的另一個關鍵點。
知識的表示可以分為表層表示、深層表示和混合表示三種。而混合知識的表示是目前研究的一個熱點方向。在專家系統(tǒng)的實際開發(fā)中,所采用的方法和知識的表示都不會是單一的,往往需要將多種知識表示方法有機的結合起來,去解決單一的知識表示無法解決的問題。
知識的自動獲取一直是專家們感興趣的研究方向,也是一項十分困難的研究任務。由于現(xiàn)在開發(fā)的專家系統(tǒng)向大規(guī)模系統(tǒng)和通用型系統(tǒng)發(fā)展,越來越希望能夠機器自動獲取知識,減少開發(fā)人員的手動或半自動開發(fā)的工作量。隨著神經(jīng)網(wǎng)絡的蓬勃發(fā)展,傳統(tǒng)的符號學習與連接機制已經(jīng)逐步被取代。基于進化學習系統(tǒng)和遺傳算法,因吸取了歸納學習與連接機制的長處而受到重視。數(shù)據(jù)挖掘、計算機數(shù)據(jù)庫和計算機網(wǎng)絡的發(fā)展都為提取有用知識提供了新的方法。
3.2 數(shù)據(jù)挖掘技術的應用
?數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識的過程。它是近幾年興起的一個極有發(fā)展前途又有廣泛應用前景的新領域。
數(shù)據(jù)挖掘作為一個交叉學科領域, 受多個學科的影響,包括數(shù)據(jù)庫系統(tǒng)、統(tǒng)計學、機器學習、可視化和信息科學等。依賴于所挖掘的數(shù)據(jù)類型或應用領域,數(shù)據(jù)挖掘可能集成空間數(shù)據(jù)分析、圖像分析、模式識別、Web技術、信息檢索、心理學等領域的技術。主要的數(shù)據(jù)挖掘技術與方法有: 聚類、分類、決策樹、粗糙集、神經(jīng)網(wǎng)絡、回歸分析、遺傳算法、偏差檢測等。從數(shù)據(jù)庫中挖掘的規(guī)則可以有以下多種表達形式: 關聯(lián)規(guī)則,特征規(guī)則,異常規(guī)則,轉(zhuǎn)移規(guī)則,序列規(guī)則,分類,聚類等。數(shù)據(jù)挖掘的應用對象是大規(guī)模數(shù)據(jù)庫,目標是發(fā)現(xiàn)數(shù)據(jù)庫中規(guī)律性的知識。數(shù)據(jù)挖掘提取的知識可以表示為概念、規(guī)律、模式、約束、可視化[22]。
在知識獲取技術方面,基于數(shù)據(jù)挖掘的專家系統(tǒng)可以極大緩解了專家系統(tǒng)的“知識瓶頸”問題。它不再是知識工程師從領域?qū)<抑刑崛∫?guī)則,將其轉(zhuǎn)化為知識;而是從領域?qū)<姨峁┑拇罅繑?shù)據(jù)中自動獲取知識。數(shù)據(jù)挖掘中的數(shù)據(jù)預處理模塊可以在知識的獲取中減小噪聲數(shù)據(jù)的影響,提高知識獲取的正確性。知識會隨著挖掘的過程不斷被學習到系統(tǒng)當中,這樣既大大加深和拓寬了知識獲取的深度與廣度,又會使獲取的知識越來越完善、越來越精確。
在推理技術方面, 數(shù)據(jù)挖掘技術是以數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)倉庫統(tǒng)計學等為基礎的。而數(shù)據(jù)倉庫主要特點就是: 它是面向主題的,庫中的數(shù)據(jù)是多維的。也就是說,庫中的每一維度可以對應設備運行時的一個狀態(tài)參數(shù),不同的運行狀態(tài)參數(shù)就存放在不同的維度空間里。數(shù)據(jù)挖掘器在推理時可以根據(jù)不同需要而將不同維度內(nèi)的運行狀態(tài)參數(shù)綜合起來一起分析計算,即:運用數(shù)據(jù)挖掘算法來進行全方位推理。這可以克服傳統(tǒng)推理機制具有單一方面的精確度高而忽視了其它方面影響的缺點,可以增強其推理的合理性、提高其推斷結果的可靠性[6]。
在數(shù)據(jù)挖掘中盡可能地引入人對該應用領域的先驗知識是非常必要的。數(shù)據(jù)挖掘是一個人機交互、不斷重復的過程。專家的領域知識或背景知識的應用對挖掘過程具有補充和促進作用,經(jīng)常用來引導發(fā)現(xiàn)過程以避免無意義的結果[23]。另外,一般數(shù)據(jù)挖掘方法僅僅在數(shù)據(jù)庫內(nèi)容上產(chǎn)生規(guī)則,規(guī)則難以理解,領域知識或背景知識的應用可以產(chǎn)生易理解的規(guī)則。利用專家的領域知識的意義,不僅在于約簡、表達和評估規(guī)則,更重要的是通過評估獲得處理結果和應用需求之間的偏差,并以此作為反饋,去修正以前的各個步驟[24]。
3.3 多Agent技術的運用
Agent是一個具有自主性﹑反應性﹑主動性和社會性特性的基于硬件或軟件的計算機系統(tǒng),通常還具有人類的智能特性,如知識、信念、意圖和愿望等。Agent理論與技術研究源于80年代中期的分布式問題求解,由于分布式并行處理技術、面向?qū)ο蠹夹g、多媒體技術、計算機網(wǎng)絡技術,特別是Internet和Web技術的發(fā)展,使Agent成為當今人工智能與軟件工程中的研究熱點,引起了科學界、教育界及工業(yè)界的廣泛關注[25,26]。多Agent系統(tǒng)(Multi-Agent System,MAS)是指由多個自主構件組成的所有類型的系統(tǒng),它是一個松散耦合的問題求解器網(wǎng)絡,其目標是為了解決那些超出每個問題求解器的單獨能力或知識的問題。這些問題的求解器就是Agent,它們是自主的,并可能是異構的。
多Agent系統(tǒng)的表現(xiàn)通過Agent的交互來實現(xiàn),主要研究多個Agent為了聯(lián)合采取行動或求解問題,如何協(xié)調(diào)各自的知識、目標、策略和規(guī)劃。在表達實際系統(tǒng)時,多Agent系統(tǒng)通過各Agent間的通訊、合作、協(xié)調(diào)、調(diào)度、管理及控制來表達系統(tǒng)的結構、功能及行為特性。由于在同一個多Agent系統(tǒng)中各Agent可以異構,因此多Agent技術對于復雜系統(tǒng)具有無可比擬的表達力,它為各種實際系統(tǒng)提供了一種統(tǒng)一的模型,從而為各種實際系統(tǒng)的研究提供了一種統(tǒng)一的框架,其應用領域十分廣闊[27]。
將多Agent的方法引入到專家系統(tǒng)中,將有利于解決傳統(tǒng)的單個專家系統(tǒng)與應用場所、應用環(huán)境難于溝通的難題,也能夠比較容易地適應用戶的知識結構、思維習慣,它能夠比較方便地與系統(tǒng)中的其它Agent進行協(xié)調(diào)、交流以達到系統(tǒng)的整體目標[28]。
對于復雜問題的求解,通??梢詫<蚁到y(tǒng)看作一個Agent。但是實際上兩者有較大的區(qū)別,在一個大型的復雜系統(tǒng)中,從系統(tǒng)功能分解理論出發(fā),可以把整個系統(tǒng)分解成幾個子系統(tǒng),如果只用單純的專家系統(tǒng)或者Agent模塊都有很大的局限性。要實現(xiàn)各個模塊的協(xié)商和協(xié)作,在專家系統(tǒng)之間很難實現(xiàn),而由多個Agent就可以傳遞各個模塊的協(xié)作,但只采用Agent技術,又難以保證任務執(zhí)行的速度。因此,采用集成專家系統(tǒng)和多Agent技術是一種比較不錯的方法[29]。集成專家系統(tǒng)和多個Agent的系統(tǒng)主要由完成特定功能的專家系統(tǒng)和Agent模塊組成,專家系統(tǒng)模塊利用經(jīng)驗歷史知識和對象當前運行狀態(tài)信息以嚴格高效的邏輯推理。Agent模塊則主要利用Agent間的合作來實現(xiàn)動態(tài)不完全信息,從而提高系統(tǒng)對環(huán)境的適應能力。這樣能夠充分彌補兩者各自的不足,增強系統(tǒng)的能力,整體上提高系統(tǒng)的實時和準確性。
4? 專家系統(tǒng)的發(fā)展趨勢
近年來,發(fā)展專家系統(tǒng)不僅要采用各種定性的模型,而且要將各種模型綜合運用。以及運用人工智能和計算機技術的一些新思想和新技術,如分布式和協(xié)同式。這些都是專家系統(tǒng)的發(fā)展趨勢。
4.1? 通用性專家系統(tǒng)
?專家系統(tǒng)的開發(fā)是需要領域?qū)<液椭R工程師共同努力的,而領域?qū)<医^大多數(shù)只對自己領域范圍的知識了解,這就導致現(xiàn)階段開發(fā)的專家系統(tǒng)只適用于某一特定問題領域。用戶越來越希望有一種以用戶為中心的通用性專家系統(tǒng)[30]。這就需要通用性專家系統(tǒng)具有各種不同的并行算法和知識獲取模塊,能夠采用多種推理策略。
?通用性專家系統(tǒng)作為一種新型專家系統(tǒng),其特點如下:
?①集成多種模型的專家系統(tǒng),根據(jù)用戶的需要,可以選擇其中的任何一種或多種,形成某一類型的專家系統(tǒng);
?②通過多種模型的綜合運用,提高了專家系統(tǒng)的準確率和效率;
?③經(jīng)過長期的使用,可以探索出針對某一問題的最佳模式(多種模型的綜合運用),獲得最優(yōu)的專用專家系統(tǒng)。
4.2? 分布式專家系統(tǒng)
分布式專家系統(tǒng)具有分布處理的特征,其主要目的在于把一個專家系統(tǒng)的功能經(jīng)分解后分布到多個處理器上去并行的工作,從而在整體上提高系統(tǒng)的處理效率[2]。這種專家系統(tǒng)比常規(guī)的專家系統(tǒng)具有較強的可擴張性和靈活性,將各個子系統(tǒng)聯(lián)系起來,即使不同的開發(fā)者針對同一研究對象也可以有效地進行交流和共享。隨著Internet的發(fā)展與普及,建立遠程分布式專家系統(tǒng)可以實現(xiàn)異地多專家對同一對象進行控制或診斷,極大提高了準確率和效率[14]。
分布式專家系統(tǒng)作為一種新型專家系統(tǒng),其特點如下[31]:
①系統(tǒng)數(shù)據(jù)的所有來源,分門別類地對不同數(shù)據(jù)來源的數(shù)據(jù)進行管理,同時系統(tǒng)的數(shù)據(jù)完整、準確、實用性強;
②系統(tǒng)開發(fā)工具多樣,開發(fā)環(huán)境與應用環(huán)境分離,使開發(fā)完善過程與應用過程可以獨立的異步進行;
③可以同時完成多用戶,多個并發(fā)請求的推理;
④借助輔助數(shù)據(jù)庫,對推理過程可以進行有效的控制與監(jiān)測,并能整合推理結果,以多種形式反饋給用戶。
4.3 協(xié)同式專家系統(tǒng)
協(xié)同式專家系統(tǒng)的概念目前尚無一個明確的定義。一般認為,協(xié)同式專家系統(tǒng)是能綜合若干相關領域(或一個領域)多個方面的單一專家系統(tǒng)互相協(xié)作共同解決一個更廣領域問題的專家系統(tǒng),這樣的系統(tǒng)亦可稱之為“群專家系統(tǒng)”[2]。在系統(tǒng)中,多個專家系統(tǒng)協(xié)同合作,各專家系統(tǒng)間可以互相通信,一個或多個專家系統(tǒng)的輸出可能成為另一個專家系統(tǒng)的輸入,有些專家系統(tǒng)的輸出還可以作為反饋信息輸入到自身或其先輩系統(tǒng)中去,經(jīng)過迭代求得某種“穩(wěn)定”狀態(tài)。
協(xié)同式專家系統(tǒng)作為一種新型專家系統(tǒng),其特點如下:
①將總?cè)蝿蘸侠淼姆纸鉃閹讉€分任務,分別由幾個分專家系統(tǒng)來完成;
②把解決各個分任務所需要知識的公共部分提煉出來形成一個公共知識庫,供各子專家系統(tǒng)共享。而分專家系統(tǒng)中專用的知識,則存放在各自的專用知識庫中;
③為了統(tǒng)一協(xié)調(diào)解決問題,有一個供各個分專家系統(tǒng)討論交流的平臺。
目前將分布式專家系統(tǒng)與協(xié)同式專家系統(tǒng)相結合,提出了一種分布協(xié)同式專家系統(tǒng)。分布協(xié)同式專家系統(tǒng)是指邏輯上或物理上分布在不同處理節(jié)點上的若干專家系統(tǒng)協(xié)同求解問題的系統(tǒng)?,F(xiàn)實中,有很多復雜的任務需要一個群體(一些專家) 來協(xié)同解決問題,當單個專家系統(tǒng)難于有效地求解問題時,使用分布協(xié)同式專家系統(tǒng)求解是一個有效的途徑[32]。
5? 結束語
專家系統(tǒng)是從20世紀末開始的重大技術之一,是高技術的標志。專家系統(tǒng)的近期研究目標是建造用于代替人類進行智能管理與決策的系統(tǒng),而遠期目標是實現(xiàn)具有更新概念、更佳技術性能和更高智力水平的決策與咨詢系統(tǒng)。
本文總結了專家系統(tǒng)發(fā)展的歷史和現(xiàn)狀,對目前比較成熟的專家系統(tǒng)模型進行分析,指出各自的特點和局限性。隨著專家系統(tǒng)研究的不斷深入與發(fā)展,必將進一步推動科技發(fā)展和社會進步。
評論