1. 孫寬、陸仕榮、肖澤云Sci. Adv.: 機器學習輔助的高性能有機光伏材料分子設(shè)計和效率預測
有機光伏(OPV)電池提供一個直接的和經(jīng)濟的方式來將太陽能轉(zhuǎn)化為電能。近年來,OPV的研究迅速發(fā)展,功率轉(zhuǎn)換效率(PCE)已超過17%。迄今為止,OPV研究的主流一直集中在建立新的OPV分子結(jié)構(gòu)與其光伏性質(zhì)之間的關(guān)系。該過程通常涉及光伏材料的設(shè)計和合成,材料的光電性能表征以及光伏電池的組裝和優(yōu)化。
這些傳統(tǒng)方法通常需要精細控制化學合成、制造精密裝置、費力的純化和繁瑣的實驗步驟,這導致大量的資源投入以及較長的研究周期。因此,OPV的開發(fā)效率低下且緩慢,例如,自1973年首次報告以來,僅在光伏電池中合成并測試了不到2000個OPV供體分子。
重慶大學的孫寬教授、中科院的陸仕榮教授和肖澤云教授共同建立了一個數(shù)據(jù)庫,其中包含從文獻中收集的1719個經(jīng)過實驗測試的OPV供體材料。他們首先研究了分子的表達對ML性能的重要性。為了確定最合適的表達式,我們測試了不同類型的表達式,包括圖像、ASCII字符串、兩種類型的描述符和七種類型的分子指紋。根據(jù)PCE值,描述符可將材料分為“低”和“高性能”。指紋具有最佳性能(預測PCE類的準確度為81.76%),并且其長度對預測的準確性有顯著影響。
此外,作者使用了多種ML算法進行分類。研究發(fā)現(xiàn),當處理小型數(shù)據(jù)庫時,RF模型的性能優(yōu)于其他模型。最后,作者通過合成10種新的OPV供體材料獨立驗證了ML模型。該模型的預測與實驗結(jié)果吻合良好。
通過這項工作,作者為OPV研究建立了一種新方法,即通過ML模型預篩選設(shè)計的OPV分子,然后僅關(guān)注在后續(xù)實驗中通過ML虛擬評估的分子。這種方法將大大加快開發(fā)用于OPV應用的新型高效有機半導體材料的探索過程。
文獻鏈接:
Machine learning–assisted molecular design and efficiency prediction for high-performance organic photovoltaic materials (Sci. Adv., 2019, DOI: 10.1126/sciadv.aay4275)
2. Nat. Commun.: 從大量沸石材料合成記錄中將合成和結(jié)構(gòu)相聯(lián)系
在計算能力的提高、算法開發(fā)的進步以及海量數(shù)據(jù)的可用性的推動下,機器學習的應用已擴展到解決人類層面的問題,包括材料科學領(lǐng)域的問題。應用于機器學習的材料科學中的數(shù)據(jù)集大量來自理論計算。一旦經(jīng)過培訓,機器學習就可以應用于成千上萬甚至數(shù)百萬候選材料的高通量篩選。這些詳盡的計算機模擬數(shù)據(jù)挖掘方法能夠從大型的,通過計算生成的數(shù)據(jù)庫中識別出非凡的材料。
材料的合成也可以從機器學習中受益。例如,從大量實驗數(shù)據(jù)中構(gòu)建了一系列監(jiān)督分類模型,以使用一組綜合描述符來預測綜合結(jié)果。這種基于機器學習的實驗數(shù)據(jù)庫方法能夠從化學空間中提取最重要的合成描述符,這些化學描述符具有高維和大量條目,有時人類很難處理。機器學習的模式識別能力被認為對于通過動力學控制的途徑合成的材料非常有效,而這些途徑很難用簡單的方法論來處理。
這項研究使用機器學習技術(shù)分析了從文獻中收集的沸石的合成記錄,以合理化對其性質(zhì)和結(jié)構(gòu)的理解。從機器學習模型中提取的綜合描述符用于識別具有適當重要性的結(jié)構(gòu)描述符。基于結(jié)構(gòu)描述符的晶體結(jié)構(gòu)相似性網(wǎng)絡(luò),顯示了由合成相似材料組成的群落的形成?;谙惹氨缓雎缘慕Y(jié)構(gòu)相似性的交叉實驗,揭示了沸石的合成相似性,證實了合成結(jié)構(gòu)之間的關(guān)系。該方法適用于使經(jīng)驗知識合理化、填充合成記錄并發(fā)現(xiàn)新穎材料的系統(tǒng)。
文獻鏈接:
Linking synthesis and structure descriptors from a large collection of synthetic records of zeolite materials (Nat. Commun., 2019, DOI: 10.1038/s41467-019-12394-0)
3. npj Computational Materials: 半監(jiān)控機器學習在材料合成過程中的應用
在過去的30年中,計算材料學的進步已在材料設(shè)計方面取得了巨大的成功,其中包括數(shù)十種通過計算設(shè)計的新穎化合物以及從頭開始預測的特性的按需可用性。但是,材料發(fā)現(xiàn)流程仍然受到實驗合成挑戰(zhàn)的限制,在合成新化合物之前,這可能需要數(shù)月的反復試驗。
目前,很難設(shè)計如何在實驗室中合成預測的材料。當前理解和預測材料合成的方法涉及原位X射線衍射(XRD)研究、從頭算熱力學建模、經(jīng)典熱力學觀點以及機器學習指導的合成參數(shù)搜索。
最近,機器學習方法在有機化學中逆向合成的應用被證明是有效的,激發(fā)了類似方法在預測無機材料合成中的應用。這些有機化學合成反應的機器學習研究已經(jīng)通過有機化學反應數(shù)據(jù)庫(例如Reaxys)實現(xiàn),該數(shù)據(jù)庫包括》 1200萬個單步反應。當前沒有類似的數(shù)據(jù)庫全面地分類無機材料合成的合成反應。但是,即使是有限的材料合成反應數(shù)據(jù)庫也可以對合成參數(shù)與反應產(chǎn)物之間的關(guān)系產(chǎn)生有價值的見解,例如Kim等人所證明的那樣。
在這項工作中,作者演示了一種半監(jiān)督的機器學習方法,用于根據(jù)書面自然語言對無機材料的合成程序進行分類。無需任何人工輸入,潛在的Dirichlet分配就可以將關(guān)鍵字聚集到與特定實驗材料合成步驟相對應的主題,例如“研磨”和“加熱”,“溶解”和“離心分離”等。在少量注釋的指導下,隨機分類可以將這些步驟與不同類別的材料合成(例如固態(tài)或水熱合成)相關(guān)聯(lián)。
最后,作者證明了實驗步驟順序的馬爾可夫鏈表示可以準確地重建可能的合成程序流程圖。這種機器學習方法提供了一種可擴展的方法,可以從文獻中解鎖大量的無機材料合成信息,并將其處理為標準化的機器可讀數(shù)據(jù)庫。
文獻鏈接:
Semi-supervised machine-learning classication of materials synthesis procedures (npj Computational Materials, 2019, DOI: 10.1038/s41524-019-0204-1)
4. npj Computational Materials:機器學習在固態(tài)材料科學中的最新進展和應用
機器學習是近年來進入材料科學的最令人興奮的研究方法之一。這種統(tǒng)計方法的收集已經(jīng)證明能夠大大加快基礎(chǔ)研究和應用研究的速度。目前,科研工作者已經(jīng)見證了將機器學習廣泛應用于材料研究的實例。
在這篇文章中,作者提供了有關(guān)機器學習在材料研究中的最新研究的全面概述和分析。首先,作者介紹材料科學中的機器學習原理、算法、描述符和數(shù)據(jù)庫。隨后,作者繼續(xù)介紹了不同的機器學習方法,以發(fā)現(xiàn)穩(wěn)定的材料并預測其晶體結(jié)構(gòu)。然后,作者討論了眾多定量結(jié)構(gòu)與屬性之間的關(guān)系,以及通過機器學習替代第一原理計算的各種方法。
這篇綜述回顧了如何應用主動學習和基于算法的優(yōu)化來改善合理的設(shè)計過程和相關(guān)的應用示例。兩個主要問題始終是機器學習模型的可解釋性和對機器學習模型的物理理解。因此,作者考慮了可解釋性的不同方面及其在材料科學中的重要性。最后,文章針對計算材料科學中的各種挑戰(zhàn)提出了解決方案和未來的研究發(fā)展。
文獻鏈接:
Recent advances and applications of machine learning in solid-state materials science (npj Computational Materials, 2019, DOI: 10.1038/s41524-019-0221-0)
5. npj Computational Materials:通過可解釋的機器學習識別高級自旋驅(qū)動熱電材料
機器學習正在成為科學發(fā)現(xiàn)的重要工具。機器學習方法在材料開發(fā)領(lǐng)域中的應用尤其吸引人,它可以通過發(fā)現(xiàn)新的/更好的功能材料來實現(xiàn)創(chuàng)新。要將機器學習應用于實際的材料開發(fā),科學家和機器學習工具之間必須緊密協(xié)作。但是,到目前為止,許多機器學習算法的黑匣子屬性都阻礙了這種協(xié)作。從材料科學和物理學的觀點來看,科學家通常很難解釋數(shù)據(jù)驅(qū)動的模型。
在這個工作中,作者通過使用一種可解釋的機器學習方法來說明具有異常能斯特效應的自旋驅(qū)動熱電材料的發(fā)展。基于材料科學和物理學的先驗知識,作者能夠從可解釋的機器學習中提取一些相關(guān)性以及有關(guān)自旋驅(qū)動熱電材料的新知識。在此指導下,作者進行了實際的材料合成,從而確定了新型自旋驅(qū)動的熱電材料。
文獻鏈接:
Identication of advanced spin-driven thermoelectric materials via interpretable machine learning (npj Computational Materials, 2019, DOI: 10.1038/s41524-019-0241-9)
6. npj Computational Materials:可靠且可解釋的機器學習方法可加速材料的開發(fā)
盡管ML在商業(yè)應用中表現(xiàn)出色,但是將ML應用于材料科學仍存在一些獨特的挑戰(zhàn)。在這種情況下,這項工作是雙重的。
首先,當從代表性不足/失衡的材料數(shù)據(jù)中學習時,作者確定了現(xiàn)有機器學習技術(shù)的常見陷阱。具體而言,在數(shù)據(jù)不平衡的情況下,評估ML模型質(zhì)量的標準方法會有問題,并導致令人誤解的結(jié)論。
此外,作者發(fā)現(xiàn)模型本身的置信度得分不能被信任,模型自省方法(使用更簡單的模型)也無濟于事,因為它們會導致預測性能下降(可靠性與可解釋性之間的權(quán)衡)。
其次,為了克服這些挑戰(zhàn),作者提出了一個通用的可解釋且可靠的機器學習框架。具體來說,作者提出了一種通用方法,該方法采用一組更簡單的模型來可靠地預測材料特性。文章還提出了一種轉(zhuǎn)移學習技術(shù),并表明可以通過利用不同材料特性之間的相關(guān)性來克服由于模型簡單而導致的性能損失。同時,還提出了一種新的評估指標和一個信任分數(shù),以更好地量化預測中的置信度。為了提高可解釋性,作者在框架中添加了基本原理生成器組件,該組件提供了模型級別和決策級別的解釋。
最后,文章證明了這種技術(shù)在兩種應用中的多功能性:(1)預測晶體化合物的特性;(2)確定潛在穩(wěn)定的太陽能電池材料。文章還指出了ML在材料科學中的成功應用尚待解決的一些懸而未決的問題。
文獻鏈接:
Reliable and explainable machine-learning methods for accelerated material discovery (npj Computational Materials, 2019, DOI: 10.1038/s41524-019-0248-2)
7. Nat. Mater.:利用機器學習進行藥物發(fā)現(xiàn)和開發(fā)
各種各樣的機器學習方法,例如貝葉斯(Bayesian),支持向量以及最近的深度神經(jīng)網(wǎng)絡(luò),都證明了它們在藥物發(fā)現(xiàn)和開發(fā)中的效用。這利用了從高通量篩選數(shù)據(jù)創(chuàng)建的更大的數(shù)據(jù)集,并能夠以更高的準確度預測目標和分子特性的生物活性。
科研工作者才剛剛開始挖掘這些技術(shù)的潛力,但是它們可能已經(jīng)從根本上改變了識別新分子或重新使用舊藥物的研究過程。這種針對端到端(E2E)應用的機器學習模型的集成應用具有廣泛的意義,并且對開發(fā)未來的療法及其目標具有重要意義。
文獻鏈接:
Exploiting machine learning for end-to-end drug discovery and development (Nat. Mater., 2019, DOI: 10.1038/s41563-019-0338-z)
8. Nature Reviews Chemistry:人工智能驅(qū)動的有機合成化學
合成有機化學是化學領(lǐng)域的基礎(chǔ),包括藥物發(fā)現(xiàn)、化學生物學、材料科學和工程學。但是,執(zhí)行復雜的化學合成本身需要很豐富的背景知識,通常是在多年的研究和動手實驗實踐中獲得的。具有簡化和自動化化學合成潛力的技術(shù)開發(fā)是一個耗費半世紀尚未實現(xiàn)的努力。隨著計算能力、數(shù)據(jù)可用性和算法的提高,人們對人工智能(AI)的興趣再次興起。
在這篇綜述中,作者討論了AI對合成化學不同任務的近期影響,并從文獻中剖析了一些實例。通過研究基本概念,作者旨在使化學家了解AI,以便他們可以將其作為工具,通過指出知識差距并描繪化學AI如何在化學工業(yè)中運行來刺激未來的研究。
-
光伏電池
+關(guān)注
關(guān)注
5文章
268瀏覽量
33084 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3926瀏覽量
66194 -
機器學習
+關(guān)注
關(guān)注
66文章
8501瀏覽量
134580
發(fā)布評論請先 登錄
最新人工智能硬件培訓AI 基礎(chǔ)入門學習課程參考2025版(大模型篇)
上海和晟儀器參與2025人工智能助力PI 及特種高分子產(chǎn)業(yè)對接論壇

亞馬遜一年助力兩百萬人提升人工智能技能的關(guān)鍵洞察

評論