21世紀(jì)以來(lái),生物大數(shù)據(jù)在量(多數(shù)據(jù)種類(lèi),海量樣本數(shù),多時(shí)間點(diǎn)采樣等)、質(zhì)(高時(shí)空精度,單細(xì)胞測(cè)序等)兩方面快速發(fā)展,大大推動(dòng)了生命科學(xué)的進(jìn)步,也為生物醫(yī)學(xué)問(wèn)題的模型建立、數(shù)據(jù)分析,以及預(yù)測(cè)和控制,帶來(lái)了巨大的機(jī)遇和挑戰(zhàn)。
傳統(tǒng)的生物學(xué)數(shù)據(jù)研究方法大多基于數(shù)據(jù)的靜態(tài)統(tǒng)計(jì)信息,即“基于統(tǒng)計(jì)學(xué)的數(shù)據(jù)科學(xué)”(statistics-based data science),其缺點(diǎn)是,在很多場(chǎng)景下不能準(zhǔn)確地解釋和預(yù)測(cè)系統(tǒng)的復(fù)雜動(dòng)態(tài)行為。數(shù)據(jù)分類(lèi)、數(shù)據(jù)降維、變量聚類(lèi)、變量相關(guān)性分析等方法都是如此。
然而,即使是靜態(tài)的數(shù)據(jù),往往也蘊(yùn)含著系統(tǒng)的動(dòng)力學(xué)特征。我們需要通過(guò)“基于動(dòng)力學(xué)的數(shù)據(jù)科學(xué)”(dynamics-based data science),充分建立和利用動(dòng)力系統(tǒng)的普遍性質(zhì)(如,穩(wěn)定平衡點(diǎn)的臨界性質(zhì)、中心流型的低維性、單變量的吸引子的重構(gòu)性等),對(duì)蘊(yùn)含在數(shù)據(jù)中的動(dòng)力學(xué)信息進(jìn)行挖掘和分析。
“基于動(dòng)力學(xué)的數(shù)據(jù)科學(xué)”將動(dòng)力系統(tǒng)理論、統(tǒng)計(jì)學(xué)理論,和數(shù)據(jù)的實(shí)際背景結(jié)合在一起,為處理和解釋動(dòng)態(tài)生物大數(shù)據(jù)提供了一種基礎(chǔ)堅(jiān)實(shí)、計(jì)算高效的理論和方法。
在最近發(fā)表于《國(guó)家科學(xué)評(píng)論》(National Science Review,NSR)的觀點(diǎn)文章中,中科院生化細(xì)胞所的陳洛南研究員(通訊作者)、東京大學(xué)的史際帆博士(第一作者)和Aihara教授通過(guò)3個(gè)具體實(shí)例,揭示了如何利用動(dòng)力系統(tǒng)的普遍性質(zhì),由觀測(cè)的數(shù)據(jù)對(duì)生物學(xué)現(xiàn)象進(jìn)行動(dòng)力學(xué)分析,并解決生命科學(xué)的實(shí)際問(wèn)題。1.利用微分方程的分岔理論,由測(cè)量的高維數(shù)據(jù),進(jìn)行健康臨界預(yù)警和疾病預(yù)測(cè)。DNB理論利用了系統(tǒng)在臨界點(diǎn)附近,復(fù)雜網(wǎng)絡(luò)將表現(xiàn)出有別于非臨界點(diǎn)的網(wǎng)絡(luò)特性,量化臨界狀態(tài)并發(fā)現(xiàn)疾病的關(guān)鍵因子,實(shí)現(xiàn)疾病預(yù)警“防病于未然”。
2.利用偏微分方程和diffusion map理論,量化細(xì)胞的多潛能性或距離干細(xì)胞的遠(yuǎn)近。LDD方法是,通過(guò)建立隨機(jī)生滅過(guò)程的偏微分方程模型,對(duì)細(xì)胞的分化過(guò)程進(jìn)行了多潛能性量化。利用單細(xì)胞測(cè)序數(shù)據(jù)和相關(guān)數(shù)學(xué)方法,可以對(duì)每類(lèi)細(xì)胞多潛能性進(jìn)行估計(jì)和分化程度排序,實(shí)現(xiàn)量化細(xì)胞的多潛能性,并構(gòu)建多潛能性勢(shì)能景觀。
3.利用神經(jīng)網(wǎng)絡(luò)工具,對(duì)基因表達(dá)量等的時(shí)間序列進(jìn)行預(yù)測(cè)。ARNN方法是,利用最新的reservior神經(jīng)網(wǎng)絡(luò)工具,通過(guò)“空間-時(shí)間信息變換方程”STI,即變換高維數(shù)據(jù)的信息為時(shí)間的動(dòng)態(tài)信息,對(duì)短序列高維度數(shù)據(jù)(如基因表達(dá)數(shù)據(jù))進(jìn)行學(xué)習(xí),可實(shí)現(xiàn)復(fù)雜系統(tǒng)的短時(shí)間序列或動(dòng)態(tài)演化的預(yù)測(cè)。
“基于動(dòng)力學(xué)的數(shù)據(jù)科學(xué)”是一個(gè)全新交叉領(lǐng)域,相比傳統(tǒng)靜態(tài)的“基于統(tǒng)計(jì)學(xué)的數(shù)據(jù)科學(xué)”方法,具有“可解釋性”、“可量化性”和“可拓展性”,在今后的生物醫(yī)學(xué)等領(lǐng)域的研究舞臺(tái),將扮演不可或缺的重要角色。
編輯:jq
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103562 -
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7255瀏覽量
91819 -
微分
+關(guān)注
關(guān)注
0文章
31瀏覽量
14276
原文標(biāo)題:3個(gè)實(shí)例:“基于動(dòng)力學(xué)的數(shù)據(jù)科學(xué)”在生命科學(xué)中的應(yīng)用 | NSR
文章出處:【微信號(hào):zhishexueshuquan,微信公眾號(hào):知社學(xué)術(shù)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
2025施耐德電氣電子及生命科學(xué)新質(zhì)生產(chǎn)力峰會(huì)成功舉辦
施耐德電氣助力生命科學(xué)行業(yè)數(shù)字化轉(zhuǎn)型
Adams多體動(dòng)力學(xué)仿真解決方案全面解析
AI在醫(yī)療健康和生命科學(xué)中的發(fā)展現(xiàn)狀
西門(mén)子51億美元收購(gòu)Dotmatics 加碼AI生命科學(xué)賽道
輪轂電機(jī)驅(qū)動(dòng)電動(dòng)汽車(chē)垂向動(dòng)力學(xué)控制研究綜述
IBM Spectrum LSF在生命科學(xué)和生物制藥領(lǐng)域的應(yīng)用
IBM Maximo助力生命科學(xué)行業(yè)合規(guī)遠(yuǎn)航
借助NVIDIA AI Foundry平臺(tái)推動(dòng)醫(yī)療健康與生命科學(xué)行業(yè)發(fā)展
施耐德電氣助力生命科學(xué)與電子行業(yè)的可持續(xù)發(fā)展
施耐德電氣助力生命科學(xué)行業(yè)高質(zhì)量發(fā)展
AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
關(guān)于動(dòng)力學(xué)方程能否用matlab進(jìn)行傅里葉變換的問(wèn)題。
名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新
激光引擎改善生命科學(xué)應(yīng)用

評(píng)論