99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習是許多生物學家用來分析數(shù)據(jù)的計算工具

姚小熊27 ? 來源:AI人工智能網(wǎng) ? 作者:AI人工智能網(wǎng) ? 2020-10-19 15:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學習是許多生物學家用來分析大量數(shù)據(jù)的計算工具,幫助他們識別潛在的新藥。麻省理工學院的研究人員現(xiàn)在已經(jīng)在這些類型的機器學習算法中加入了一個新的特性,從而提高了他們的預測能力。

利用這種新的方法,計算機模型可以解釋他們分析數(shù)據(jù)的不確定性,麻省理工學院的研究小組發(fā)現(xiàn)了幾種有希望的化合物,這些化合物的目標是導致結核病的細菌所需的一種蛋白質(zhì)。

這種方法以前曾被計算機科學家使用過,但尚未在生物學上得到應用,也可能在蛋白質(zhì)設計和許多其他生物學領域有用,西蒙斯數(shù)學系教授、麻省理工學院計算機科學和人工智能實驗室(CSAIL)計算和生物學小組負責人邦尼·伯杰(Bonnie Berger)說。

“這項技術是已知的機器學習子領域的一部分,但人們還沒有把它引入生物學,”Berger說?!斑@是一個范式的轉變,絕對是生物探索的方式。”

Berger和Bryan Bryson是麻省理工學院的生物工程助理教授,也是MGH、MIT和哈佛的拉根研究所的成員,他們是這項研究的高級作者。細胞系統(tǒng)。麻省理工學院研究生BrianHie是論文的主要作者。

更好的預測

機器學習是一種計算機建模,在這種模型中,算法學習根據(jù)已經(jīng)看到的數(shù)據(jù)進行預測。近年來,生物學家開始利用機器學習來搜索潛在藥物化合物的龐大數(shù)據(jù)庫,以找到與特定目標相互作用的分子。

這種方法的一個局限性是,當他們分析的數(shù)據(jù)與他們接受訓練的數(shù)據(jù)相似時,這些算法表現(xiàn)得很好,但它們并不擅長評估那些與他們已經(jīng)看到的分子有很大不同的分子。

為了克服這一問題,研究人員使用了一種叫做高斯過程的技術,將不確定性值分配給算法所訓練的數(shù)據(jù)。這樣,當模型分析訓練數(shù)據(jù)時,他們也會考慮到這些預測的可靠性。

例如,如果進入模型的數(shù)據(jù)預測某一特定分子與目標蛋白質(zhì)的結合程度,以及這些預測的不確定性,該模型可以利用這些信息對蛋白質(zhì)-目標相互作用進行預測,這是它以前從未見過的。該模型還估計了自己預測的確定性。在分析新的數(shù)據(jù)時,模型的預測對于與訓練數(shù)據(jù)有很大不同的分子來說,其確定性可能較低。研究人員可以利用這些信息來幫助他們決定實驗測試哪些分子。

這種方法的另一個優(yōu)點是該算法只需要少量的訓練數(shù)據(jù)。在這項研究中,麻省理工學院的研究小組用72個小分子及其與400多個蛋白質(zhì)的相互作用(稱為蛋白激酶)對模型進行了訓練。然后,他們能夠使用這個算法分析近11000個小分子,這些小分子是從鋅數(shù)據(jù)庫中提取的,鋅數(shù)據(jù)庫是一個公開可用的儲存庫,含有數(shù)百萬種化合物。其中許多分子與訓練數(shù)據(jù)中的分子非常不同。

利用這一方法,研究人員能夠識別出與他們所加入的蛋白激酶具有非常強的結合親緣關系的分子。其中包括三種人類激酶,以及在結核分枝桿菌中發(fā)現(xiàn)的一種激酶。這種激酶,PknB,是細菌生存的關鍵,但不是任何一線結核病抗生素的目標。

研究人員隨后通過實驗測試了他們的一些最成功之處,以了解他們與目標的結合程度,并發(fā)現(xiàn)模型的預測非常準確。在模型給出的最確定的分子中,大約90%被證明是真正的命中--遠高于現(xiàn)有用于藥物篩選的機器學習模型的30%到40%的命中率。

研究人員還使用相同的訓練數(shù)據(jù)來訓練不包含不確定性的傳統(tǒng)機器學習算法,然后讓它分析相同的11000個分子庫。他說:“沒有不確定性,這個模型就會變得非?;靵y,它提出了與激酶相互作用的非常奇怪的化學結構?!?/p>

然后,研究人員采取了一些最有前途的PknB抑制劑,并測試他們在細菌培養(yǎng)培養(yǎng)基中生長的結核分枝桿菌,并發(fā)現(xiàn)它們抑制細菌的生長。這些抑制劑也在感染細菌的人免疫細胞中起作用。

一個好的起點

這種方法的另一個重要因素是,一旦研究人員獲得額外的實驗數(shù)據(jù),他們就可以將其添加到模型中,并對其進行再培訓,從而進一步改進預測。研究人員說,即使是少量的數(shù)據(jù)也能幫助模型變得更好。

Hie說:“每次迭代都不需要非常大的數(shù)據(jù)集。”“你可以用10個新的例子重新訓練這個模型,這是一個生物學家很容易產(chǎn)生的東西?!?/p>

布萊森說,這項研究是多年來首次提出新的分子,可以針對PknB,并且應該給藥物開發(fā)人員一個很好的起點,可以嘗試開發(fā)針對激酶的藥物。他說:“我們現(xiàn)在為他們提供了一些新的線索,超出了已經(jīng)公布的范圍。”

研究人員還表明,他們可以利用同樣的機器學習來提高綠色熒光蛋白的熒光輸出,綠色熒光蛋白通常用于標記活細胞內(nèi)的分子。它也可以應用于許多其他類型的生物學研究,Berger說,他現(xiàn)在正用它來分析推動腫瘤發(fā)展的突變。
責任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1807

    文章

    49029

    瀏覽量

    249694
  • 機器學習
    +關注

    關注

    66

    文章

    8503

    瀏覽量

    134657
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進來呢?

    在神經(jīng)網(wǎng)絡的計算中廣泛應用,理解矩陣乘法、特征值和特征向量等概念有助于深入掌握深度學習模型的工作原理。 掌握編程語言,如Python和R。Python有豐富的AI庫,如NumPy、Pandas用于數(shù)據(jù)
    發(fā)表于 07-08 17:44

    **【技術干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節(jié),今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器
    的頭像 發(fā)表于 02-13 09:39 ?366次閱讀

    七款經(jīng)久不衰的數(shù)據(jù)可視化工具!

    Sense 是一種自助式分析工具,旨在通過內(nèi)存計算和可視化手段使數(shù)據(jù)分析變得簡單直觀。它適合各種規(guī)模的企業(yè),但相比于Tableau和Power BI,其
    發(fā)表于 01-19 15:24

    傳統(tǒng)機器學習方法和應用指導

    用于開發(fā)生物學數(shù)據(jù)機器學習方法。盡管深度學習(一般指神經(jīng)網(wǎng)絡算法)是一個強大的工具,目前也非常
    的頭像 發(fā)表于 12-30 09:16 ?1195次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    DFT在生物信號分析中的應用

    一種強大的數(shù)學工具,能夠幫助科研人員更好地理解和分析這些生物信號。 DFT在生物信號分析中的應用 頻譜
    的頭像 發(fā)表于 12-20 09:28 ?976次閱讀

    zeta在機器學習中的應用 zeta的優(yōu)缺點分析

    在探討ZETA在機器學習中的應用以及ZETA的優(yōu)缺點時,需要明確的是,ZETA一詞在不同領域可能有不同的含義和應用。以下是根據(jù)不同領域的ZETA進行的分析: 一、ZETA在機器
    的頭像 發(fā)表于 12-20 09:11 ?1128次閱讀

    微流控技術的生物學應用

    微流控技術為在推動生物學眾多領域的強大工具做出了巨大貢獻。隨著用于微通道中流體的注射、混合、泵送和存儲的新器件和工藝的發(fā)展,近年來微流控系統(tǒng)在化學和生物化學中的應用越來越廣泛。 盡管微流控技術近年來
    的頭像 發(fā)表于 12-01 21:50 ?510次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”在計算機系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機器學習需要設法對數(shù)
    的頭像 發(fā)表于 11-16 01:07 ?967次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習
    的頭像 發(fā)表于 11-15 09:19 ?1232次閱讀

    《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第一章人工智能驅(qū)動的科學創(chuàng)新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量
    發(fā)表于 10-14 09:12

    AI引擎機器學習陣列指南

    云端動態(tài)工作負載以及超高帶寬網(wǎng)絡,同時還可提供高級安全性功能。AI 和數(shù)據(jù)學家以及軟硬件開發(fā)者均可充分利用高計算密度的優(yōu)勢來加速提升任何應用的性能。AI 引擎機器
    的頭像 發(fā)表于 09-18 09:16 ?827次閱讀
    AI引擎<b class='flag-5'>機器</b><b class='flag-5'>學習</b>陣列指南

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    個重要環(huán)節(jié),目標是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預測任務。 特征工程(Feature Engineering)是將數(shù)據(jù)轉換為更好地表示潛在問題的特征,從而提高
    發(fā)表于 08-17 21:12

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環(huán)節(jié),目標是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的
    發(fā)表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    的應用也很廣泛,用機器學習為時間分析帶來新的可能性。人們往往可以通過過往的時間序列數(shù)據(jù)來預測未來,在各行各業(yè)中都有很好的應用與發(fā)展前景。 時間序列分類: 1.單維時間序列 單維時間序列
    發(fā)表于 08-07 23:03