99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌推出開源工具DeepVariant,用深度神經網絡識別基因變異

人工智能和機器人研究院 ? 2017-12-07 15:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Google今天推出了一個名叫DeepVariant的開源工具,用深度神經網絡來從DNA測序數據中快速精確識別堿基變異位點。

學科研究的革命性進展,特別是基因學上,需要依賴于新技術的出現。比如桑格發(fā)明了測序法之后,才實現了人類基因組的測序。

再比如DNA(微陣列)芯片技術的誕生,使得大規(guī)模的基因測序成為可能。這些技術讓我們能夠獲得大量遺傳信息,可以更廣泛地應用于健康、農業(yè)和生態(tài)上。

基因測序領域里,最革命性的技術當屬2000年初首次商用的高通量測序(縮寫為HTS)了。HTS可以大規(guī)模、低成本、快速地獲得任何生物的基因序列。

不過,HTS有個致命的問題在于,測序出來的結果不是完整的,而是碎片化的片段信息。

比如測的是人的基因序列的話(也就是說,信息量級為23對染色體上的30億對堿基排序),那么得到的測序結果是不到10億個短序列片段,一般每個短序列片段我們稱為讀取單位(reads)。

每個讀取單位含有100個堿基對(不同讀取單位的信息需要重疊,才能最后拼全),而每個堿基的錯誤率范圍是0.1%到10%。所以,一直以來,對于HTS來說,最大的挑戰(zhàn)是把碎片化的結果信息拼成一整段完整的序列信息。

瓶中基因組聯盟Genome in a Bottle Consortium(GIAB),和精準FDA平臺(美國藥監(jiān)局做的基因組信息學社區(qū)和共享數據平臺)一樣,致力于提高基于HTS基因測序結果。他們能提供高精度的人體基準基因組序列信息。

把測序結果與基準基因序列一比對,就可以得到很多個堿基變異位點(就是上圖打星的地方),這些位點,可能是SNP單核苷酸多態(tài)性導致的,也可能是測序過程中復制出錯造成的。

今天,Google Brain團隊,聯合同屬于Alphabet旗下的生命科學兄弟公司Verily,用了兩年多時間,研發(fā)出了一個名叫DeepVariant的開源工具,專門用深度神經網絡來識別HTS結果中DNA測序數據里這些堿基變異位點。這個工具在準確率上和精確度上,比傳統(tǒng)的比對拼接方法都高出一大截。

DeepVariant,把工作量巨大的拼接問題(HTS碎片化的結果拼接成完整的基因序列),轉變成了一個典型的圖像分類問題。而圖像分類正是谷歌擅長的技術。

2016年,DeepVarient還在PrecisionFDA Truth Challenge中贏得了最高SNP性能獎(Highest SNP Performance)。在那之后,Google Brain團隊又將錯誤率降低了50%。

下面的四幅圖,分別代表實際測序的片段和基準序列的比對結果。

△A:單核苷酸多態(tài)性造成的堿基變異位點;
B:一條染色體上少了一個堿基;
C:兩條染色體上都少了一個堿基;
D:復制錯了的堿基變異位點。

在比對過程中,要回答的一個關鍵的問題是,怎么判斷比對后得到的堿基變異位點,是存在于兩條染色體中,還是只在一條里,還是都沒有。造成堿基變異位點的原因不只一種,最常見的三種可能是單核苷酸多態(tài)性,或多插了一個堿基,或少復制了一個堿基。

這些變異位點如果用視覺識別的算法就能快速找出來。大大提高HTS后的比對拼接的效率。

因為瓶中基因組聯盟Genome in a Bottle Consortium(GIAB)提供的人體基準基因組序列信息是高精度可信的,或者更嚴謹地說,是最接近真實序列的信息。

通過這個基準序列得到的復制數據,谷歌團隊可以拿它們來訓練基于Tensor Flow的圖像分類模型,所得到的DeepVariant,最后可以區(qū)別真實序列數據和復制數據。

盡管DeepVariant根本不懂什么是基因組序列,也不懂HTS,但是只用了一年,就已經贏得了PrecisionFDA Truth Challenge中的最高SNP性能獎(Highest SNP Performance)。而且到目前為止,把已有最優(yōu)異的方法拼接錯誤率降低了50%多。

在發(fā)布開源代碼的同時,Google Brain還發(fā)布Google Cloud上的DeepVarient工作流,方便開發(fā)者用它來處理大型數據集。

最后,附上相關鏈接:

Google Research Blog介紹:https://research.googleblog.com/2017/12/deepvariant-highly-accurate-genomes.html

開源代碼:https://github.com/google/deepvariant

Google Cloud版:https://cloud.google.com/genomics/deepvariant


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    108206
  • 人工智能
    +關注

    關注

    1807

    文章

    49036

    瀏覽量

    249793

原文標題:谷歌推出開源工具DeepVariant,用深度學習識別基因變異

文章出處:【微信號:gh_ecbcc3b6eabf,微信公眾號:人工智能和機器人研究院】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    BP神經網絡與卷積神經網絡的比較

    BP神經網絡與卷積神經網絡在多個方面存在顯著差異,以下是對兩者的比較: 一、結構特點 BP神經網絡 : BP神經網絡是一種多層的前饋神經網絡
    的頭像 發(fā)表于 02-12 15:53 ?682次閱讀

    BP神經網絡深度學習的關系

    BP神經網絡深度學習之間存在著密切的關系,以下是對它們之間關系的介紹: 一、BP神經網絡的基本概念 BP神經網絡,即反向傳播神經網絡(Ba
    的頭像 發(fā)表于 02-12 15:15 ?871次閱讀

    BP神經網絡在圖像識別中的應用

    BP神經網絡在圖像識別中發(fā)揮著重要作用,其多層結構使得網絡能夠學習到復雜的特征表達,適用于處理非線性問題。以下是對BP神經網絡在圖像識別中應
    的頭像 發(fā)表于 02-12 15:12 ?686次閱讀

    深度學習入門:簡單神經網絡的構建與實現

    深度學習中,神經網絡是核心模型。今天我們 Python 和 NumPy 構建一個簡單的神經網絡神經網絡由多個
    的頭像 發(fā)表于 01-23 13:52 ?536次閱讀

    人工神經網絡的原理和多種神經網絡架構方法

    在上一篇文章中,我們介紹了傳統(tǒng)機器學習的基礎知識和多種算法。在本文中,我們會介紹人工神經網絡的原理和多種神經網絡架構方法,供各位老師選擇。 01 人工神經網絡 ? 人工神經網絡模型之所
    的頭像 發(fā)表于 01-09 10:24 ?1219次閱讀
    人工<b class='flag-5'>神經網絡</b>的原理和多種<b class='flag-5'>神經網絡</b>架構方法

    卷積神經網絡的實現工具與框架

    卷積神經網絡因其在圖像和視頻處理任務中的卓越性能而廣受歡迎。隨著深度學習技術的快速發(fā)展,多種實現工具和框架應運而生,為研究人員和開發(fā)者提供了強大的支持。 TensorFlow 概述
    的頭像 發(fā)表于 11-15 15:20 ?674次閱讀

    卷積神經網絡與傳統(tǒng)神經網絡的比較

    深度學習領域,神經網絡模型被廣泛應用于各種任務,如圖像識別、自然語言處理和游戲智能等。其中,卷積神經網絡(CNNs)和傳統(tǒng)神經網絡是兩種常
    的頭像 發(fā)表于 11-15 14:53 ?1887次閱讀

    深度學習中的卷積神經網絡模型

    深度學習近年來在多個領域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經網絡作為深度學習的一個分支,因其在圖像處理
    的頭像 發(fā)表于 11-15 14:52 ?860次閱讀

    RNN模型與傳統(tǒng)神經網絡的區(qū)別

    神經網絡是機器學習領域中的一種強大工具,它們能夠模擬人腦處理信息的方式。隨著技術的發(fā)展,神經網絡的類型也在不斷增加,其中循環(huán)神經網絡(RNN)和傳統(tǒng)
    的頭像 發(fā)表于 11-15 09:42 ?1141次閱讀

    LSTM神經網絡在語音識別中的應用實例

    語音識別技術是人工智能領域的一個重要分支,它使計算機能夠理解和處理人類語言。隨著深度學習技術的發(fā)展,特別是長短期記憶(LSTM)神經網絡的引入,語音識別的準確性和效率得到了顯著提升。
    的頭像 發(fā)表于 11-13 10:03 ?1862次閱讀

    Moku人工神經網絡101

    不熟悉神經網絡的基礎知識,或者想了解神經網絡如何優(yōu)化加速實驗研究,請繼續(xù)閱讀,探索基于深度學習的現代智能化實驗的廣闊應用前景。什么是神經網絡?“人工
    的頭像 發(fā)表于 11-01 08:06 ?675次閱讀
    Moku人工<b class='flag-5'>神經網絡</b>101

    關于卷積神經網絡,這些概念你厘清了么~

    取特征的強大工具,例如識別音頻信號或圖像信號中的復雜模式就是其應用之一。 1、什么是卷積神經網絡? 神經網絡是一種由神經元組成的系統(tǒng)或結構
    發(fā)表于 10-24 13:56

    【飛凌嵌入式OK3576-C開發(fā)板體驗】RKNN神經網絡算法開發(fā)環(huán)境搭建

    download_model.sh 腳本,該腳本 將下載一個可用的 YOLOv5 ONNX 模型,并存放在當前 model 目錄下,參考命令如下: 安裝COCO數據集,在深度神經網絡算法中,模型的訓練離不開大量的數據集,數據集用于
    發(fā)表于 10-10 09:28

    FPGA在深度神經網絡中的應用

    隨著人工智能技術的飛速發(fā)展,深度神經網絡(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領域取得了顯著成果。然而,傳統(tǒng)的
    的頭像 發(fā)表于 07-24 10:42 ?1225次閱讀

    分享幾個FPGA實現的小型神經網絡

    今天我們分享幾個FPGA實現的小型神經網絡,側重應用。
    的頭像 發(fā)表于 07-24 09:30 ?1901次閱讀
    分享幾個<b class='flag-5'>用</b>FPGA實現的小型<b class='flag-5'>神經網絡</b>