99精品伊人亚洲|最近国产中文炮友|九草在线视频支援|AV网站大全最新|美女黄片免费观看|国产精品资源视频|精彩无码视频一区|91大神在线后入|伊人终合在线播放|久草综合久久中文

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過(guò)RAPIDS加速單細(xì)胞DNA和RNA基因組分析

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Avantika Lal ? 2022-04-27 16:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人體由近 40 萬(wàn)億個(gè)細(xì)胞組成,有許多不同類(lèi)型。實(shí)驗(yàn)生物學(xué)的最新進(jìn)展使探索單個(gè)細(xì)胞的遺傳物質(zhì)成為可能。隨著單細(xì)胞基因組學(xué)這一新領(lǐng)域的誕生,科學(xué)家們現(xiàn)在可以探測(cè)人體內(nèi)單個(gè)細(xì)胞的 DNA 和 RNA 。

單細(xì)胞基因組分析已經(jīng)確定了人體內(nèi)的新型細(xì)胞,發(fā)現(xiàn)了是什么使這些細(xì)胞彼此不同,以及不同類(lèi)型的細(xì)胞如何對(duì)疾病或藥物作出反應(yīng)。單細(xì)胞基因組學(xué)也被證明是當(dāng)前 COVID-19 大流行的關(guān)鍵,它可以識(shí)別易受感染的細(xì)胞并揭示感染患者免疫系統(tǒng)的變化。

pYYBAGJo-1qAVx_-AAEaQhZ8kUc974.png

圖 1 。單細(xì)胞 RNA 測(cè)序?qū)嶒?yàn)的工作流程。分離單個(gè)細(xì)胞并測(cè)量每個(gè)細(xì)胞的基因活性。具有相似基因活性的細(xì)胞聚集在一起以識(shí)別群體中的各種類(lèi)型的細(xì)胞。

隨著最近的實(shí)驗(yàn)對(duì)數(shù)百萬(wàn)個(gè)細(xì)胞進(jìn)行測(cè)序,單細(xì)胞數(shù)據(jù)的可用性和數(shù)據(jù)集的大小也在不斷增加。這種分析通常是探索性的,并從互動(dòng)中得到進(jìn)一步的好處——在更精細(xì)的尺度上識(shí)別不同類(lèi)型的細(xì)胞,比較細(xì)胞類(lèi)型并可視化它們之間的關(guān)系。當(dāng)前的工作流仍然非常緩慢,這使得它們對(duì)于研究所需的交互分析來(lái)說(shuō)是不可能的。

RAPIDS :用 GPUs 加速數(shù)據(jù)科學(xué)

RAPIDS 是一套開(kāi)源庫(kù),通過(guò) GPU 加速的力量,可以加速端到端的數(shù)據(jù)科學(xué)工作流程。 RAPIDS 使得使用類(lèi)似于 NumPy 、 pandas 和 scikit learn 的 Python api 對(duì)大型數(shù)據(jù)集執(zhí)行交互式數(shù)據(jù)分析成為可能。

考慮執(zhí)行單單元分析的典型工作流。這從一個(gè)矩陣開(kāi)始,這個(gè)矩陣映射每個(gè)細(xì)胞中遇到的每個(gè)基因的數(shù)量。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,濾除噪聲,然后對(duì)數(shù)據(jù)進(jìn)行歸一化處理,得到每個(gè)細(xì)胞中每個(gè)人類(lèi)基因的活性。在這一步中,機(jī)器學(xué)習(xí)也常用于糾正數(shù)據(jù)收集中的工件。接下來(lái),在聚類(lèi)和可視化之前執(zhí)行維數(shù)縮減,以識(shí)別具有相似遺傳活動(dòng)的細(xì)胞簇。最后,你比較這些細(xì)胞群的遺傳活動(dòng),以了解為什么不同類(lèi)型的細(xì)胞表現(xiàn)和反應(yīng)不同。

poYBAGJo-2CAauOPAACZpci4Dm0534.png

圖 2 :顯示單細(xì)胞 RNA 測(cè)序數(shù)據(jù)分析步驟的管道。從每個(gè)細(xì)胞的基因活性矩陣開(kāi)始, RAPIDS 庫(kù)可以用于進(jìn)行數(shù)據(jù)處理、降維、聚類(lèi)和可視化,并在不同的簇間發(fā)現(xiàn)不同活性的差異基因。

我們?cè)?clara-parabricks/rapids-single-cell-examples GitHub repo 中發(fā)布了這個(gè)精確工作流的 GPU – 加速版本。 repo 包含一個(gè)示例 notebook ,它使用 RAPIDS 和 Scanpy 分析 70000 個(gè)人體肺細(xì)胞的數(shù)據(jù)集,以識(shí)別對(duì) COVID-19 敏感的細(xì)胞。 Scanpy 是一個(gè)用于分析單細(xì)胞基因表達(dá)數(shù)據(jù)的工具包,提供了使用 RAPIDS 加速特定命令的選項(xiàng)。我們?cè)诨刭?gòu)中也有一個(gè)筆記本的 CPU 版本 以供比較。

例如,運(yùn)行 UMAP 以使用 RAPIDS 可視化近 70000 個(gè)單元格需要以下命令:

sc.tl.umap(adata, min_dist=umap_min_dist, spread=umap_spread, method='rapids')

umap-visualization-625x298.png

圖 3 。由 RAPIDS 創(chuàng)建的人肺樣本中約 70000 個(gè)細(xì)胞的 UMAP 可視化。細(xì)胞被洛文聚類(lèi)標(biāo)記。

使用 RAPIDS 生成這個(gè) UMAP 可視化需要 1 秒,而在 CPU 上則需要 80 秒。事實(shí)上, RAPIDS 可以加速整個(gè)單單元分析工作流程,甚至可以在大型數(shù)據(jù)集上進(jìn)行交互式探索性數(shù)據(jù)分析。

在 11 分鐘內(nèi)分析一百萬(wàn)個(gè)細(xì)胞

我們將我們的 RAPIDS 分析工作流程應(yīng)用于現(xiàn)有最大的單細(xì)胞數(shù)據(jù)集之一, 100 萬(wàn)個(gè)小鼠腦細(xì)胞通過(guò) 10 倍基因組學(xué)測(cè)序。有關(guān)詳細(xì)信息,請(qǐng)參閱 1M_brain_gpu_analysis_uvm.ipynb Jupyter 筆記本。

有了如此大的數(shù)據(jù)量,對(duì) CPU 的分析變得不切實(shí)際地慢了下來(lái);我們的端到端工作流在 awsm5a CPU 實(shí)例上運(yùn)行了 3 個(gè)多小時(shí)。這使得交互式分析幾乎不可能。另一方面,我們?cè)谶@個(gè)更大的數(shù)據(jù)集上觀察到了更高的 GPU 加速,并且能夠在一個(gè) GPU 上分析整個(gè)數(shù)據(jù)集。在 AWS 上運(yùn)行 RAPIDS 分析也比 CPU 版本便宜 3 倍!

用于交互式單細(xì)胞分析的 GPU 功能單元瀏覽器

如前所述, RAPIDS 的數(shù)據(jù)分析速度使研究人員能夠?qū)崟r(shí)交互式地分析數(shù)據(jù)。我們開(kāi)發(fā)了一個(gè)在 Jupyter 筆記本 中運(yùn)行的、支持 GPU 的交互式小區(qū)瀏覽器,使這一過(guò)程更加簡(jiǎn)單。在這個(gè)單元格瀏覽器中,您可以可視化數(shù)據(jù)集中的所有單元格,并通過(guò)點(diǎn)擊方法對(duì)數(shù)據(jù)執(zhí)行聚類(lèi)分析。使用 RAPIDS ,這些步驟可以實(shí)時(shí)運(yùn)行。

在這篇文章中,我將向您展示如何輕松地選擇一組細(xì)胞,并執(zhí)行 UMAP 和 Louvain 聚類(lèi)來(lái)識(shí)別這種細(xì)胞類(lèi)型中的子種群。

圖 4 通過(guò)在交互式單元格瀏覽器中使用 RAPIDS 指向并單擊實(shí)時(shí)重新聚類(lèi)選定的單元格組。

結(jié)論

在這篇文章中,您看到了使用 RAPIDS 加速 GPUs 上的單細(xì)胞基因組分析是多么容易。使用 RAPIDS ,可以方便地實(shí)時(shí)交互地探索數(shù)據(jù),對(duì)不同尺度的單元進(jìn)行聚類(lèi),以及對(duì)具有不同參數(shù)的大型數(shù)據(jù)集進(jìn)行重新分析。所有這些都有助于更快的科學(xué)發(fā)現(xiàn)。

除了涵蓋的 API 之外, RAPIDS 還有一個(gè)大型的其他算法庫(kù),您會(huì)發(fā)現(xiàn)這些算法在您的工作中很有用。

關(guān)于作者

Avantika Lal 是 NVIDIA 基因組學(xué)團(tuán)隊(duì)的資深科學(xué)家。她開(kāi)發(fā)了使用 GPUs 和深入學(xué)習(xí)來(lái)加速和改進(jìn)人類(lèi)基因組分析的工具。在 NVIDIA 之前,她是斯坦福大學(xué)遺傳學(xué)和病理學(xué)系的博士后研究員。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11080

    瀏覽量

    217040
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25446
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中科曙光構(gòu)建全國(guó)產(chǎn)化基因組學(xué)高性能計(jì)算平臺(tái)

    近日,中科曙光承建的國(guó)內(nèi)某研究所基因組學(xué)高性能計(jì)算平臺(tái)正式交付。這是國(guó)內(nèi)生物信息學(xué)領(lǐng)域首個(gè)從底層硬件到上層軟件實(shí)現(xiàn)完全自主可控,并深度融合高性能計(jì)算與人工智能算力的平臺(tái),成功填補(bǔ)了該領(lǐng)域國(guó)產(chǎn)高端算力的空白。
    的頭像 發(fā)表于 06-26 17:36 ?390次閱讀

    功率放大器在液滴微流控細(xì)胞分選中的應(yīng)用

    摘要:通過(guò)對(duì)微液滴的大小和形狀進(jìn)行控制,可以實(shí)現(xiàn)對(duì)單個(gè)細(xì)胞的分選。本文綜述了國(guó)內(nèi)外在微液滴分選領(lǐng)域的最新研究進(jìn)展,并介紹了不同類(lèi)型的功率放大器及其在微流控細(xì)胞分選中的應(yīng)用。基于功率放大器在微液滴分選
    的頭像 發(fā)表于 04-03 10:08 ?323次閱讀
    功率放大器在液滴微流控<b class='flag-5'>細(xì)胞</b>分選中的應(yīng)用

    太赫茲細(xì)胞能量?jī)x主控芯片方案單片機(jī)開(kāi)發(fā)控制板布局規(guī)劃

    被人體吸收,產(chǎn)生熱效應(yīng),使深層部位溫度升高,并使原子團(tuán)狀的水分子活化成小分子水,使其處于高能狀態(tài),加速人體需要的生物酶的合成,同時(shí),活化蛋白質(zhì),加速供給人體所需要養(yǎng)份,從而增強(qiáng)機(jī)體的免疫力和生物細(xì)胞
    發(fā)表于 03-25 15:37

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無(wú)法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發(fā)表于 03-05 06:55

    Evo 2 AI模型可通過(guò)NVIDIA BioNeMo平臺(tái)使用

    Evo 2 是一個(gè)強(qiáng)大的新型 AI 模型,它基于亞馬遜云科技(AWS)上的 NVIDIA DGX Cloud 構(gòu)建而成,能夠幫助用戶(hù)深入了解不同物種的 DNARNA 和蛋白質(zhì)。
    的頭像 發(fā)表于 02-28 09:57 ?735次閱讀

    NVIDIA 攜手行業(yè)領(lǐng)先機(jī)構(gòu)推動(dòng)基因組學(xué)、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展

    ——NVIDIA 今日宣布新的合作伙伴關(guān)系,旨在通過(guò)加速藥物發(fā)現(xiàn)、提升基因組研究,以及利用代理式和生成式 AI 開(kāi)創(chuàng)先進(jìn)醫(yī)療服務(wù),推動(dòng)規(guī)模達(dá) 10 萬(wàn)億美元的醫(yī)療健康與生命科學(xué)產(chǎn)業(yè)的變革。 ? AI、
    發(fā)表于 01-14 13:39 ?296次閱讀
    NVIDIA 攜手行業(yè)領(lǐng)先機(jī)構(gòu)推動(dòng)<b class='flag-5'>基因組</b>學(xué)、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展

    RAPIDS cuDF將pandas提速近150倍

    在 NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶(hù)帶來(lái) GPU 加速,且無(wú)需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?658次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍

    NVIDIA AI助力日本制藥公司推進(jìn)藥物研發(fā)

    制藥公司、醫(yī)療技術(shù)公司和學(xué)術(shù)研究人員正在開(kāi)發(fā)主權(quán) AI 能力,以驅(qū)動(dòng)藥物發(fā)現(xiàn)、加速基因組學(xué)和醫(yī)療設(shè)備。
    的頭像 發(fā)表于 11-19 15:40 ?826次閱讀

    使用原代腫瘤細(xì)胞進(jìn)行藥物篩選的數(shù)字微流控系統(tǒng)

    不佳甚至?xí)a(chǎn)生不良反應(yīng)。臨床數(shù)據(jù)表明,某種藥物對(duì)癌癥的治療過(guò)程有大量基因參與,基于基因的精準(zhǔn)醫(yī)療難以滿(mǎn)足患者需求。從患者活檢或腫瘤樣本中對(duì)原發(fā)性腫瘤細(xì)胞進(jìn)行藥物篩選可提供關(guān)于特定腫瘤藥物敏感性的直接信息,但
    的頭像 發(fā)表于 11-18 10:05 ?1.1w次閱讀
    使用原代腫瘤<b class='flag-5'>細(xì)胞</b>進(jìn)行藥物篩選的數(shù)字微流控系統(tǒng)

    NVIDIA加速計(jì)算技術(shù)助力癌癥研究

    總部位于英國(guó)的維康桑格研究所的 DNA 測(cè)序?qū)嶒?yàn)室每年分析數(shù)以萬(wàn)計(jì)的基因組,為癌癥的形成和治療效果提供洞察。
    的頭像 發(fā)表于 10-29 15:01 ?594次閱讀

    細(xì)胞的“聚光燈”——前沿活細(xì)胞成像的案例分享

    細(xì)胞是一切生命的基本單位,構(gòu)成了各式各樣的生命體。因此研究細(xì)胞的結(jié)構(gòu)以及內(nèi)部生命活動(dòng)過(guò)程可以幫助我們更深入地探究生命的奧秘,了解生命體是如何構(gòu)建和運(yùn)作的。傳統(tǒng)的細(xì)胞顯微術(shù)只能通過(guò)觀察固
    的頭像 發(fā)表于 10-24 08:04 ?812次閱讀
    活<b class='flag-5'>細(xì)胞</b>的“聚光燈”——前沿活<b class='flag-5'>細(xì)胞</b>成像的案例分享

    NVIDIA Parabricks v4.3.1版本的新功能

    NVIDIA Parabricks 擴(kuò)大了 NVIDIA 利用深度學(xué)習(xí)解決基因組學(xué)挑戰(zhàn)的范圍,持續(xù)推動(dòng)基因組學(xué)儀器的發(fā)展。NVIDIA Parabricks v4.3.1 在歐洲人類(lèi)遺傳學(xué)
    的頭像 發(fā)表于 09-10 10:22 ?813次閱讀
    NVIDIA Parabricks v4.3.1版本的新功能

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺(tái)提升計(jì)算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫(kù)研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計(jì)劃成員,其開(kāi)發(fā)的產(chǎn)品基于高性能分布式時(shí)序數(shù)據(jù)庫(kù),是支持復(fù)雜計(jì)算和流數(shù)據(jù)分析的實(shí)時(shí)計(jì)算平臺(tái),適用于金融、電力、物聯(lián)網(wǎng)和零售等行業(yè)。
    的頭像 發(fā)表于 09-09 09:57 ?895次閱讀
    利用NVIDIA <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平臺(tái)提升計(jì)算性能

    熒光檢測(cè)器適用范圍有哪些

    、材料科學(xué)等多個(gè)方面。 一、生物分子檢測(cè) 核酸檢測(cè) 熒光檢測(cè)器在核酸檢測(cè)中具有重要應(yīng)用,如DNA測(cè)序、基因表達(dá)分析基因突變檢測(cè)等。熒光標(biāo)記的核酸探針與目標(biāo)核酸序列結(jié)合后,
    的頭像 發(fā)表于 08-08 10:35 ?2369次閱讀

    寬帶功率放大器基于微流控技術(shù)的細(xì)胞分選的應(yīng)用

    實(shí)驗(yàn)名稱(chēng):基于微流控技術(shù)的細(xì)胞分選和單細(xì)胞分析用于腫瘤藥物敏感性研究研究方向:生物醫(yī)療實(shí)驗(yàn)原理:構(gòu)建了一個(gè)集成的微流控芯片用于全血中循環(huán)腫瘤細(xì)胞(CTCs)的快速分選和計(jì)數(shù)。該芯片首先
    的頭像 發(fā)表于 08-06 14:37 ?2164次閱讀
    寬帶功率放大器基于微流控技術(shù)的<b class='flag-5'>細(xì)胞</b>分選的應(yīng)用