2017年,黃巖誼課題組將通信理論中的糾錯(cuò)碼引入到測(cè)序技術(shù)中,通過(guò)三條正交的簡(jiǎn)并序列來(lái)檢測(cè)并校正測(cè)序錯(cuò)誤。這項(xiàng)“糾錯(cuò)碼測(cè)序技術(shù)”兼具較長(zhǎng)的讀長(zhǎng)和極高的準(zhǔn)確度。近日,該課題組又在《國(guó)家科學(xué)評(píng)論》(National Science Review, NSR)發(fā)表文章,通過(guò)計(jì)算機(jī)模擬構(gòu)建的“虛擬測(cè)序儀”,揭示了糾錯(cuò)碼測(cè)序技術(shù)中“失相”問(wèn)題的模式、特征,并在此基礎(chǔ)上建立了一個(gè)失相校正算法,為更加高效、準(zhǔn)確的測(cè)序技術(shù)提供了一種實(shí)用解決方案。
高通量測(cè)序中的“失相”問(wèn)題
近二十年來(lái),新一代高通量測(cè)序技術(shù)快速發(fā)展,極大地改變了生命科學(xué)和醫(yī)學(xué)研究,并迅速進(jìn)入醫(yī)學(xué)診斷等領(lǐng)域,服務(wù)于健康產(chǎn)業(yè)。
當(dāng)前主流的高通量測(cè)序技術(shù)大多采用“邊合成邊測(cè)序”的方式,且會(huì)將每一條待測(cè)DNA分子擴(kuò)增成多條DNA組成的簇,從而放大可檢測(cè)信號(hào)。理想情況下,一簇DNA中的每個(gè)分子在測(cè)序過(guò)程中都是同步的,所以周期性反應(yīng)所獲得的測(cè)序信號(hào)就直接反映出待測(cè)DNA的序列信息。 然而,在真實(shí)的測(cè)序體系中,各個(gè)分子間從來(lái)都不是完美同步的。由于反應(yīng)不完全或者反應(yīng)體系中雜質(zhì)引起的副反應(yīng),一簇DNA中的各個(gè)分子會(huì)逐漸失去同步性,反映到測(cè)序過(guò)程中,就會(huì)使測(cè)序信號(hào)變得紊亂,而無(wú)法直接反映DNA的序列信息。這一現(xiàn)象稱為“失相”,即分子間信號(hào)“相位”的失諧。失相問(wèn)題極大地限制了高通量測(cè)序的讀長(zhǎng)和準(zhǔn)確性。
每一種基于類似原理的測(cè)序方法,都存在這樣的現(xiàn)象。而在使用不同化學(xué)反應(yīng)的不同測(cè)序方法中,失相現(xiàn)象的特征也不盡相同。如要?jiǎng)?chuàng)建新的測(cè)序技術(shù),對(duì)其失相現(xiàn)象的充分理解是一個(gè)必須解決的主要問(wèn)題。
“糾錯(cuò)碼測(cè)序”中的失相模式
為了提高測(cè)序技術(shù)的準(zhǔn)確性,北京大學(xué)黃巖誼課題組于2017年將通信理論中的糾錯(cuò)碼引入到測(cè)序技術(shù)中,通過(guò)三條正交的簡(jiǎn)并序列來(lái)檢測(cè)并校正測(cè)序錯(cuò)誤。這一項(xiàng)糾錯(cuò)碼測(cè)序技術(shù)兼具較長(zhǎng)的讀長(zhǎng)和極高準(zhǔn)確度的潛力。糾錯(cuò)碼測(cè)序中也有失相問(wèn)題。近期,黃巖誼課題組通過(guò)計(jì)算機(jī)模擬,構(gòu)造了一個(gè)“虛擬測(cè)序儀”,來(lái)研究糾錯(cuò)碼測(cè)序方法中失相問(wèn)題的模式、規(guī)律,并探索解決方案。研究者發(fā)現(xiàn),“單堿基滑動(dòng)”是糾錯(cuò)碼測(cè)序獨(dú)有的失相模式。在糾錯(cuò)碼測(cè)序中,雜質(zhì)引起的副反應(yīng)會(huì)使DNA分子發(fā)生額外的延伸反應(yīng),稱之為初級(jí)超前反應(yīng)。若初級(jí)超前反應(yīng)僅延伸一個(gè)堿基,則該DNA分子會(huì)立刻被過(guò)量的底物進(jìn)一步延伸,稱之為次級(jí)超前反應(yīng);而若初級(jí)超前延伸了不止一個(gè)堿基,則上述次級(jí)超前反應(yīng)不會(huì)發(fā)生。即,次級(jí)超前反應(yīng)發(fā)生的條件可以被歸納為單堿基滑動(dòng)。
利用“虛擬測(cè)序儀”,研究者探索了DNA分子在不同反應(yīng)條件下的延伸規(guī)律,找到了影響單堿基滑動(dòng)的關(guān)鍵因素。依據(jù)單堿基滑動(dòng)這一失相模式,作者還建立了一個(gè)失相校正算法,并證明該算法可用于校正至少500輪的測(cè)序反應(yīng)(對(duì)應(yīng)1000 bp的測(cè)序讀長(zhǎng))。 最后,作者還將失相校正算法推廣到了具有更高準(zhǔn)確度的雙色糾錯(cuò)碼測(cè)序上,并在實(shí)際測(cè)序中進(jìn)行了驗(yàn)證?!皢螇A基滑動(dòng)”這一新型失相規(guī)律的發(fā)現(xiàn)和歸納,不僅僅對(duì)“糾錯(cuò)碼測(cè)序方法”提供了更加深刻的理解,同時(shí)對(duì)于如何更加快速高效地實(shí)現(xiàn)對(duì)測(cè)序化學(xué)反應(yīng)信號(hào)的解讀和推算,提供了一個(gè)實(shí)用的解決方案。
責(zé)任編輯:lq
-
算法
+關(guān)注
關(guān)注
23文章
4710瀏覽量
95405 -
DNA
+關(guān)注
關(guān)注
0文章
244瀏覽量
31554 -
測(cè)序儀
+關(guān)注
關(guān)注
0文章
18瀏覽量
7117
原文標(biāo)題:黃巖誼課題組:利用虛擬測(cè)序儀,揭示“糾錯(cuò)碼測(cè)序”中的失相模式 | NSR
文章出處:【微信號(hào):zhishexueshuquan,微信公眾號(hào):知社學(xué)術(shù)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
高通量衛(wèi)星物聯(lián)網(wǎng)終端賦能電力巡檢:云翎智能如何破解偏遠(yuǎn)電網(wǎng)監(jiān)控痛點(diǎn)

評(píng)論