【佳學(xué)基因檢測】將基因信息大眾化的第二代高通量測序技術(shù)（NGS)

第二代測序技術(shù)也稱高通量測序（high-throughput sequencing，HTS）技術(shù)，相對于一代測序，它可以實(shí)現(xiàn)大規(guī)模平行測序，基本原理是將基因組分割成短片段，對短片段測序再進(jìn)行拼接。

對比先進(jìn)代測序技術(shù)擁有著高通量、低成本等優(yōu)勢，目前相同數(shù)據(jù)量的檢測，其成本約為一代測序技術(shù)的0.01%，極大地推動了測序技術(shù)在臨床檢測方面的應(yīng)用。

2005年454公司基于焦磷酸測序法推出了Genome Sequencer 20 System(GS 20)系統(tǒng)，開啟了高通量測序的進(jìn)程。2007年，羅氏公司收購了454，并推出了一系列性能更優(yōu)的NGS系統(tǒng)，極大的提升測序通量和正確性。

盡管具有讀長優(yōu)勢，但是測序通量和成本始終限制了454平臺的推廣，同樣數(shù)據(jù)量下成本約是illumina的100倍，因此羅氏在2016年底終止了454NGS測序相關(guān)的業(yè)務(wù)。

2006年Solexa公司推出了Genome Analyzer系統(tǒng)，包括DNA簇、橋式PCR和可逆阻斷等技術(shù)，這使得GA系統(tǒng)在高通量、低成本、應(yīng)用范圍廣等方面具有明顯優(yōu)點(diǎn)。2007年，Illumina公司收購了Solexa并發(fā)布二代測序儀。

二代測序經(jīng)過這些年的發(fā)展已經(jīng)步入成熟期，目前市場上根據(jù)測序技術(shù)可以可以把二代測序平臺分為4類：邊合成邊測序法（Illumina）、半導(dǎo)體測序法（ThermoFisher）、聯(lián)合探針錨定聚合測序法(華大智造)和焦磷酸測序法。

Illumina邊合成邊測序

Illumina測序的流程主要包括樣品制備，簇生成，測序，數(shù)據(jù)分析。

首先是樣本制備和建庫。用DNA或RNA抽提試劑盒提取核酸，然后用超聲波將其隨即打斷成90-250bp左右的長度或者控制全部DNA在一定長度范圍內(nèi)。

為了后續(xù)的擴(kuò)增和測序，需要在這些DNA片段加入特定的序列。如下圖，分別是與流動池引物互補(bǔ)結(jié)合的區(qū)域（P5、P7）、與Read 1和read 2測序引物結(jié)合的區(qū)域（Rd1SP，Rd2 SP）以及標(biāo)簽序列區(qū)域Index。

圖片

添加完接頭序列的DNA合集稱為DNA文庫，這樣就完成了建庫，該步驟可以采用商業(yè)化的文庫制備試劑盒完成。

第二步是成簇Cluster Generation。

成簇是上述DNA片段被擴(kuò)增的過程，該過程在流動池(Flow cell) 中完成。流動池是一種含有8個通道的厚玻璃片，每條通道中都隨即植入了能與文庫接頭P5或P7互補(bǔ)結(jié)合的短DNA片段。

圖片

首先引物和流動池的固定DNA片段互補(bǔ)配對，固定在通道表面，然后在DNA聚合酶作用下DNA鏈進(jìn)行互補(bǔ)延伸形成DNA雙鏈。通過變性，其中的單鏈被洗脫，剩下的一條單鏈會與旁邊的固定接頭鏈接，形成單鏈橋。

圖片

同樣的，單鏈橋在DNA聚合酶作用下延伸配對形成雙鏈橋，通過變性形成2條單鏈，這兩條單鏈又分別與旁邊的固定引物結(jié)合，形成2個單鏈橋。重復(fù)這個循環(huán)，賊終形成數(shù)百萬的DNA簇。

圖片

上述過程所有的DNA片段都會被擴(kuò)增，擴(kuò)增結(jié)束后，反向連會被切斷洗脫，只留下正向鏈，為防止互補(bǔ)結(jié)合重新形成單鏈橋，3‘端被封鎖。

圖片

第三步，測序。

首先，在流動池中加入熒光標(biāo)記的dNTP和酶，由引物起始開始合成子鏈。由于dNTP存在 3’端疊氮基會阻礙子鏈延伸，因此每個循環(huán)只能測得一個堿基。合成完一個堿基后，洗掉多余的dNTP和酶，使用激光掃描獲得熒光信號。

隨后加入試劑將疊氮基團(tuán)與熒光基團(tuán)切除，然后流動池再通入熒光標(biāo)記的dNTP和酶，由引物起始開始合成一個堿基。不斷重復(fù)這個過程，完成先進(jìn)次讀取。

圖片

所有的DNA片段的一個堿基會被同時讀取，在大規(guī)模并行的過程中，機(jī)器讀取的圖像類似下面這樣：

圖片

同時，加入了不同的index來區(qū)分每個樣本及正負(fù)鏈。在完成先進(jìn)次讀取后，復(fù)制出的鏈會被洗去，index片段引物被引入并與模板雜交，完成序列讀取后被洗去。這樣讀取到的序列與開始時已知的index比對后就可以給測得的序列貼上標(biāo)簽，方便后續(xù)分析。

Paired-end測序已經(jīng)是現(xiàn)在的主流，要完成雙末端測序，首先要將模板鏈3’去保護(hù)，模板折疊，index片段引入，在聚合酶參與下形成雙鏈橋，然后變性，恢復(fù)為單鏈，然后將正向鏈切除并洗去，留下反向鏈，與正向鏈類似，經(jīng)過多個循環(huán)后完成讀取。

第四步，數(shù)據(jù)分析

測序完成后會產(chǎn)生數(shù)百萬個reads，基于在樣品準(zhǔn)備時構(gòu)建的index 分類來自不同樣本的序列。對于每個樣品來說，具有相似延伸的堿基被聚在一起。正向和反向read配對生成連續(xù)序列。這些序列通過與參考基因組匹配后，實(shí)現(xiàn)完整序列的構(gòu)建。

Thermo Fisher半導(dǎo)體測序法

賽默飛的Ion Torrent平臺是基于半導(dǎo)體技術(shù)的高通量測序儀。該平臺使用了一種布滿小孔的高密度半導(dǎo)體芯片，一個小孔就是一個測序反應(yīng)池，孔底部帶有感應(yīng)器。

圖片

其測序的核心技術(shù)是利用半導(dǎo)體技術(shù)進(jìn)行信息讀取，測序過程中每當(dāng)有堿基結(jié)合，便會釋放H+，而氫離子會引起電勢的改變從而被檢測到。通過對氫離子的檢測并轉(zhuǎn)化為電信號，賊終實(shí)現(xiàn)實(shí)時堿基判讀。

其測序的流程主要包括建庫，油包水PCR，測序，數(shù)據(jù)分析。

首先是建庫

與illumina 的 3’端帶突出 T 堿基粘性末端的接頭有所不同，建庫過程中DNA兩端加入的是平端接頭（P1）和X或A接頭，X接頭帶有index，A接頭不帶。

圖片

X 接頭帶Barcode 序列（近末端藍(lán)色序列），而A 接頭不帶Barcode 序列。

X 接頭的好處是可以把一個芯片的測序通量分配給多個文庫，測完序之后用Barcode 區(qū)分。

A 接頭的好處是直接測到樣本序列，這樣對于充分利用測序的讀長無疑是更好的。但是它的缺點(diǎn)是沒有Barcode，所以一張芯片只能放一個樣本。

AmpliSeq 是Ion Torrent 平臺上的建庫方案，它的核心是通過多重PCR 的方法，一次從樣本中把要測序的多個DNA 片段給擴(kuò)增出來，然后轉(zhuǎn)化成文庫進(jìn)行測序。

圖片

PCR 產(chǎn)物兩端20-30bp 堿基都是 PCR引物的序列，如果將其進(jìn)行測序，則會浪費(fèi)掉相當(dāng)一部分測序讀長及數(shù)據(jù)量。因此在這個引物上特別設(shè)計(jì)了一種化學(xué)修飾，這種化學(xué)修飾可以被Fupa試劑所消化，而后的測序就可以盡可能多地測到樣本序列。

乳液PCR或油包水PCR

Ion Torrent 測序前需要把文庫結(jié)合到測序微珠上去，并且進(jìn)行擴(kuò)增，此種方法稱為油包水PCR，也稱Emulsion PCR（乳液PCR）。

EP 管中包含油相和水相，其中水相是核心，油相起到分隔作用。水相中包括文庫、引物、酶、MasterMix、測序微珠等PCR反應(yīng)的主要成份。

圖片

測序微珠的直徑約1~2.4微米，每個油包水PCR都含有許多微珠，這些微珠的表面共價(jià)連接了許多PCR引物，與P1序列互補(bǔ)。

同時油包水PCR中的游離PCR引物，其序列與A/X接頭一致，且5‘端都標(biāo)記了生物素。

把引物、酶、測序微珠等先在水相中混合，再加入油，混合形成乳濁液，油把水相分隔成一個個的小水滴。PCR反應(yīng)后，微珠表面就會長出水滴內(nèi)所含DNA 文庫的擴(kuò)增拷貝。

圖片

然后加入帶有鏈霉親和素標(biāo)記的磁珠與微珠進(jìn)行混合。發(fā)生了PCR 的微珠由于其引物上帶有生物素，便會與磁珠結(jié)合；沒有發(fā)生PCR 的微珠由于沒有生物素，不會與磁珠結(jié)合。接著，用磁鐵吸附富集有效微珠，再清洗掉上清液中沒有PCR 的微珠，賊后用洗脫液把微珠與磁珠分離開來，進(jìn)行測序。

測序

測序主要發(fā)生在一張半導(dǎo)體芯片上，上面做了數(shù)以百萬、千萬計(jì)的小孔，每個小孔的既是測序微珠的容器，又同時是一個微型的PH 計(jì)。

每個小孔正好可以容納一個測序微珠，當(dāng)DNA聚合酶把核苷酸聚合到延伸的DNA鏈上時，會釋放出一個氫離子，反應(yīng)池中的PH發(fā)生改變，位于池下的離子感受器就會感受到信號，把化學(xué)信號直接轉(zhuǎn)化為數(shù)字信號，從而讀出DNA序列。

圖片

數(shù)據(jù)分析

把分別含Ａ、C、G、T 四種 dNTP 的溶液，分別依次地流過芯片的表面。

舉例來說，流入的是dCTP 溶液，而模板上正好有一個G 堿基，就發(fā)生聚合反應(yīng)，并產(chǎn)生電壓變化，而且會被記錄下來。如果流入的溶液與模板上的堿基不匹配，就不會發(fā)生聚合反應(yīng)，也就沒有電壓變化，也就不會有堿基被記錄下來。

如果正好有 2 個一樣的堿基相鄰，一次就會有2 個堿基被聚合到DNA 鏈上，電壓變化值就會加倍，序列中2 個新的堿基被記錄下來。

華大智造聯(lián)合探針錨定聚合測序法

2013年3月18日，華大基因?qū)G(Complete Genomics)公司全額收購，開啟了華大測序儀之路。歷經(jīng)多年的研發(fā)和改進(jìn)，華大基因相繼推出的BGISEQ-500、BGISEQ-50、MGISEQ-200、MGISEQ-2000M、MGISEQ-T7等測序體系。

其測序平臺采用的是DNB（DNA Nanoball ，DNA納米球）測序技術(shù)，每個DNA的直徑約220-240nm。

主要步驟包括文庫制備，cPAS測序，數(shù)據(jù)分析等。

樣本準(zhǔn)備和建庫

MGI文庫構(gòu)建采用泡狀接頭及與之對應(yīng)的擴(kuò)增產(chǎn)物，有長接頭及短接頭，單端和雙端index。

圖片

將文庫進(jìn)行單鏈分離及環(huán)化處理后，以單鏈環(huán)狀DNA為模板，在DNA聚合酶作用下使用滾環(huán)擴(kuò)增將單鏈環(huán)狀DNA擴(kuò)增2-3個數(shù)量級，此時擴(kuò)增產(chǎn)物被稱為DNB。

圖片

DNB經(jīng)過DNB裝載技術(shù)固定在陣列化的硅芯片上形成納米芯片，由于一個DNB結(jié)合到芯片上的小孔后會排斥其他DNB結(jié)合，因此每個小孔僅容納一個DNB，高效了信號點(diǎn)間不會相互干擾。

測序

采用半導(dǎo)體加工工藝，在經(jīng)過修飾的硅片表面形成結(jié)合位點(diǎn)陣列（直徑約200nm），實(shí)現(xiàn)DNA納米球的規(guī)則排列吸附，陣列位點(diǎn)的間距約700nm，每個位點(diǎn)只固定一個DNB，高效不同納米球之間的光信號不會互相干擾。

帶有熒光探針的Read1引物在DNB上匹配互補(bǔ)，隨后系統(tǒng)對光信號采集，得到待測序列。

MDA（multipledisplacement amplification）二鏈測序，隨機(jī)引物在多個位點(diǎn)與模板DNA結(jié)合，在Phi29DNA聚合酶作用下起始復(fù)制，沿著DNA模板合成DNA，同時取代模板互補(bǔ)鏈；被置換的互補(bǔ)鏈又變成新的模板進(jìn)行后續(xù)擴(kuò)增。完成先進(jìn)鏈測序后，在該酶作用下形成第二鏈，通過DNA分子錨，進(jìn)行第二鏈cPAS測序。

圖片

(責(zé)任編輯：佳學(xué)基因)