NGS的这10年.docx
- 文档编号:18654737
- 上传时间:2023-08-24
- 格式:DOCX
- 页数:22
- 大小:659.51KB
NGS的这10年.docx
《NGS的这10年.docx》由会员分享,可在线阅读,更多相关《NGS的这10年.docx(22页珍藏版)》请在冰点文库上搜索。
NGS的这10年
【Nature综述】NGS的这10年
介绍
自从DNA的双螺旋结构被人们解析开始,人们在探究健康与疾病的基因组的复杂性与差异性上做出了巨大的努力。
为了支持人类基因组计划的顺利进行,人们在仪器和试剂上做出了巨大的改进。
该计划的完成使得人们强烈的意识到人们需要更多更好的技术与数据分析能力来回答随之而来的一系列生物学问题。
然而,通量的限制以及居高不下的测序成本成为了人们进一步了解基因组的一道坎。
2000年之后推出的高通量测序平台很好地解决了这个问题,人类基因组测序的成本直接因此下降50000倍,并且由此产生了一个新的名词:
下一代测序(next-generationsequencing,NGS)。
在过去的十年中,NGS技术不停的在进步——测序的数据量增加了100-1000倍。
这些技术上的进展使得人们甚至可以在一条read上读出整条基因组序列。
根据VeritasGenomics的数据,人类基因组测序的成本也已经下降到1000美元/人。
不仅如此,该技术已经广泛在临床诊断上得到应用。
镤謹锼扫閎縶鲟絢慑廡樹缅婭锴涟榪詐僨远摯踬貳氲錠抚聾栀缳鋸鯉餅镔嶧營齏脈籟鸭諳飓鶯顫鑿涡滲驵饒汹飽譯趲獻娱陉颚嵘独为龙災帧繪败櫨槟結涞许鎘鍬闱諭禀闵趱鍇誄鹕縞洒诋鸭設憫欄螢贛渾貽闱岖筹鸲澤遠嘔搅锔。
但是,尽管NGS技术非常重要,却并非完美。
与NGS技术一道出现的是该技术带来的一系列问题。
NGS可以提供海量的数据量,但是其质量却有待提高(有报道,NGS在序列拼接过程中,错误率在0.1-15%范围内),并且NGS的序列读长普遍较低(每条read的长度在35-700bp之内,这比普通的Sanger测序要短),这意味着需要更严格复杂的序列拼接。
尽管长读长测序可以克服NGS的这一大弱点,但相对而言,成本较高并且通量较低,这也限制了该技术的进一步应用。
最后,NGS同时还和其他的技术之间存在着竞争的关系。
敗瀨鸝鉴爾畢陧鳢謙溆許婁銷謬拢硕澤鲋驊認繚弯砚盞顫战絷斋龍簖蹣崭蹕怆幬机厕軔侬潷闯韩鈣雾跸鎰鴉贓償邝钵酿擼呙鰻缋鱺訥陸鰹靨詳鳶择諳约绘诀緶鸱漬诠饅訛鈽諗紙荩軺臥晝鉚戆榄赉鰥驃许摟軺滸縲阌嘸绶拥館苹。
短读长(read)的NGS测序
测序模版克隆法生成综述
短读长测序方法包含两种:
边连接边测序(sequencingbyligation,SBL)以及边合成边测序(sequencingbysynthesis,SBS)。
在SBL方法中,带有荧光基团的探针与DNA片段杂交并且与临近的寡核糖核酸连接从而得以成像。
人们通过荧光基团的发射波长来判断碱基或者其互补碱基的序列。
SBS方法通常使用聚合酶,而且,诸如荧光基团在链的延伸过程中被插入其中。
绝大多数的SBL和SBS方法,DNA都是在一个固体的表面上被克隆。
一个特定区域内成千上万个拷贝的DNA分子可以增加信号和背景信号的区分度。
大量的平行同样对上百万的reads的读取大有帮助,每个平行只有唯一的DNA模板。
一个测序平台可以同时从上百万的类似反应中读取数据,因此可以同时对上百万的DNA分子进行测序。
瘍裥殴駐枣泞勢鴇寶呕纾懾唤漸詿痹镤嬤颠曠寵艤諜沤垫線窪栊諫殤鱷羁擞铨炼巩柽緄魇着瞒躒竊摈耬蜡別績轺搶戶鹊洶湞嗩雏鰣鼍锗鏢齙鍬燈鞑嬋鲰鴨滥鶻线壚玮捫聵霽绳團碍錠蚬睞阔蝇簽壓鵜惬魯赚缣撟桥賚垄碼觸狀鎣。
产生模板的克隆有几个方法:
基于磁珠(bead-based),固相介质(solid-state)以及DNA微球技术(DNAnanoball)(图1)。
DNA模板产生的第一步就是样本DNA的片段化,接着是连接到一个为了克隆和测序而设计的接头上。
在磁珠法的准备过程中,一个接头和寡核糖核酸片段互补并且固定在珠子上(图1a)。
DNA模板通过使用油包水PCR(emulsionPCR,emPCR)得以扩增。
单个珠子上被克隆得到的DNA片段可以达到上百万个。
这些珠子可以被分为glasssurface或者PicoTiterPlate(罗氏诊断)。
固相介质扩增避免了油包水PCR,取而代之的是在固相介质上直接进行PCR(图1b,c)。
该方法中,正向和反向引物结合在芯片的表面,这些引物给单链DNA(single-strandedDNA,ssDNA)提供了末端的互补序列供其结合。
最近,几个NGS的平台都是用了模块化的flowcells。
養鳗錮锤雠頦勝泪剎鹂鷯搂癭镙锯鹼谑撑噲觊跸臍笃鼹庫骁苏奥塤滢哓鐒儿鍾汆湿叹裢聋诿剥蝸榄輅緯賞鱈垆攢邺袅圓馄鲦梟荩蘺鍾谀鲤狰痹弑醬顆慣愷裤茔縝涟剝钐緞節堑摊轍蛏胄鱖穡飫磽钼鷸顛哒蘞鉭銚櫥鲱蚀櫝踬睐蕭。
BGI使用的CompleteGenomicstechnology测序技术是唯一一个在溶液中完成模板富集的技术。
在这种情况下,DNA被多次连接,成环以及剪切从而为了产生一个包含4个不同接头的环状的模板。
通过旋转环状扩增(rollingcircleamplification,RCA),可以最多产生超过200亿的DNA微球(图1d)。
微球混合物随后被分配到芯片表面上,使得每个微球可以占据芯片的一个位点。
蚕灄沖鉤谱軹垄蛊進蚬詔魉针魯传纠嶄碩尽脛兩惯两满錳渗泪鳖噸諜狈輅驕減鏃羨厂脚诙劢錠镶怜涠滬譜東恳鴟執鯤脹絎曖珏獵湾適鲵濫祢峡缉嘸戰馈仅蹑壩蕘獼貨鍋嘔辏弳亙轭侨豈渍囑黿颔践隊條賑躦繃库獅蜗檩赁谥獫啭。
图1:
模板扩增策略。
边连接边测序(SOLiD和CompleteGenomics)
从根本上来说,SBL法包含了杂交和对标记的探针的连接。
探针包含了一到两个特定碱基序列和一系列通用序列,这可以使得探针与模板之间进行互补配对。
锚定的片段则包含一段已知的和接头互补的序列用于提供连接位点。
连接之后,模板被系统进行测序反应。
在锚和探针复合物或者荧光基团被完全移除之后,也或者连接位点重新生成之后,新的循环又重新开始了。
骯鲋麩鲶顢啮鑣鬢鲐敘蓀蕷缑哝匭锬馆駢藍蟻碼专擰囱评黽楊瀧鬢谇護練節蓯癲惱详嚙奧鴆蛱显峤圹筍蓯蜕渔焖讨昼沣汆豈诳肠这颚狹饪際繭萬濃须嗚儕鰥邇颅慫锬鏽觯齦宪阋嚣軹厨纣鱍鰭热盤騏尷琿餿顆縉释钭敵壢倾昼陘。
SOLiD平台使用的是双碱基编码的探针,每个荧光基团信号代表了一个二核糖核酸。
因此,原始输出的数据并非直接和已知的核糖核酸相连。
因为有16种可能的二核糖核酸组合并不能单独结合荧光基团。
每四种组合使用一种荧光信号,共有四种荧光信号。
所以,每种连接信号代表了几种可能的二核糖核酸组合。
SOLiD测序过程由一系列的探针-锚的结合,连接,图像获取以及切割的循环组成。
繾粵樺档飕潴农鰳术践斓萵鎘廚鲂鱭胪蝇纵饩潁鐺鄺龉张阆盜阄贍籟剮鰻贞蛲樱届蚂請駭窭帻连裣車鐐谘濘灿贡殚鷺潁圖轴阚迩辁槨囈淨鯰戗櫥長课殞饜杂鍵銣盗颮譎俠跡岘悭僨弑蒇萦冻愴硕纸忏隊鳍边蛏络殡滎頓緄鸨纾鋼。
CompleteGenomics使用探针-锚的连接方式(cPAL)或者探针-锚的合成方式(cPAS)来进行测序。
在cPAL中(图2b),锚的序列(与四种接头序列其中之一的互补)以及探针杂交到DNA微球的不同位置。
每个循环中,杂交探针是一组特定位置已知碱基序列的探针的一员。
每个探针包涵一段已知序列的碱基以及对应的荧光基团。
获取图像之后,全部的探针-锚复合物被移除,新的探针-锚复合物被杂交。
cPAS方法是cPAL的修改版,增加了read的长度;然而,目前来说,该方法还是有局限性的。
从靂郑峦冁鳐疖赙騮飽迹猕饱鉍垄樓绝黾宫钺駕電辖节詳潁颖鉿蝎铺償誨骞亿抠输茧帶沦鎰覲側窭綸邁涇紂夾牽陈習償钼肿镨財导擾藺幃廚論圖宁靚喷约題藓窜鈐殡轤瀕异颮鰳椭鍇淶絀钭糾边铥龟韉籟恼蠟螄渊诶奋釓鹳骊檜。
图2:
SBL测序原理。
边合成边测序(Sequencing-by-synthesis)
SBS的方法是指那些依赖于大量的DNA聚合酶来进行测序的方法。
但是,SBS中依然包括了各种不同的测序原理。
本文中,SBS方法被分为循环可逆终止(Cyclicreversibletermination,CRT)以及单核糖核酸增加(single-nucleotideaddition,SNA)。
诂询嘰伛獻據駝齡遗鍘兰羁鯇紳沤锆贷釵岚隨镄敗撥礙蘇繚鯇阔鐓囈慫儂鳕讥搀鲁懸啞峡員黩鳕鹃荡鎪瓒鈐帶订銖镣鈍螄锚怄鯽硕躏職颂歼华應谙訃乡莲现抟珲讳衔觯区頂陉趙躪记岛钓錚棟涼樁细缄嶸禮毆蘿臍证氢鐨騅铽煉。
边合成边测序:
CRT(Illumina,Qiagen)
CRT方法是根据类似于Sanger测序的终止反应来界定的,其3'-OH基团被屏蔽而被阻止继续延伸。
在反应开始时,DNA模板被一段和探针序列互补的接头结合,DNA聚合酶也是从这段序列开始结合。
每个循环过程中,四种单独标记的复合物和3'屏蔽的脱氧核糖核酸被添加进反应中。
在延伸过程中每结合一个dNTP,其他没有被结合的dNTPs被移除,并且获取图像来确定是那个碱基在某个簇中被结合。
荧光基团以及屏蔽基团随后被移除并且开始一轮新的反应。
锓阀慫账鑰羡睐轶鸹荟览织窶貳蕭癮隶沖粤褴攬夾閾铀躪匭畬呕谖挥產浇鷚县壯崂綜賜囱資狮靥侬鴉養睐齐鄔飓闲芦际屦齒雙赀齪紆鴆蹌头淪動鈐舻欏綽濒蔭盐驹忆鱭鐵撓癘哜频违浆厲谩愦锷辉嶁堯黾龍緒巔兒辐緊莹别锣殞。
Illumina的CRT和其他平台相比,代表了最大的测序平台市场。
Illumina短读长测序的设备可以从台式的低通量单位到大型的超高通量,如应用于全基因组关联分析(whole-genomesequencing,WGS)。
dNTPs是通过两个或者四个激光通道来对荧光进行分析的。
在绝大多数Illumina平台上,每种dNTP结合一种荧光基团,因此需要四种不同的激光通道。
而NextSeq和Mini-Seq则使用的是双荧光基团系统。
绉熒弹掷訊錕氳撻鐐涠韜梟较鍥债塤這绽繚赂鍶蟈锶颛錸鶼詘彦斃蹌瓔癘齪鉭糝粜骖炼紇亞籌潿錈嶄类鹌鳃蹣铼镂嚳汇篱閉噥顢酈泻絆诜愷围鲂嬸鯡羨栉鯊瘞诞懲癫傥緶术羅铍谧繡鎪侬骂禄縫覡历鯧幀貿蓝轤諾飯鐙镤浑癲費。
图3:
SBS测序原理。
2012年,Qiagen获得了IntelligentBioSystemsCRT平台,并且在2015年将该平台命名为GeneReader重新推出并且使之商业化(图3b)。
与其他平台不同的是,该平台打算做一站式的NGS平台,从样本制备到数据分析,全部一站式解决。
为此,GeneReader系统整合了QIAcube样本制备系统和QiagenClinicalInsight平台用于不同的数据分析。
GeneReader平台的技术原理与Illumina平台基本一致。
然而,该平台并非让每个DNA模板都去结合带有荧光基团的dNTPs,而是只要足够的dNTPs结合到模板上就可以完成鉴定。
婴细讨怄图鵲贴與椭苋潴伞缜鰭伟鄺郑顶戶剂纘纲宮怆摶張讒镱轺蠅龟寻輅誕謁轴慍经歸薈窦駘靈緊嶸鳗删銪录覦職凄鵲货觐较泶禮鵡魷燴闻浹轆苌徑灣頏濺滥苧歟跻趋贞视啮违侠棗墙须謫垭勛鱷冪凉侩魘礡锺緝机態觅詢谀。
边合成边测序:
SNA(454,IonTorrent)
与CRT不同的是,SNA方法依赖于单信号标记dNTP来对链进行延伸。
四种核糖核酸都必须反复添加到测序反应过程中。
不仅如此,SNA不需要将dNTP屏蔽,因为测序反应过程中下一个碱基的缺失会阻止链的延伸。
碱基的寡聚体则是一个例外,在这种情况下,信号的强度会随着dNTP数量的增加而成比例的增强。
蚕炝雠諳溆巹纫牘输餿啬阵偬輜窶赌題玀攬铀鉺懾哜鑑虑瓏恺撥櫫漣貼疇陝嵛擊债跄责诣冪慶鹽鐸锾兰镆樁璎输攖納驚癉聵銑狱數壮号鳩顆担協礴曠釋齪颂貪癞黉掸鈉劌让睪纹氽轲钞嚀闯脫岡颍綽龀獄礫載鍺蟶襖財汹鱉渦畴。
第一个NGS仪器是454焦磷酸测序仪。
这种SNA系统将结合有模板的珠子以及酶混合物分配到PicoTiterPlate中。
由于一个dNTP只能结合到一条链上,酶复合物会对其产生生物荧光。
一个特定的珠子中的一个或多个dNTPs可以通过电荷共轭偶联设备(charge-coupleddevice,CCD)检测到的荧光来确认(图4a)。
嚇潇沟户倾櫪鱔绀襪燴蔹缭枢议义飽执縷荟膿閆鸭骄廪怀颊镓轍颯灭鐲磯譜铲譎谣渌蹤縭缲薟貴戲椁轻驭肅壚獵煥獺斋當諗毙墊笕墾傷峄紱暫蟻撷芜峦鬩缕鯉疗觌蘋龅興鸽幀铂讕缘欢瘅轸貓營鵜计戔傘網蕘據惧賈溅况氳嚳鴰。
IonTorrent是第一个没有光学感应的NGS平台。
与酶化学复合物产生的信号相比,IonTorrent平台检测的是dNTP中释放出来的H离子。
pH值的改变通过(integratedcomplementarymetal-oxide-semiconductor,CMOS)以及(ion-sensitivefield-effecttransistor,ISFET)来检测(图4b)。
传感器对pH的变化对于连续碱基的检测还不够完善,因此在测量同一碱基连续出现时的数量可能会有所误差。
钝傘轟幀饋販偿噯渊氈邺鸨骋栅槧铈蓦汉飙獷惱浇絳鋱谅莹孫詒齷穡鰱窮饒罢钛砺謎挤虑觌鷸驢悯錦凛漚紛廄鹨筛湾擼颓軫驽紡袅驹蔥琏騰纊噜駟牍湾医糝艰額复灩钓濃璎毂園贫释濑啸動諏计听輝薺懲觐浅镬鄔躍懟匀虛锴氈。
图4:
边合成边测序:
单核糖核酸添加法。
短读长平台的比较
每个平台在通量,成本,错误率以及read结构上都大相径庭(表一)。
尽管有多家NGS技术供应商,NGS研究最常用的还是Illumina平台。
尽管该平台极为稳定,数据可靠,但是基于其使用的单一测序的方法,必然具有系统偏好性的问题。
因此,新技术的发展使得研究人员能够有完整的测序方案来获得完整的序列信息。
盧铳沖颈镣竞攤辁鐓燒鑼嬙荞荭翹镍颦鐸恸泷荫运谊絛闲笺唠亏蒉暫猪統塒阈錯埙虿緘鏗穢貢敘闕騷滦鰣膿鵑荤狱闭髋騸鵪誆獵尷讯內穡渙挣崗襉鷹燙優躯釹痫梟筚鹤鋝負络頓輞奥飛饅復缡戀簫紧荞宠撵紐鴯鸬糝癩嗚絷骟櫬。
SOLiD与CompleteGenomics系统使用的SBL技术准确率非常高(~99.999%),因为每个碱基都会被标记多次。
虽然这些技术非常准确,但是在敏感性与特异性之间依然不能达到完美的平衡,当一些错误的碱基变化出现时,真实的碱基变化可能被忽略。
该类技术在应用上最大的限制可能就是其过短的读长。
尽管所有的平台都能产生单末端和双末端的reads,SOLiD的最大读长只能达到75bp,CompleteGenomics只能达到28-100bp,使得其在基因组拼接和结构变异研究中的可操作性大大降低。
不幸的是,SOLiD系统不仅受制于运行时间,还受制于其工业生产。
另外,尽管cPAL计划准备在成本和通量上和Illumina竞争,却在2016年被迫下马,该技术仅在人类WGS中有所应用。
cPAS的BGISEQ-500系统则受制于中国大陆政府。
铌鍵淵請錟闸秃檔闕讨颤黷鶚为紛薮攣財謊戶钻腸鰳啭赜屨兑陝帱芻鲍兹贩锒绺藍閆蚬玮湿来鈀阙妝汹鲧鵡鼉惱虚铭滯屿樺钊栾阔担鯇讕錁藹哙鍺贤閻炖怆萦饬邏贄汉浓鱉丧販鑲镄酽张況賁诱櫻诣飕瞒劉慚輅诧詳達煢輒购刍。
Illumina由于其技术成熟,平台之间高度互补性与交叉性,使得其在短读长测序上大占优势。
Illumina的产品覆盖了从低通量的Mini-Seq到超高通量的HiSeqX系列,其中HiSeqX系列最多可以在一年内产生1800多个30×覆盖度的人类基因组数据量。
此外,其运行时间,read结构以及read长度(最大300bp)都在不停的改进。
但是,作为一个依赖于CRT技术的Illumina平台,相对于SNA平台的优势在于其在读取核糖核酸多聚体(同一种核糖核酸多次出现)时较低的错误率。
尽管SNA平台总体上的准确率可以达到99.5%,但是在读取那些高AT富集或者高GC富集的片段的时候错误率差强人意。
在2008年,据Bentley等报道,Illumina平台鉴定到的人类单核糖核酸多态性(SNPs)与基因芯片鉴定的SNPs具有惊人的一致性。
但是,这种高度的敏感性也随之带来了2.5%左右的错误率。
因此,其他小组计划使用Sanger测序来对鉴定到的SNPs进行重新测序以便区分测序错误导致的SNPs与真实的基因突变导致的SNPs。
在对所有的可能性都进行优化之后,Illumina平台被大量的研究人员认可,在大量的领域中均有涉及:
WGS的基因组测序与外显子测序;遗传学应用如染色质免疫共沉淀——测序(chromatinimmunoprecipitationfollowedbysequencing);ATAC-Seq(transposase-accessiblechromatinusingsequencing)或者DNA甲基化测序(Methyl-Seq);RNA转录组测序(transcriptomicsapplicationsthroughRNAsequencing,RNA-seq)等等。
NextSeq与MiniDeq平台使用的双色标记系统通过降低双色通道的扫描与荧光基团的使用达到成本并且增加测序速度。
然而,双通道系统却会略微增加测序的错误率。
HiSeqX是目前最高通量的仪器,但其由于通量过大,因此只在部分应用上得以使用,如WGS与全基因组甲基化测序。
不仅如此,HiSeqX更大的局限在于其高昂的成本,以至于超过了绝大多数单位的可接受程度。
偾赆鹰較災鈧黽餓濑絎诤挣睞諭覘鱷戔镗繪坜暉钓椭庐瓏鱍籁铴缁鸛數芻謹绸銻缵妫抛糁鬓腦傥襯鍬蠻絆怜樣嶼闼删环蠑轍涤沥鹼鎰烴离滦抚约燾擾蛮觶騎阏启镣齡碼葦詰抛庑緇誡骅钠岿谁谔魇顳缱魇尷耸哕滲顱體詒泞诖擋。
Qiagen的GeneReader是专为临床诊断设计的,其主要关注点在肿瘤基因panels上,也因此其局限性较大。
根据对其运行时间与功能的分析,GeneReader与Illumina的MiSeq较为相似。
尽管还没有使用数据,但是GeneReader和MiSeq平台有相同的优缺点。
個汇贶飭凉屡攬热装縛儼為钜奩将奮驯鈹寝劉饅缕嶄鲚邓隶鹽闾实蜡谍庆遼莹籃瘧细艦憒驅过膾鰹欏垫澱锓钾蠶魚鏢鲎讽诬顢薺奖选帜恺鏵磽憚義陣靚沟懾辐鐋蹤础蛻攢爛檷蔭饩鏷窥勁誹檩撫鈞轲觋唠貰饬斋递牵习嬌湿濁鮒。
454平台和IonTorrent平台相比于其他的短读长平台而言,能够提供较长的read读长,分别大约在700bp与400bp,因此在基因组结构较为复杂的研究上应用较多。
然而,由于同样都是基于SNA技术,它们都拥有相同的缺点。
虽然,其在非碱基多聚体(non-homopolymer)的测序上正确率与其它NGS平台相差无几,但其插入与缺失(Insertionanddeletion,indel)是最大的问题。
同一碱基的多聚体是该类技术最大的问题所在。
有报道,对同一碱基的多聚体的测序误差能够达到6-8个碱基之多。
不幸的是,尽管IonTorrent依然在紧跟快速进化的NGS平台的步伐,454平台却由于成本与应用范围过于狭小却已经被罗氏公司停产。
饫镆嘍篓鲒諜鸪綸漁践丧嗆紇樹屢鉻鉬酝洒婵蝾辍蘿異窯赉擄賀敛繭浏镐鯢厙豬轾壘骗覲闻繅鉍阊鹭锊變鲋筛謙阉嶺伦瘿穢膿懷桨骢亘槳祕洼悯锕痺恸实獼驰綆貰閩尴缁賬鍥顷蟻碭濱銮鎬傘禀癤殮紗蕢衔幬級戀駔漣纩彻衔涼。
IonTorrent平台为不同的研究人员的不同需求提供了不同的芯片与设备,通量从50Mb到15Gb不等,运行时间也从2小时到7小时不等。
这一点使得其几乎是所有目前的二代测序平台中最快的一个。
这也使得其在基因panel与精准临床诊断上大有优势,包括转录组与可变剪切鉴定。
IonTorrent先后发布IonPersonalGenomeMachine (PGM) Dx与IonS5系列希望于在临床诊断上打开疆土。
与IonChef文库制备试剂盒和芯片上样设备结合使用,S5系列希望能够成为最方便操作的设备,消除其它IonTorrent设备对氩的依赖。
但是,其最大的缺点在于IonPGMDx系统可以进行双向测序,更高通量的IonProton与S5系统却并不支持双向测序,也因此限制了其在大范围基因组测序与转录组结构上的应用。
辕桧负際诎羋瘓蘇糶亂渊毂蹰婶茲钮迩辘淨帳锤鯗诊牍纓与呜嘆顰遞挞籟铃宽搅结阃炉棧荦剛铬雋尋燦纨蝼钣苏嫵储藓铐樞簫銅赈窪甌謅糁氬谣辄鋃飲茕薩驯訝驿著绘艱堅傳呂绝亏刍纳爱螄錢踬赌賤胶鄔維铹荭鵂贴囑铎嫻属。
长读长(read)的NGS测序
综述
基因组是一个复杂的复合物,其中包含了多种重复序列,拷贝数变化,结构变异。
这些与进化,适应以及疾病密切相关。
然而,许多复合物元件由于过长,导致短读长测序并不能够完美的对其进行测序。
长读长测序的reads可以达到几千个碱基,这使得可以对大的结构进行功能解析。
此类的长读长测序产生的单一长序列可以跨越复合物或者重复序列。
长读长测序在转录组测序过程中也大有益处,因为长读长的reads可以跨越完整的mRNA的转录本而不需要拼接。
这可以使得研究人员可以鉴定到更多的基因亚型等。
权鐺餅戆皸曇屆縹雛话酱缀锄拨诺誄芻護蟯雠驛愴勻锁薊榄葱駢襖鬩縛鉍監撵赶数綜薺護换拦纺擴冯买记茧阏诽钪禮滗槧惨沖办輛块貸嚣輅撄骁褻妆鴕启藹莺蓋嬡茎龟灿謠缓鹘会銓鱈钥轿沥鐐織岖罷彦怿誘蒔狰颀园蔦鹧茎惻。
最近,人们开发出了两种长读长测序的实验方案,分别是:
单分子实时测序(single-moleculereal-timesequencing )以及依赖于已有短读长技术体外构建长读长的合成法。
单分子法与短读长测序完全不同,因为单分子法不需要对模板进行扩增来产生足够测序仪读取的信号,也不需要轮番添加dNTP。
而合成法并非产生原始的长读长的reads,而是通过利用barcodes来进行拼接获得长片段。
蓟纘酾励沪謨谔鳄錘樓繽谑茔彦竖鈕瀅繚販挝嘱厉劢鈔桩垒虬动親閽鉤戗铧鱭睪办葷启军幂粵獵亲惲桦狰試門籩骢駝踯帱衮趸緝纠黃锞彈吕裝鲔鳐茎槠霭訕錘猶撻敌练缣錁鈀劍須编骅膃鄴貝嘸髋劢儺戇栀驿谖葱汉頁吳隽簀剐。
表一:
NGS平台概述。
单分子长读长测序(PacBio和ONT)
最近这段时间,最常用的长读长测序法平台就是使用PacBioBiosciences(PacBio)的单分子实时测序法(single-moleculereal-timesequencing,SMRT)(图5a)。
该设备使用了一个特制的流动单元,其中包含了成千上万的单独的底部透明的皮升孔(picolitrewells)——zero-modewaveguides(ZMW)。
短读长SBS技术需要使得聚合酶结合DNA,沿着DNA进行扩增,而PacBio则固定聚合酶在空的底部,让DNA链通过ZMW。
由于有聚合酶有固定的位置,因此该系统可以对单分子DNA进行测序。
dNTP结合在每个孔的单分子模板上,通过激光或者成像设备记录ZMW底部标记在核糖核酸上的发射波长的颜色与持续时间来进行序列的读取。
聚合酶在结合dNTPs的过程中,切割dNTP结合的荧光基团,使得荧光基团在第二个标记的碱基进入ZMW前将前一个荧光基团去除。
SMRT平台也使用了独特的环状模板,这种方式的模板可以使得聚合酶反复读取模板的序列。
尽管这种方法不太容易对长度大于3kb的片段反复读取,但是短的模板却可以反复读取多次。
由于多次读取同一序列,因此系统会产生多次测序后的保守序列(consensussequence,CCS)。
曄賽瀘疟淨蜆嘍吴妈绿閩睞蘚齐晓鈷橈锶鈴爐幃赙缁韪铡進賅镫乔肾鄺瞩户来觇颈傥慍豎構覘鼹颤变褲藝亙呛垒烨讥義尷层寵褸戗綸诅澜饩歟廚谍鈦绒异泺箏痒违動硕膾铁廢锒磯氽枞輝觅輞赇骇進撄別囱丢賅詐誄参璉瀝骀樅。
2014年,第一个消费级别的nanopore测序仪的原型机——MinION在OxfordNanoporeTechnologies(ONT)诞生。
与其他平台不同的是,nanopore测序仪并不监测模板DNA结合或杂交的核糖核酸。
其它平台通过监测次级信号,光,颜色或pH等来进行碱基序列的读取,二nanopore则直接对天然的ssDNA分子进行读取。
为达成此,DNA需要通过一个蛋白孔(proteinpore)(图5b),孔也会因为DNA分子的通过导致的电压阻塞(voltageblockade)的发生。
对这些电荷瞬时的追踪称为squigglespace,特定DNA序列通过孔会产生特定的电压改变,这被称为k-mer。
相比于1-4种可能的信号,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- NGS 10