利用纳米孔长读长测序进行全基因组结构变异分

来源:http://www.tywogames.com 作者:科技 人气:192 发布时间:2019-07-17
摘要:虽然在过去的40年中,随着测序技术的进步,我们对基因组的了解显著增加,但在结构变异分析中的应用仍受到常用短读长技术的限制。 大多数高通量短读长测序无法测量较大的结构变

  虽然在过去的40年中,随着测序技术的进步,我们对基因组的了解显著增加,但在结构变异分析中的应用仍受到常用短读长技术的限制。

  大多数高通量短读长测序无法测量较大的结构变异和重复区域,从而使分析变得尤其困难,特别是在基因组重复区域。长读长纳米孔测序可对整个DNA片段进行测序,不论其长度如何,因此更有可能涵盖整个结构变异体和/或重复区域,使分析更简单,基因组组装更精确(图1)。

  图 1 长读长对于结构变异分析的优势示意图。长读长比较可能涵盖整个结构变异体和/或重复区域,使分析更简单,基因组组装更精确。

  “鉴于纳米孔的测序速度快、能源损耗小且资金成本低,该方法可能成为癌症相关结构变异体低水平检测的理想工具,适用于分子复发、早期检测或治疗监测”。

  美国杰克逊实验室的研究人员采用纳米孔测序研究癌症样品中的全基因组结构变异。他们针对三阴乳腺癌(TNBC)细胞系的研究已识别出数千种研究相关的对基因有影响的基因组重组现象。长读长纳米孔测序还能解析之前被短读长分析忽略的复杂结构变异类型,在碱基解析水平揭示基因组的断点(图2)。

  图2纳米孔测序可识别复杂的结构变异。在该例中,相较于hg19,可同时检测出染色体5(2.5 kb)和染色体21(14.6 kb)易位以及TNBC细胞系中染色体21缺失(1.8 kb)。数据由美国杰克逊实验室卫嘉玲博士提供。

  染色体碎裂现象是结构变异的一种极端例子,其中有限数量的基因组区域在一次灾难性事件中获得数百个染色体重新排列,这种事件已经在癌症和先天性疾病中出现。

  长读长测序非常适用于分析这种大面积结构变异。乌特勒支医学中心Wigard Kloosterman博士的团队采用纳米孔测序对极其复杂的胚系染色体碎裂现象进行测序。纳米孔测序可识别所有断点,这些断点之前通过采用传统短读长技术的双端测序对mate-pair文库进行表征。该团队扩大研究范围检查全基因组结构变异时,发现长读长数据和短读长数据的结果具有一致性,但是,长读长数据还能鉴别出短读长数据未检测出的许多其他变异体(图2),进一步突出了短读长分析鉴别结构变异体的局限性。纳米孔长读长测序的另一个优势为,能够确定染色体碎裂样本的单体型分期,从而证实父本染色体碎裂现象。

  图2纳米孔长读长测序能够明确识别出大片段缺失情况,这一点在使用传统的短读长测序技术时效果不明显。数据由荷兰乌特勒支医学中心的Wigard Kloosterman博士提供。

  由于DNA重复度较高,后生动物基因组难以组装。100 Mb秀丽隐杆线虫(C. elegans)基因中大约有12%源于转座子元件, 该类转座子的大小范围为1-3 kb,并且可能与由短读长测序技术组装的基因组产生混淆,从而导致基因比对位置模糊。

  加拿大英属哥伦比亚大学的研究人员使用便携式测序仪MinION生成的数据进行从头(de novo)基因组组装,仅用145个contigs生成了十分完整的基因组,参考基因组覆盖率99%。这与使用传统短读长测序法得到的38,645个contigs形成了对比。

  有趣的是,短读长测序组装显著高估了基因组大小,而长读长数据的基因组组装更加精确。Jansen等人在使用短读长测序法和长读长测序法分析鳗鱼基因组时也描述了这种异常现象,该团队比较了Tc1(一个1.6 kb转座子)与参考基因组的数量和位置。传统双端读长序列的长度不足以测量Tc1转座子,也不能明确比对,而MinION contigs中有之前识别的Tc1因子,并且对应于它们在参考基因组中的位置。

  秀丽隐杆线虫基因组是第一个已经完整测序的后生动物基因组, 代表了一种用于评估新型全基因组测序技术的卓越模式基因组。

  长读长测序在需要对结构变异精确分析的应用中具备优势,可提供更完整的遗传多样性见解,如应用于人类健康疾病,精确并及时检测与肿瘤相关的变化等。

  如果您对在研究中使用纳米孔测序技术感兴趣,请扫描下方二维码,与Oxford Nanopore Technologies 取得联系。

  [6] Kloosterman, W. (2016). 人类基因组纳米测序数据中结构变异和染色体碎裂的特征. 介绍. 可访问:【访问时间:2017年1月5日】

本文由ca88手机版登录发布于科技,转载请注明出处:利用纳米孔长读长测序进行全基因组结构变异分

关键词: 基因组测序

最火资讯

Baidu
sogou