

宏基因组学通常涉及对DNA样本进行测序,这只能用“棘手”来形容。这样的DNA表现出高度的异质性,这可能导致物种间的错误组装。
这些错误组装威胁到宏基因组测序的目的,即通过在给定样本中生成多个草图基因组来全面研究基因库。由于这些样品中存在某些不能用标准微生物学技术培养的生物体,这一问题进一步复杂化。如何解决这一连串的问题?
东京工业大学的科学家们现在找到了答案。他们已经开发出一种新的宏基因组组装器,称为metaPlatanus,它可以生成精确的DNA序列,包括那些未培养的生物体。他们的突破性发现已作为研究文章发表在《核酸研究》杂志上。
metaPlatanus使用精确的短DNA序列读取来组装contigs。Contigs是稍长的DNA序列,类似于较大基因组中的拼图。通过重复使用远程序列链接、物种特异性序列组成、覆盖深度和分组信息等输入,将这些contigs组装成更大的染色体尺度支架。
东京工业大学生命科学与技术学院助理教授、该研究的首席科学家Rei Kajitani博士解释了基于metplatanas的支架生成输入的选择,他说:“我们采用了一种混合元基因组组装方法,不仅利用了短程和远程序列读取的优势,而且还弥补了读取长度和样本本身所带来的缺点。”
Kajitani博士和他的团队不遗余力地检查metaPlatanus产生的结果的准确性。在这方面,他们使用已知细菌的模拟数据集进行了一个称为基准测试的过程。不出所料,mettaplatanus给出了高度连续的输出,很少有物种间的错误组装。
值得注意的是,在使用已发表的人类肠道数据测试metaPlatanus的准确性时,它还组装了许多生物学上重要的元素,包括编码基因、基因簇、病毒序列和一半以上的细菌基因组。
此外,与其他现有工具相比,只有metaPlatanus能够执行一些高丰度细菌基因组的近乎完整的组装,同时使用已经发表的人类唾液数据进行基准测试。
事实上,Kajitani博士和他的团队似乎在mettaplatanus身上找到了宏基因组的黄金。他对metaPlatanus的潜在应用感到兴奋,他说:“我们相信,我们在东京工业大学开发的宏基因组组装器可以帮助检查在基因组中传播的序列元素的背景,这可能有无数的现实应用。”
毫无疑问,这项研究将成为宏基因组学领域的一个里程碑。