小心词:研究RNA-SEQ偏差的新方法

2

gblogo_small.作为下一代测序方法迅速成为基因组学的普遍存在的工具,越来越多的努力是为了了解这些方法的局限性。这些限制通常以覆盖率偏差的形式出现。

去年基因组生物学David Jaffe和他的同事发表了一项研究看着DNA测序中的覆盖偏差。作者使用了一套计算工具,用于偏见评估,并将其应用于许多常用的技术。事实证明,例如,PacBio覆盖率最不偏见;并且,高和低CG区域和长期的均聚物非常容易覆盖偏差。他们强调,这种偏差的存在可能导致基因组的某些区域在测序项目中产生缺乏采样。

shaury nash cc by-sa
shaury nash cc by-sa

不太重要的是RNA测序数据的偏置问题。最近描述了许多用于评估 - 和纠正的生物信息方法 - 例如,此问题(例如,这里这里)。虽然这些计算研究确定了一些偏差源,例如PCR富集,逐合成反应的读取误差和RRNA耗尽方案,但它们不能区分技术导致的覆盖像差和由样品的本质引起的覆盖像差。

本星期基因组生物学发布John Hogenesch及其同事的一项研究这在详细说明,而且优雅的方式上解决了这一点。寄生。介绍一种新方法:在体外转录的RNA测序。他们创造一个超过1000的池在体外转录(IVT)来自人cDNA文库的RNA,并用两种最常见的方案,多A和总RNA-SEQ序列这些RNA。该方法可确保每个转录物是 - 在序列水平上 - 同样表示。任何可见的差异都必须来自图书馆准备步骤。

作者发现,随着十个转录物中的多个成绩单显示在转录物内序列覆盖范围内的显着差异。此外,超过5%的成绩单包含了非常不可预测的覆盖区域,在样本差异之间存在巨大。作者表明RRNA耗尽是主要的罪魁祸首。最后,他们注意到一种物种RNA-SEQ的覆盖范围可以取决于RNA-SEQ的污染来自另一种物种(鉴于最近发现的光明的观察值来自1000个基因组项目的7%的数据被污染了支原体序列)。

然而,并非一切都是厄运和阴郁。作者希望IVT RNA-seq能够在许多哺乳动物研究中更好地表征RNA-seq覆盖偏差,并且类似的方法应该能够在其他物种中做到这一点。这种方法也有助于对新的测序方案进行基准测试,从而使RNA-seq技术比现在更好、更强大。

请浏览生物学网页上的最新文章金博宝188

2评论

评论被关闭。