CGAL:评估基因组装配质量的新标准

GB的标志所以你花了几年的时间在这个项目上:使用崭新的机器对地球上最复杂的基因组进行排序。你在“i”上打点,在“t”上打叉,把“g”和“c”都标出来了。从可用的汇编程序(仍在增加)范围中,您选择了您认为最好的一个。你最终得到的集合可能是完美的,但也可能是一场即将发生的灾难。

基因组装配和装配者都可以使用许多不同的质量指标进行评估。很长一段时间,将军是一个领先指标用于这个目的,但尽管将军脚手架和叠连群大部分时间长度与装配质量,测量本身可以是非常误导:严重组装基因组与读简单的缝合可以给非常高将军的价值观和仍是完全无用的。

那么,在2011年经历之后,也就不足为奇了第一个Assemblathon伊恩·科夫认为N50必须被消灭(带一个意味深长的问号)。在assembly athon期间,除了N50之外,还使用了许多不同的指标。然而,与N50不同的是,其中很多都需要一些关于正在组装的基因组的知识。这是来自伯克利的Atif Rahman和Lior Pachter遇到的问题:你可以使用不完美的N50度量,它不需要先天的你的基因组知识,或者你可以使用更精确的指标,但如果你研究的物种没有至少一个近亲属的测序-你注定要失败。

来源:JJ Harrison (CC BY 3.0)

在一月号的基因组生物学拉赫曼和帕切特发布一篇Method文章描述一种评估基因组装配质量的新标准:一种基于可能性的方法,它不需要基因组的先验知识。度量的实现,时髦的命名为“CGAL”,可以从作者的网站.该指标用于评估应用于几个不同数据集的四种汇编器的性能。作者发现,可能性度量准确地反映了序列相似性,这是其他度量经常忽略的。

除了汇编器比较,我们希望CGAL将成为所有在基因组组装领域最前沿工作的研究人员的有用工具,在其他研究人员之前没有测序的地方进行测序,并将帮助他们评估新发现的装配体有多好。

请浏览生物学网页上的最新文章金博宝188

评论