基因组组件中的错误重复

大卫·凯利(David Kelley)和史蒂文·萨尔茨伯格(Steven Salzberg)马里兰大学学习今天发表在基因组生物学。二倍体基因组具有同源染色体之间的显着变化。这会导致基因组组装算法的问题,这些算法可能构造了两个与一个不同区域相对应的DNA序列,并将两者都纳入一个组合体中,作为虚假的分段重复。

他们的方法是使用序列配对信息将DNA序列片段与周围序列相提并论,以确定是否应将重复的片段合并为一个副本。配对对是从同一DNA区域得出的两个序列读数,这项研究是首次使用配对对读数来检测重复。凯利(Kelley)和萨尔兹伯格(Salzberg)将其管道应用于牛,黑猩猩,狗和鸡基因组,他们确定了许多单拷贝区域,这些区域已错误地纳入这些基因组组件中的分段重复,这也允许先前未发现的多态性鉴定出来。这有望成为纠正许多基因组组件中现有错误并控制未来基因组测序工作中的错误组装错误的宝贵方法。

查看有关生物学主页的最新帖子金博宝188

注释