SRST2:基因组流行病学的新工具

在这篇问答中,迈克尔·伊诺伊和凯瑟琳·霍尔特是一篇文章的作者软件文章最近发表于基因组医学,告诉我们软件SRST2的开发情况。SRST2是一种基于读取映射的计算工具,允许从全基因组短序列读取中快速准确地检测基因、等位基因和多位点序列类型。

Generic-pink-bacteria-cropped-e1418906299578 18.12

为什么需要开发SRST2?

“全世界的诊断和公共卫生实验室都在采用基因组监测,作为常规分型和疫情调查的替代或补充。这被认为是应对全球抗生素耐药性威胁的一个关键部分,正如最近的报告所述白宫世界卫生组织.”

“尽管测序成本正在下降,但除非你是一名生物信息学专家,否则很难从基因组数据中提取重要信息。以可靠、可复制的方式进行这项工作尤其困难,这对于诊断和参考实验室来说非常重要,因为这些信息被用来做出有关基因的决策个人患者,以及感染控制和公共卫生。”

“我们谈论的信息类型是(i)检测特定的细菌菌株,包括那些因引起医院爆发而臭名昭著的细菌——如耐甲氧西林的细菌金黄色葡萄球菌,万古霉素耐药肠球菌碳青霉烯酶的产生克雷伯菌–和(ii)检测抗生素耐药基因,这对于预测治疗失败和跟踪耐药性传播都很重要。同样的方法也可用于鉴定毒力基因和质粒。”

你是如何进行软件开发的?

“SRST2项目是从暑期实习生Harriet Dashnow开始的,他被指派研究如何扩展我们早期的项目SRST(旨在从Illumina reads中提取多位点序列分型信息)来检测和分型抗性基因。然而,很明显,为了可靠地工作,我们需要对评分系统进行更快速、更稳健的改进。”

伊诺耶从头开始设计了一种新的评分方法,Harriet和Bernie Pope用优化的Python代码重新实现了这种方法。我们称这种新工具为SRST2。然后,我们对公共数据进行了大量测试,并请当地参考实验室(微生物诊断单位)的同事在一些实验室中自行测试单增李斯特菌他们最近对Illumina MiSeq进行了测序。”

你可以阅读更多关于这个故事的内容在这里.

在这个过程中,您面临了哪些挑战?

“在这种情况下,我们需要从不同的样本中分析探索数百个细菌基因组,以确定最合适的比对算法(在本例中为Bowtie2),然后设计一个评分系统,该评分系统可容纳比对器的行为以及我们在基因组取样中观察到的基因/等位基因含量。”

“一旦完成了这项工作,就需要坐下来集中一周左右的时间编写源代码并进行初步测试。然后再进行一个测试阶段,以评估SRST2应对更广泛挑战的能力,包括医院和公共卫生环境中的现实生活和潜在的时间关键场景。在此期间在这个过程中,每个阶段都是一个挑战,当它们都满足时,你就会得到刚刚发布的好工具。”

结果有什么让你惊讶的吗?

“我们对SRST2最初在速度和准确性方面的出色表现感到有点惊讶。这确实让我们相信,SRST2可以在现实生活中产生重大影响,在现实生活中,基因组分型、毒力和耐药性预测等场景对于尽快获得准确答案至关重要可能。”

你认为这个软件对微生物诊断有什么影响?

“SRST2可以直接从原始序列读取并在单个命令中快速回答许多临床上重要的问题。它也非常强大,因为它对数据质量或数量的下降相当不敏感。我认为出于这些原因,它有可能成为所有从事细菌研究的实验室的一个非常重要的工具基因组学。”

“作为第一个屏幕,它非常有用:一旦你有了SRST2的结果并知道你在处理什么,你就可以决定是否需要进一步的分析,例如用于传播跟踪的全基因组系统发育,或者致力于构建高质量的组装。”

这项研究作为一项联合研究的一部分发表特刊具有基因组生物学乔治·温斯托克(George Weinstock)和莎伦·皮科克(Sharon Peackok)特邀编辑传染病基因组学。

查看医学主页上的最新帖子

评论