基因组生物学的基因组信息学

在今年年初,我正在考虑去年参加的会议。一个亮点是基因组信息学,我是九月去的,代表基因组生物学

惠康信托会议中心的图像结果

基因组信息学是年度会议,重点是理解基因组生物学的计算方法。它在惠康信托会议中心在英国欣克斯顿和冷泉港实验室,纽约,美国。去年是Hinxton的转折,所以我走了,因为我在英国之前的两次。

这两个主题演讲来自凯蒂·波拉德(Katie Pollard)(美国加利福尼亚大学旧金山大学)和拉斐尔·艾里萨里(Rafael Irizarry)(美国波士顿,达纳 - 法伯癌症研究所)。Pollard讨论了机器学习在基因组学研究中的使用,尤其是可能出现的问题。她指出,如果您要查看的问题非常不平衡,您不应使用平衡的培训数据(例如,很少有阳性和许多负面因素,例如识别启动子序列);而且,许多机器学习模型都假定数据是独立的,并且分布相同,但是基因组学数据的情况并非如此 - 但是,即使可能违反该模型的假设,仍然可以获得有用的结果。

现在,还有更多的谈判讨论信息学揭示的生物学,而不是信息学方法本身。

Irtizarry的谈话还在分析中处理问题,为什么你不应该盲目地信任你得到的结果。有时,如果您的结果只是通过缩小数据,您可以获得一个好主意。这是许多会谈中的一个共同主题。Irtizarry举例说明了一项研究的例子,据报道,血液中表达的四分之一的基因在两种人群之间差异表达。这似乎很高,所以他看着它,发现批处理效果从两个单独的项目中取样了两个人口。

在此次会议的前一个版本中,与会者告诉我它自首次开始以来它如何改变 - 现在有更多的谈判讨论信息学透露的生物学而不是信息学方法本身。这种迭代没有不同的,几个关于分析大量癌症基因组以找到变体,或者大群人类基因组的谈判,以找到与发育障碍相关的变体。为了超越试图识别与条件相关的变体,Sri Kosuri(加州大学洛杉矶,美国)谈到了他测试了数千个SNP的实验,以便在报告基因构建体中对剪接拼接作用。

我发现我特别有趣的一场生物学演讲是来自卢西亚·斯潘根贝格(Lucia Spangenberg)(乌拉圭蒙特维迪奥研究所),他一直在试图重建乌拉圭的土著人民的基因组,乌拉圭的土著人民在199年被灭绝。Th世纪。Spangenberg发现,它们之间十个现代乌拉圭人的基因组含有足够的Charruan DNA,能够重建99%的Charruan基因组。通常,人们的本地遗传血统高于他们自我报告的本地身份。

几次演讲讨论了如何使用现代技术,例如太平洋生物科学的长阅读测序,来自10倍基因组学的链接读取以及HI-C的基因组接触信息,可以用于改善基因组组件。这在各种系统中显示:鸟类(瑞典乌普萨拉大学的亚历山大·苏(Alexander Suh)),驴(Nikka Keivanfar,10倍基因组,美国)和莫斯(美国佛罗里达大学萨拉·凯里(Sarah Carey))。杰弗里·基德(Jeffrey Kidd)(美国密歇根大学)表明,PACBIO可以用来生产狗的参考基因组,该狗比使用Sanger技术测序的原始狗更完整。

一个特别喜欢我们的一个趋势基因组生物学是以图格式表示基因组的方法的数量增加,其中显示为替代分支,而不是传统的线性参考表示。这是针对原核生物基因组(英国牛津大学Rachel Colquhoun)和真核基因组(Prithicka Sritharan,Quadram Institute Bioscience,UK)的描述。我们发现这很有趣,因为我们已经讨论了一段时间,并且刚刚发出了呼吁图形基因组上的文章集合

我计划参加在冷泉港举行的今年的基因组信息学会议,这将是令人着迷的,看到不同地点以及不同的代表如何影响会议的感觉和重点。但是,这是不同的,我预测它将像去年的会议一样引人入胜。

查看关于生物学主页的最新帖子金博宝188

评论