通过更好的数据发布更好的科学

上周三,我参加了一次电话会议通过更好的数据发布更好的科学在Wellcome系列中,由科学数据基因组生物学一直处于使数据打开的最前沿,我们坚持在大多数其他期刊之前公开可用数据,因此有趣的是,看看该领域的状态如何进展。会议参加了会议,大约一半的与会者来自生物科学。

Scidata16
一天始于谈话弗洛里安·马克维茨(Florian Markowetz)从剑桥大学讲述了为什么我们应该可重复地工作,并且珍妮·莫洛伊(Jenny Molloy),也来自剑桥,说明为什么我们应该公开工作。两位扬声器都提出了一整天都重申的观点:除了这样做对每个人都更好的外,这对您来说也更好。似乎是开放和可重现的,这是一项及时的大量投资,但是在最初的努力之后,从长远来看可以节省您的时间。它使您更容易回到早期的结果并知道自己的所作所为以及发现错误,从而使您无法陷入尴尬的缩回。如果其他人使用您的数据很简单,那么对您来说也会更好。出版是一件好事,因为说服审稿人您是对的,这很容易。因此,除了使每个人受益的无私理由之外,也有许多自私的理由这样做,这似乎是说服他人的最佳方式。有关Markowetz谈话的更多信息,您可以阅读评论文章他去年与我们一起出版。

然后随后进行了一系列研究人员的闪电谈判,涉及他们对开放数据的所作所为以及他们用来帮助​​他们的工具。这些领域包括生态学,基因组学,能源政策和材料科学。可能产生最大兴趣的谈话是盖伊·鲁洛(Guy Rouleau),描述了蒙特利尔神经学院在麦吉尔大学,成为第一个完全开放的大系(据他所知)。这需要所有被要求签署数据释放的录取同意书的患者,可应要求的研究人员提供的样本的生物库,以及该部门不对任何发现的知识产权寻求知识产权。这一举动是由教师一致投票的,并将对其进行效力进行监控。

闪电谈话之后,主题演讲恢复了凯文·阿什利(Kevin Ashley)爱丁堡大学向我们介绍了如何管理数据。在基因组生物学,我们习惯从基因组学角度考虑数据共享,但是Ashley的演讲为其他领域提供了一些有趣的例子。例如,我们通常会考虑为什么可能不会在患者机密性方面公开数据的原因,但是还有其他充分的理由可以将数据私有化。给出的例子是稀有植物标本的位置,不建议公开确切的坐标。但是,阿什利指出,即使在无法公开数据本身的情况下,重要的是要公开可用数据。阿什利还提到,天文学家已经使用开放数据已有数百年了,将早期天文学家的观察结果纳入了他们的工作。即使到现在,也可以使用8世纪的明星图来提供有关地球轨道如何随着时间变化的信息。即使已经取代了基于数据集的结论,或者被证明是错误的(早期的天文观测在很大程度上是为了支持占星术的支持),数据本身仍然有用。

安德鲁·霍夫顿(Andrew Hufton),下一位发言人进一步采取了这个概念,并建议我们应该将数据的发布与分析分开。Hufton是科学数据,并且在谈论数据描述符的发布,该数据描述符允许研究人员发布数据集的描述,并通过提供与数据相关联的可提点对象来帮助这些研究人员获得认可以生成数据。

一天结束了一个小组讨论。多萝西·毕晓普(Dorothy Bishop)牛津大学,由医学研究委员会的乔恩·菲斯坦(Jon Fistein)主持艾莉森·米切尔(Alison Mitchell)来自Vitae,艾玛·甘利(Emma Ganley)PLOS生物学史蒂夫·莱万多夫斯基来自布里斯托尔大学(University of Bristol),他回答了听众的问题,并就研究中透明度的好处和潜在问题发表了看法。讨论的一些陷阱包括每个人都被数据淹没,邪恶的压力小组以一种误导性的方式樱桃挑选数据的可能性,尽管人们普遍认为这最后一个可以抵消,这是不够的理由,没有足够的理由不公开。

除了会议上的现场推文(#scidata16)外,还有现场漫画。Ludic Creatives的Royston Robertson生产了这个很棒的图片。他确实抓住了所有演讲者的要点,因此,如果您想要有关演讲的更多信息,那是一个很好的起点。

去年基因组生物学,米克·沃森问当“开放科学”将不再是不寻常的情况时,成为标准实践,而只是“科学”。这次高度刺激的会议的总体意见是,我们现在可能正在发生这种变化的风口。

查看有关生物学主页的最新帖子金博宝188

注释