表观基因组数据的开放共享指南:作者q+a

表观基因组数据的公开共享对于确保大规模数据密集型研究的发展至关重要。一篇新意见文章最近出版基因组生物学旨在使研究人员更轻松地共享此类数据。在这里,第一作者斯蒂芬妮·戴克(Stephanie Dyke)回答了有关这项工作的问题。

为什么对社区如此重要的表观基因组(或基因组)数据的公开共享?

没有它,将损失数百万小时和花费的研究。研究人员将不得不生产新数据,否则这些数据将已经可用,从而减慢了科学的整体进展。

它也有效,因为它允许不直接参与研究和潜在重新利用数据以解决其他研究问题的科学家进行审查。它还可能鼓励更多的研究人员参与基因组学/表观基因组学的大科学。

此类开放数据中涉及哪些问题?

主要问题与科学竞争以及对研究贡献数据的研究参与者的保护有关。我们的研究重点是后者:如何以不同的方式共享数据,影响研究参与者的隐私和福利?

表观基因组数据提出了有关反歧视保护和知情同意的严重问题。由于最常有任何行动方案的研究参与者存在风险和好处,因此挑战是仔细评估和平衡这些挑战。

您的研究表现出什么?

我们的研究表明,许多表观基因组数据可以公开共享。We quantified the amount of non-Cpg可以从目前正在产生的最详细的甲基化数据中推断出的DNA序列信息。

我们的研究表明,许多表观基因组数据可以公开共享。

结果表明,大多数可以合理地从开放式数据集中删除,以减少从匿名参与者重新识别研究数据的风险。

我们还评估了由于数据重新识别而可能导致的危害,特别是由于对带有样本提供的健康和人口统计数据的隐私丢失而造成的危害。因此,我们为开放式释放提供指导,以减少潜在的有害后果。

目前,此类型的数据正在使用哪些准则,您建议哪些新指南?

老实说,该领域没有任何确定的准则。尚未以与我们是成员的国际人类表观基因组联盟所产生的相当的规模生成的表观基因组数据。这就是为什么我们决定进行这项研究的原因。

基于我们的研究(我们希望这可以为社区准则的发展提供信息),我们建议过滤已知的直接单核苷酸多态性对甲基化数据的影响,以及一些人口统计学和罕见的疾病信息,这些信息带来了更大的风险。该数据仍应共享,但具有其他保护。

查看有关生物学主页的最新帖子金博宝188

注释