GigaScience - 大型数据集的存储库

4

基因组学的最近爆炸技术已经彻底改变了生物学,但是只有当人们能够分析和使用结果序列时,才真正使用。存储如此大量的数据是有问题的,因为NCBI的未来不确定性序列阅读存档表演(SRA)。这BGI,与BioMed Central结合了最近推出刺激性,专门针对生成大量数据的项目,可以在描述它们的文章旁边容纳如此大的数据集。刺激性还预计将成为独立数据集(例如基因组测序项目产生的数据集)的存储库。一个这样的数据集刚刚发布,其中包含来自三种高粱菌株的组装和注释的基因组序列,这是发展中国家的巨大经济重要性,作为食品,饲料,燃料和纤维的来源。这描述这些数据的文章已发表在基因组生物学;原始阅读是可从SRA获得和组装的读物刺激性。这是第一次将基因组数据集引用为文章参考列表中的DOI,因此该过程的第一步是研究人员获得其生成数据的引用学分。

查看有关生物学主页的最新帖子金博宝188

4评论

Beatriz Fernandes

是否有很好地利用测序数据来进行教学/动机的例子?

托德的视觉

BMC和BGI值得一提的是,可以通过全球可分解的标识符访问此类数据集。但是,应该认识到,这不是DOI首次出现在参考列表中(实际上在地球科学中相对常见)。在参考列表中,数据集引用的外观也不会自动带来任何可发现性和书记量的声望作者可能会期望他们的文章被引用。因此,我不同意这只是“过程中的第一步,导致研究人员获得了他们生成的数据的引用学分。”

汉斯·菲芬伯格(Hans Pfeiffenberger)

这确实是一个令人印象深刻的发展,清楚地表明了如何期望数据为公众利益服务!

但是,要改进一个细节:
以前有完全参考数据集(与DOIS),例如:

Katharina Pahnke和Rainer Zahn,南半球水质量转换与北大西洋气候变异性有关,科学,2005年3月18日:307(5716),1741-1746。[doi:10.1126/science.11​​02163]

参考该数据集的37点:

Shackleton,NJ等。(2000年):北大西洋伊比利亚边缘的Sediment Core MD95-2042的Cibicidoides Wuellerstorfi的平均稳定碳同位素比。doi:10.1594/pangaea.58229

安德鲁·科斯格罗夫(Andrew Cosgrove)

@pfeiffenberger,@vision

感谢您提请我们注意这一点。显然,我们对地球科学中的实践并不那么熟悉。从其他领域学习总是很好。我确实是说第一个基因组数据集以这种方式引用。其他基因组已被分配了DOIS,但据我们所知,这是第一个在文章的参考列表中正式引用的基因组。

我已经相应地修改了博客文章。

评论被关闭。