星期三, 05/10/2017
目前,组学数据正以前所未有的速度产生。 这提出了许多新的挑战,包括如何寻找合适的方法来连接相关联的组学数据集、为分布在多个独立数据资源库的数据集提供集中的检索和访问入口等等。举例来说,为给定蛋白质组学研究查找来自其它组学的补充数据集,可能是一个挑战。 在我们看来,一个专门的、整合多组学数据集的发现索引是非常重要的。类似于面向科学文献的PubMed,一个面向多组学数据集的发现索引资源将能在组学数据集的有效利用上发挥重要作用。

组学发现索引Omics Discovery Index(OmicsDI, http://omicsdi.org)正是在这样的背景下诞生,目前它已能为研究人员提供来自15个生物组学数据库的80,000多个数据集的访问服务。

今天Nature Biotechnology在线发布了OmicsDI,该文的合作者来自四个大洲, 其中两位来自国家蛋白质科学中心·北京的研究人员为该项目作出了关键贡献,他们分别是署名通讯作者的分子系统课题组PI Henning Hermjakob 和署名共同第一作者的白明泽副教授。OmicsDI旨在成为一个综合的、PubMed风格的多组学数据集发现索引。 除了元数据搜索外,它还提供数据集使用度量、跟踪数据重用,并开发了新的相似性计算方法为研究人员推荐与当前数据集有关的、感兴趣的数据集。 OmicsDI将会提高公开数据集的可见性、影响力和重用性,从而使数据生产者也能与用户一样从中获益。