中新社北京12月20日电 (记者 张素)记者20日从中国科学院北京基因组研究所获悉,该所生命与健康大数据中心(BIGD)建成的生物组学数据库首次获得国际认可。
BIGD团队近日在国际学术期刊《核酸研究》上发表研究论文《北京基因组研究所生命与健康大数据中心:从存储到整合、再到转化》,这是中国首次以数据中心的模式,整体发布中国生物组学数据资源的建设情况。
论文作者之一、中科院北京基因组研究所研究员章张解释,“组学”是指将基因、蛋白及代谢物等生物分子,以整体为单位进行系统性研究。相较于以个体为单位的研究,组学最主要特征是大数据。
“搭建组学数据库,实现海量信息的存储、整合及共享成为一项重要任务。”章张说,目前在国际上被认可的生物组学数据中心主要有三家,分别是美国国立生物技术信息中心、欧洲生物信息研究所和日本DNA数据库,“要想在国际期刊发表论文,需要先将自己的原始数据提交到这三个官方指定的数据库”。
专家指出,中国的生物组学数据产量约占全球的40%,却没有能够被国际认可的数据库系统。中国科学研究已受到数据提交效率低、数据下载受限制等不利影响。
章张说,BIGD初步形成中国生命与健康数据汇交与共享平台,具备可服务于全球的基因组数据共享网络。具体来看,中心有基于高通量测序的原始组学数据归档库、基于中国人群以及国家重要物种群体的基因组变异数据库等多层次生物组学数据资源系统。
据介绍,目前《美国国家科学院院刊》《细胞研究》等国际核心期刊已经认可把数据提交到BIGD。该团队表示,将继续面向中国人口健康和社会可持续发展的重大战略需求,建立海量生物组学大数据储存、整合与挖掘分析研究体系。
看浙江新闻,关注浙江在线微信
凡注有"浙江在线"或电头为"浙江在线"的稿件,均为浙江在线独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"浙江在线",并保留"浙江在线"的电头。