412
0
详细信息
中科院北京基因组研究所(BIG)查询简介
中科院北京基因组研究所(BIG)国家基因组科学数据中心于2019年6月经科技部、财政部通知公布,由中国科学院北京基因组研究所(国家生物信息中心)作为依托单位,联合中国科学院生物物理研究所和中国科学院上海营养与健康研究所共同建设。中心面向我国人口健康和社会可持续发展的重大战略需求,建立生命与健康大数据汇交存储、安全管理、开放共享与整合挖掘研究体系,研发大数据前沿交叉与转化应用的新方法和新技术,建设支撑我国生命科学发展、国际领先的基因组科学数据中心。
2022年,NGDC持续更新和完善核心数据库资源(GSA、GWH、GVM、GEN、MethBank、LncBook、RCoV19等),并开发了多个全新数据库,进一步拓展了涵盖基础组学、国家人类遗传、重要战略生物、病毒等资源信息库以及生物信息在线分析工具等在内的多组学数据资源体系。NGDC提供一站式数据递交和中英文服务,发布的数据编号被全球主要出版集团认可。截至2022年12月底,组学原始数据管理体系(GSA Family)已支持各类科技项目10,900多个,汇交数据量超19PB,相关数据已发表在475种国内外期刊的2000多篇文章,为国家基因组科学数据的汇交共享、安全管理和挖掘利用提供了重要支撑。数据库建设整体情况以“Database resources of the National Genomics Data Center, China National Center for Bioinformation in 2023”为题在Nucleic Acids Research 在线发表。
2022年5月,在国际核酸序列数据库联盟(INSDC)的支持和美国国家生物信息技术中心(NCBI)的技术协助下,NGDC完成NCBI生物项目管理数据库(BioProject)、生物样本管理数据库(BioSample)全部数据及序列片段归档库(Sequence Read Archive,SRA)全部元数据与自主开发数据库的整合,实现了上述数据在NGDC网站的一站式检索与访问,极大提升了国内科研人员查询和获取数据的效率。国家基因组科学数据中心不断加强高性能计算与存储能力建设,目前拥有266万亿次/秒的计算能力,约8300个计算核心,39PB的存储资源(其中在线存储资源23PB,离线备份存储16PB),1.6Gbps网络带宽,形成了国内领先的生物大数据云计算平台。
随机推荐