- 6
- 0
- 约1.77千字
- 约 2页
- 2017-08-15 发布于安徽
- 举报
The298th ScienceConference
Xiangshan 香山科学会议第298次学术讨论会
中国生物信息学技术平台及其数据共享支持体系
李亦学赵国屏
国家在“九五、“十五和“十一五”期间,在863、973计划、国家自然科学基金
重大项目以及自筹资金支持下,投入数十亿元人民币积极介入了大量同际合作、国内合作
的高通量生命科学数据获取计划。如人类基因组研究计划,水稻基因组研究计划,黑猩猩
基因组研究计划,人类基因单体型图谱研究计划,家蚕基因组研究计划,微生物基因组合
源基因组研究计划等等,如果一基因组测序相关数据的规模是完整基因组大小乘以一千,
那么国内产出的基因组相关科学数据如果包括最原始的基础数据,数据规模已经高达
100TB,分别散布在北京、上海的基因组研究院所和研究中心以及一些国家重点实验室里。
此外,上世纪末以来,国内许多单位,如北京大学、清华大学、华中科技大学,复旦
大学,交通大学,中山大学,中科院生物物理所,中科院微生物所,中科院水生所,中科
院上海生命科学研究院系统生物学重点实验室,国家人类基因组南方和北方研究中心,上
海生物信息技术研究中心,军事医学科学院,国家疾病预防控制中心,南方医科大学,南
方和北方国家生物芯片工程中心等,已经分别建立了近百个二级、专家和特色生物学数据
库,数据量达到和超过2TB。目前这些基础生命科学数据90%以上主要分布在北京和上海
两地,其他10%分布在全国其它地方。这些数据的质量是可靠的,但是相当大的部分需要
进一步的加工和清理和管理,以提高使用的共享性、可靠性和使用效率。
此外,上海市地方政府已于2003年12月启动了上海科学数据共享系统的建设,通过
两年来的努力,上海已有一大批科学数据纳入到上海研发公共服务平台为用户提供共享服
务,涵盖基因组、蛋白质组、基因表达谱、蛋白质核酸序列、结构数据,中医药数据、化
学结构和小分子化学特性、质谱图谱等100多个大大小小的自有科学数据库、二级数据库
和数据集,总共有超过195个科学数据库提供在线的检索服务,超过50个数据库建设项
目正在实施中。上海科学数据共享系统可基本实现以上所有牛命科学数据查询、访问和部
分下载、委托数据查询、定题检索、数据库建设服务、委托数据分析加工服务、数据产品
定购服务、咨询服务、科学数据资源调查等功能。此外,由我国自主测序的日本血吸虫基
因组工作框架图的基础数据于2006年5月16日通过上海科学数据共享系统的生物信息和
科学数据共享服务平台——E海生命科学与生物技术数据中心向全世界公布。发布了共计
The298th ScienceConference 香山科学会议第298次学术讨论会
Xiangshan
生物信息中心提交大规模基因组序列数据并向全世界发布,第一次向世界显示我国科学数
据共享技术平台已经具有汇交、集成和发布大规模基因组数据的能力,具有十分重要的意
义。
在国际镜像资源建设方面,目前,国内几个大的单位的生物信息中心,如北京大学生
物信息中心,中科院微生物所网络信息中心,上海生物信息技术研究中心都分别建立了美
的链接、镜像和备份,还建立了欧洲蛋白质科学数据库Uniprot,蛋白质结构数据库PDB,
生物学和医学文献数据库PubMed的镜像和数据备份,并且做到了定时更新,总数量已经
达到了4TB以上,并且建立了相应的软硬件服务支撑体系。这些镜像数据库的建立,极
大地普及了国际公共数据库在中国的使用率,极大地方便了国内用户的国际公共数据的获
取和使用,极大地方便了国内众多实验室和研究机构的数据分析以及挖掘工作的开展,切
切实实地为我国生物学研究、生物技术研发和临床医学应用研究的发展做出了重要的贡
献,为我国研究机构充分利用国际公开数据资源做出了不可磨灭的重要贡献。
57
您可能关注的文档
最近下载
- 部编版语文五年级下册第二单元教材解读大单元集体备课.pptx VIP
- 部编版语文五年级下册第一单元教材解读大单元集体备课.pptx VIP
- 车工 (数控车床)理论知识考核要素细目表四级.pdf VIP
- 本科课程《基础护理学》教案,第十二章给药.doc VIP
- 农村题材小品剧本村官.pdf VIP
- 小品剧本-小品《绰号》.docx VIP
- 小品剧本-小品《竞选》.docx VIP
- 本科课程基础护理学教给药教案(2025—2026学年).docx VIP
- LaserjetCP1025系列打印机打印质量故障排除手册.pdf VIP
- 年会小品剧本小品剧本:搞笑小品剧本《都是喝酒惹事》台词大全.docx VIP
原创力文档

文档评论(0)