数据洪流下的医学信息服务-万方数据库.PDF

数据洪流下的医学信息服务-万方数据库

数据洪流下的医学信息服务 中国人民大学信息资源管理学院教授、博士生导师 周晓英 2013、7、31 内容概要 •1、数据洪流的到来 •2、大数据对科学界的影响 •3、信息科学和情报学的应对 •4 、大数据给医学信息服务的思考和启示 1、何谓数据洪流? •数据洪流data deluge ,big data •类似的说法:数据爆炸、大数据、海量数据、数 据海啸 •大数据(维基百科的定义):是指无法在一定时 间内用常规软件工具对其内容进行抓取、管理和 处理的数据集合 •大数据和小数据:基于大数据思维的科学和社会 数据的计数单位 数据容量扩大,数据集合的范围扩大 •字节(Byte ):基本存储单位 •千字节(KB ):1KB=1024B •兆字节(MB ):1MB=1024KB • 吉字节(GB ):1GB=1024MB •太字节(TB ):1TB=1024GB (国会图书馆235TB ) •拍字节(PB ):…… •艾字节(EB ):…… •泽字节(ZB ):…… 麦肯锡全球研究院的海量数据报告 •2011年5月,麦肯锡全球研究院,关注当前 社会数据洪流的报告“海量数据:创新、 竞争和生产率的下一个前沿” •分析大数据集如何在现代社会中创造价值 和产生更大的潜力 数据量 •2010 年全球企业在磁盘上存储了超过7EB 的新数据 •消费者在个人电脑等设备上存储了超过6EB 的新数据,而1EB等于10亿GB,相当于美 国国会图书馆中存储数据的4000多倍。 麦肯锡《海量数据》报告的封面数据 • 600美金购买一个磁盘驱动器就能存储世界所有的音乐 • 2010年有50亿的移动电话在使用 • 每月有300亿条内容在Facebook上分享 • 全球数据每年40% 的预期增长,而全球IT花费只有5% 的增长 • 到2011年4月,被美国国会图书馆收集的数据达235TB (兆兆字 节) • 美国17家机构中有15家,每家存储的数据量都超过美国国会图书 馆 Module und 8 Variations_E 1 观测型数据 • 来自于天文望远镜、人造卫星、传感设备、 测量仪器以及其他记录不可重复性现象数 据的设备 • 社会观测类数据(如人口调查数据) 4 参考型数据 • 很多情况下,产生这类数据的观测环境无 法再现 •来自资源库:如人类 基因数据库和全球蛋 2 实验型数据 白质资源数据库 •用于跨学科横向研究 研究型数据类型 •来自于大型实验设备(如粒 子加速器)的实验、医学临 如,全球经济和社会 床试验、生物实验、制药实 状态的交叉研究 验以及其他条件控制性实验 3 计算型数据 的实验结果、对人类和濒临 灭绝物

文档评论(0)

1亿VIP精品文档

相关文档