- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据洪流下的医学信息服务
数据洪流下的医学信息服务
中国人民大学信息资源管理学院教授、博士生导师
周晓英
2013、7、31
内容概要
•1、数据洪流的到来
•2、大数据对科学界的影响
•3、信息科学和情报学的应对
•4 、大数据给医学信息服务的思考和启示
1、何谓数据洪流?
•数据洪流data deluge ,big data
•类似的说法:数据爆炸、大数据、海量数据、数
据海啸
•大数据(维基百科的定义):是指无法在一定时
间内用常规软件工具对其内容进行抓取、管理和
处理的数据集合
•大数据和小数据:基于大数据思维的科学和社会
数据的计数单位
数据容量扩大,数据集合的范围扩大
•字节(Byte ):基本存储单位
•千字节(KB ):1KB=1024B
•兆字节(MB ):1MB=1024KB
• 吉字节(GB ):1GB=1024MB
•太字节(TB ):1TB=1024GB (国会图书馆235TB )
•拍字节(PB ):……
•艾字节(EB ):……
•泽字节(ZB ):……
麦肯锡全球研究院的海量数据报告
•2011年5月,麦肯锡全球研究院,关注当前
社会数据洪流的报告“海量数据:创新、
竞争和生产率的下一个前沿”
•分析大数据集如何在现代社会中创造价值
和产生更大的潜力
数据量
•2010 年全球企业在磁盘上存储了超过7EB
的新数据
•消费者在个人电脑等设备上存储了超过6EB
的新数据,而1EB等于10亿GB,相当于美
国国会图书馆中存储数据的4000多倍。
麦肯锡《海量数据》报告的封面数据
• 600美金购买一个磁盘驱动器就能存储世界所有的音乐
• 2010年有50亿的移动电话在使用
• 每月有300亿条内容在Facebook上分享
• 全球数据每年40% 的预期增长,而全球IT花费只有5% 的增长
• 到2011年4月,被美国国会图书馆收集的数据达235TB (兆兆字
节)
• 美国17家机构中有15家,每家存储的数据量都超过美国国会图书
馆
Module und 8
Variations_E
1 观测型数据
• 来自于天文望远镜、人造卫星、传感设备、
测量仪器以及其他记录不可重复性现象数
据的设备
• 社会观测类数据(如人口调查数据)
4 参考型数据 • 很多情况下,产生这类数据的观测环境无
法再现
•来自资源库:如人类
基因数据库和全球蛋 2 实验型数据
白质资源数据库
•用于跨学科横向研究 研究型数据类型 •来自于大型实验设备(如粒
子加速器)的实验、医学临
如,全球经济和社会 床试验、生物实验、制药实
状态的交叉研究
验以及其他条件控制性实验
3 计算型数据 的实验结果、对人类和濒临
灭绝物种
文档评论(0)