附件叶艳鸣讲座课件-图书馆-天津职业技术师范大学.ppt

附件叶艳鸣讲座课件-图书馆-天津职业技术师范大学.ppt

大数据环境下的文献分析与利用 叶艳鸣 2013·10 ;一、几点认识;大数据的海啸——巨量信息;大数据的海啸;大数据时代的四个特征;苹果App Store应用商店每天下载4600万款应用 新浪微博用户每日发博量超过1亿条 百度每日处理的搜索量超过了50亿;国际数据公司(IDC)的研究结果表明: 2008年全球产生的数据量为0.49ZB 2009年的数据量为0.8ZB 2010年增长为1.2ZB 2011年的数量更是高达1.82ZB 相当于全球每人产生200GB以上的数据 而到2012年为止 人类生产的所有印刷材料的数据量是200PB 全人类历史上说过的所有话的数据量大约是5EB IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。;大数据时代的四个特征;各种结构化与非结构化数据;大数据时代的四个特征;基因组数据 地理空间数据 人口数据 经济运行数据 卫星遥感数据 ……;大数据时代的四个特征;气象数据 航天遥测遥控数据 交通流量数据 地震监测数据 ……;*;主要技术;基于文献的知识发现原理与技术;大数据的开发路径;知识发现进阶;二、“大数据”困局的破解之道;由《易经》想到的:;简易:万事万物都是非常简单的,大道至简 《周易·系辞上》: 易有太极,是生两仪,两仪生四象,四象生八卦 现代计算机之“0

文档评论(0)

1亿VIP精品文档

相关文档