大数据领域演进路径研究热点与前沿可视化分析.docVIP

大数据领域演进路径研究热点与前沿可视化分析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据领域演进路径研究热点与前沿可视化分析

大数据领域演进路径研究热点与前沿可视化分析   [摘要]本文以Web of Science为数据源,运用信息可视化软件CiteSpaceⅢ对所搜集的有关大数据研究的文献进行聚类分析和共引分析。通过CiteSpaceⅢ生成的知识图谱并结合相关文献的研究内容,从演进路径、研究热点以及研究前沿三方面对大数据研究进行量化分析和解读。6篇关键节点文献很好地展示了大数据研究的演进路径,13个高频关键词和10个突现词表征了大数据的研究热点与研究前沿,得出结论:大数据的研究经历了从大数据的计算模型、具体概念、复杂性科学的理论研究到有关大数据社会科学层面、应用型实践层面研究的历程;大数据处理技术、大数据挖掘及大数据应用是大数据研究的三大热点;对大数据本身的研究、处理技术的研究、数据挖掘、系统、模型和网络的研究以及其绩效评估和数据管理的研究是大数据的研究前沿和发展趋势,文章旨在为现阶段大数据研究工作的深入开展提供参考。   [关键词]大数据;CiteSpaceⅢ;演进路径;研究热点;研究前沿;可视化   [中图分类号]G252   [文献标识码]A   [文章编号]1008-0821(2015)04-0046-06   大数据是当下继云计算之后的一大热点词汇。2011年5月,信息存储资讯科技公司EMC在“云计算相遇大数据”大会上正式提出了“大数据”的概念。几近同时,麦肯锡全球研究院(MCI)发布了一份研究报告《大数据:创新、竞争和生产力的下一个前沿领域》,它研究了文档和数字数据的状态以及处理这些数据所带来的潜在价值。2012年1月,在瑞士达沃斯举行的世界经济论坛上,“大数据”是主要讨论的主题之一,该论坛上发布了一份题为《大数据,大影响》的报告,提出“数据已成为一种新的经济资产类别,就像货币或黄金一样。”2012年3月,美国奥巴马政府在白宫网站上发布了《大数据研究和发展倡议》,该倡议涉及联邦政府的6个部门,这些部门承诺将投资超过两亿美元,来大力推动和改善大数据的提取、存储、分析、共享和可视化。   无论是EMC、MGI的研究报告,世界经济论坛的论题,还是美国政府的倡议,都向人们预示着大数据时代的来临。国内外对大数据的研究不断增加,该领域的研究文献量也与日俱增,大量的研究文献使得人们难以对大数据的知识进行深入地研究。信息可视化是常用的数据挖掘方法之一,它可以利用人类在可视化形势下对模型和结构的获取能力来解决科技文献数量过大、无法快速进行有效交流的问题,可视化数据挖掘可以观察、发现、筛选和理解信息,发现数据和信息背后所隐藏的含义。本文将运用信息可视化工具CiteSpaceⅢ,以Web of Science数据库中收录的有关大数据研究的文献为样本进行聚类分析和共引分析,对大数据的研究热点、主题内容和发展趋势三方面进行量化分析和解读。   1 数据来源和研究方法   Web of Science是美国Thomson Scientific(汤姆森科技信息集团)基于WEB开发的产品,是大型综合性、多学科、核心期刊引文索引数据库,收录了8000多种世界范围内最有影响力的、经过同行专家评审的高质量的期刊,以Web of Science为数据源进行研究,可以保证研究数据的全面性和权威性。本文选取了Web of Science数据库中的4个子库:Science Citation Index Expanded(SCI-EXPANDED)、Social Sciences Citation Index(SSCI)、Conference Proceedings Citation Index-Science(CPCI-S)和Conference Proceedings Citation Index-Social ScienceHumanities(CPCI-SSH),检索方式选择高级检索,检索策略为:主题=(“big data”),时间跨度=所有年份,共检索到有关大数据得研究文献记录1849条(检索日期:2014年10月12日)。   本文研究工具采用陈超美教授开发的信息可视化软件CiteSpaceⅢ,其独到的创新之处在于绘制的一幅科学知识图谱,能够显示一个学科或知识域在一定时期发展的趋势与动向,形成若干研究前沿领域的演进历程。将检索到的1849篇文献题录信息(主要包括篇名、关键词、摘要、作者、参考文献等字段)导入到CiteSpaceⅢ软件中。有关大数据研究的第一篇文献的发表于1993年,即所检索到的文献时间范围是1993-2014年,共计22年,以每2年设为1个时间分区(Time slicing),总共分为11个时间段;主题词来源(Term Source)选择标题(Title)、摘要(Abstract)、关键词(Author Keywords)和标识符(

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档