国际大数据研究热点及前沿演化可视化分析精选.pdf

国际大数据研究热点及前沿演化可视化分析精选.pdf

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
国际大数据研究热点及前沿演化可视化分析精选

王宇灿,等:国际大数据研究热点及前沿演化可视化分析 283 效分析的能力 ,或需要使用重要的水平缩放技术 流处理工具及数据存储 、数据挖掘 、数据查询的 来实现高效处理的数据”[9]。在业界,影响最为深 技术 H等。除此之外,还有大数据平台研究 ]、 远的是全球著名信息公司IDC关于大数据特征的 大数据产业研究[16]、大数据应用研究 1【及大数据 “4V”理论,即volume(数据量大)、variety(数 在统计学领域影响研究 】【8]等。文献 [19]则是以国内 据多样性 )、velocity(数据流速大)和 value(价 的大数据相关研究为基础 ,分析国内的研究热点。 值密度低 ),并将大数据技术定义为 “通过高速捕 本文以定量研究为基础 ,将研究视角扩展到 捉、发现和 (或)分析 ,从大容量数据中获取价 国际上 ,以WoS数据库中三个核心期刊数据子库 值的一种新的技术架构” …。在此基础上,IBM 中的研究文献作为数据源,以共词分析为基础, 在 白皮书 《分析:大数据在现实世界中的应用 》 综合运用社会网络分析方法构建了国际大数据研 中重新定义并完善了 “4V”理论 ,将最后一个 “V” 究前沿及趋势的知识图谱 ,以期对国内的大数据 抛弃value之义,改而解释为Veracity(真实性 )lJ, 相关研究提供有益的参考和启示。 并认为在前三个 V“”涵盖了大数据的关键属性的 1 研究方法及数据来源 前提下 ,“真实性”是 目前企业在应用大数据时应 当着重考虑的问题 [1。综合以上各方观点,我们 1.1 共词分析与社交网络分析 可以概括出 “大数据”概念所包含的三个层次的内 共词分析隶属于内容分析法 ,其基本假设是 : 容,即数据一技术一应用 ,即对海量多源异构数 两个词在文献中共同出现的次数越多,那么两个 据进行分析处理的需求催生出相应的技术 ,进而 词的关系就越紧密 ,这两个词所涉及的相关研究 使得对信息价值的挖掘和应用成为可能。 领域的关系也就越紧密。而学术论文的关键词则 虽然大数据 已经成为学界关注的热点和焦 是由作者选择的最能反映论文研究内容的名词术 点,但是由于数据源及平台搭建难度和成本等原 语。因此,通过两两统计一组关键词在文献中共 因,目前业界对大数据的开发和应用走在了学界 同出现的次数 ,构建共现矩阵,并以此为基础对 的研究之前。而在 以企业为先导进行了一些简单 其进行聚类 、多维尺度等分析,将这些词按照其 但十分成功的大数据研发之后 ,下一阶段为大数 关系的紧密程度进行分类 ,就可以很好地揭示出 据的管理、分析和应用建立全面、有效 、系统的 该学科领域研究的结构 、热点与范式 。[2lJ。本 科学研究的重任则需要 由学界来承担l7】1。。实现这 文在分析大数据研究热点及前沿演化趋势中均使 一 目标的前提就是要全面把握 目前研究的现状及 用了共词分析方法,利用 Bibexcel工具抽取文献 前沿演化状况。当前已有的相关研究多是从定性 记 录的相关字段构建共词矩阵 ,再利用 Visual 的角度,关注大数据研究某些方向的研究现状。 Basic 自编程序基于共词矩阵计算 出相异矩阵后 例如 ,中国人民大学的覃雄派等从大数据背景下 导入 SPSS l9.0进行聚类分析 ,之后计算各类团 关系数据库与非关系数据库MapReduce的竞争与 的向心度及密度 ,构建战略坐标图,以探寻 目前 共生关系角度阐述二者的研究现状 引,浙江大学 国际大数据研究领域的研究热点领域。 的刘智慧等从大数据的概念 、一般处理流程和关

文档评论(0)

tazhiq2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档