大数据相关分析综述-计算机学报.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 卷 第 期 计 算 机 学 报 39 1               Vol.39 No.1 年 月 2016 1 CHINESEJOURNALOFCOMPUTERS Jan.2016   大数据相关分析综述 ) ),) ),) 1 1 2 1 3 梁吉业 冯晨娇 宋 鹏       1)(山西大学计算智能与中文信息处理教育部重点实验室 太原 030006)     2)(山西财经大学应用数学学院 太原 030006)     3)(山西大学经济与管理学院 太原 030006)     摘 要 大数据时代,相关分析因其具有可以快捷、高效地发现事物间内在关联的优势而受到广泛的关注,并有效     地应用于推荐系统、商业分析、公共管理、医疗诊断等领域 面向非线性、高维性等大数据的复杂特征,结合现有相 . 关分析方法的语义分析,文中从统计相关分析、互信息、矩阵计算、距离 个方面对大数据相关分析的现有研究成 4 果进行了梳理.在对统计学中的经典相关分析理论进行归纳、总结的基础上,文中从大规模数据的通用性和均等性 视角阐述了基于互信息的两个变量间非线性相关分析理论,从高维数据可计算的角度分析了基于矩阵计算的相关 系数,从非线性、高维性数据的复杂结构方面解析了基于距离的相关系数 进一步地,该文在对已有相关分析方法 . 进行分析与比较的基础上,围绕高维数据、多变量数据、大规模数据、增长性数据及其可计算方面探讨了大数据相 关分析的研究挑战. 关键词 大数据;相关分析;相关系数;信息熵   中图法分类号 号 / TP18 犇犗犐 10.11897SP.J.1016.2016.00001     犃犛狌狉狏犲狅狀犆狅狉狉犲犾犪狋犻狅狀犃狀犪犾狊犻狊狅犳犅犻犇犪狋犪 狔 狔 犵 ) ),) ),) 1 1 2 1 3 LIANGJiYe FENGChenJiao SONGPen    

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档