基于大数据订餐系统中偏相关分析技术应用研究.docVIP

基于大数据订餐系统中偏相关分析技术应用研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大数据订餐系统中偏相关分析技术应用研究

基于大数据订餐系统中偏相关分析技术应用研究   摘 要:阐述了大数据时代数据挖掘的重要意义,介绍了大数据挖掘的一般常用方法,分析了相关系数与偏相关系数的计算过程,提出了偏相关技术在大数据挖掘中的应用,通过大学城学生订餐系统证明了偏相关技术在大数据挖掘中更能体现客观性、准确性。   关键词:大数据;订餐系统;偏相关分析技术   中图分类号:TP3-05 文献标识码:A   Application of Ordering Meal System Partial Correlation   Analysis Technique Based on the Big Data   LI Zhiyuan   (Jiangsu College of Finance Accounting,Lianyungang 222061,China)   Abstract:Significance of the era of big data mining are described in this paper.Introduces the data mining,and the commonly used methods,analyzes the calculation process of the correlation coefficient and partial correlation coefficient,proposed the partial correlation technique in data mining application,through the University City students ordering system prove the partial related technologies in data mining can reflect the objectivity and accuracy.   Keywords:big data;ordering system;partial correlation analysis technique   1 引言(Introduction)   当前社会已经进入大数据时代,各种信息都可能产生海量数据,分析大数据蕴含的规律的过程和方法称为数据挖掘,数据挖掘可理解为资料探勘、数据采矿,它是对包含海量信息的数据库进行知识发现的一个过程与步骤。数据挖掘的传统方法有许多种,偏相关方法在数据挖掘中的应用可以更好地体现挖掘结果的客观性与准确性[1]。   2 大数据挖掘的常用方法(Common methods for   big data mining)   大数据的挖掘涉及众多学科,各种算法层出不穷,目前比较经典的数据挖掘算法有:决策树算法(C4.5算法):使用信息增益率进行决策树的构造,能够把连续性的信息数据转变为离散的值,对不完整信息数据进行处理。聚类算法(K-Means算法):基本思想是先选择一组对象作为聚类中心,然后以这些对象为标准,进行相似度分配,要求各聚类内部最大限度紧凑,而聚类之间最大限度的离散。向量机算法(SVM算法):核心思想就是要找出一个最好的分类线或面,使之相邻的样本中其最远。关联算法(Apriori算法):通过支持度和置信度二个量进行工作,通过频繁项集减少算法的复杂度,另外还有分类回归树算法(CART算法)、最大期望算法(EM算法)、迭代算法(AdaBoos算法)、朴素贝叶斯算法(NB算法)、最近算法(KNN算法)、佩奇算法(PageRank算法)等。不同算法在大数据挖掘中各有侧重点,根据用户需求选择适合的算法技术[2]。   3 偏相关分析技术的算法过程(Algorithm process   of partial correlation technique)   偏相关技术也称为“净相关技术”,是指当二个变量同时与第三个变量有关系时,将第三个变量的影响去除,只计算二个变量之间相关程度的方法[3]。偏相关技术在分析某二个因素的相关程度时,固定其他因素,可以得出更客观准确的结果。偏相关技术的核心指标是偏相关系数。偏相关系数剔除其他因素的影响下,计算某二个因素之间的相关程度系数,其绝对值的大小,反映了这二个因素之间相关程度的高低。   3.1 相关系数   假设有三个相互影响的因素,且之间的相关系数分别用表示。   可以得出,任意二个因素XY之间的相关系数可表示为[4]:   3.2 偏相关系数   同样,假设有三个相互影响的因素,用表示不变时的偏相关系数,表示不变时的偏相关系数,表示不变时的偏相关系数。   可以得出,当有q个因素时,q阶偏相关系数可表示为[5]:   4 偏相关分析技术在订餐系统

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档