网站大量收购独家精品文档,联系QQ:2885784924

基于单元的孤立点算法研究及客户忠诚度分析系统构建-计算机软件与理论专业论文.docxVIP

基于单元的孤立点算法研究及客户忠诚度分析系统构建-计算机软件与理论专业论文.docx

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
、s2272 、s2272 7 摘要 摘要 数据挖掘技术是从.卜个世纪80年代开始发展起来的一门新技术,其主要的目的 就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在 其中的、人们事先不知道的、但又是潜在有用的信息和知识。而孤立点分析是数据挖 掘中的重要研究方面之一,其作用就是发现数据中的“小模式”,即数据集中显著不 同于其它数据的对象。经过近20年的发展,数据挖掘技术在理论研究上日趋成熟, 正不断的扩展其应用范围,当前数据挖掘已用于电信、金融、商业、气象预报、DNA、 股票市场、入侵检测和客户分类等许多领域。因此,本文首先研究了基于单元的孤立 点发现算法,指出了其存在的缺点,并予以改进;其次,采用该算法并结合其它数据 挖掘技术,针对企业中的客户忠诚度分析问题构建了客户忠诚度分析系统,最后,根 据海尔客户关系数据,分析了海尔集团的客户忠诚度。 第一, 阐述了课题的研究背景及其重要的研究意义:从数据挖掘的理论研究 和应用研究方面,对当前数据挖掘的国内与国外的研究动态进行分析;通过列知识发 现一般过程的分析,给出了一个典型的数据挖掘系统的整体架构,分析了各模块的主 要功能,并对其中采用的数据挖掘的技术作了详细阐述。 第二, 回顾了孤立点发现的研究过程及当前研究动态,介绍了基于距离、基 于密度、基于偏离以及商维数据孤立点发现中的主要算法,具体分析了各个算法的主 要内容,在此基础上总结比较了各个算法的优劣及其适用范围。 第三, 在基于单元的孤立点发现算法的基础上,提出了一种减少边缘影响的 孤立点分析算法。针对算法中边界处孤立点的误判问题,给出了数据空间的单元格划 分及数据对象分配方法,定义了数据集边界阈值动态调整函数,提出了基于单元的孤 立点挖掘算法的改进算法,在不增加原有算法时间复杂度的前提下,极大地减少了边 界处孤立点的误判。并通过实际应用证明了算法的有效性,最终,将该算法用于彩色 人脸边缘提取中,取得了极好的应用结果。 第四, 完成了客户忠诚度分析系统。首先给出了客户忠诚度的概念,说明了 研究客户忠诚度对企业的重要意义;介绍了系统的主要功能:数据预处理、重点客户 发现以及客户忠诚类别划分;详细分析了数据预处理模块所采用的预处理手段和方 法;给出重点客户发现和客户忠诚类别划分模块中所采用数据挖掘技术(孤立点分析、 聚类分析、分类预测分析),对相应技术中所采用的算法进行了详细的描述;最后介 绍了用于结果显示的结果可视化模块中的两种方法:平行坐标和分类图表。 第五, 通过客户忠诚度分析系统,对海尔公司的客户忠诚度进行了分析。主 摘要要针对海尔公司的客户忠诚度分析问题,详细阐述了选取和处理客户忠诚度分析数据 摘要 要针对海尔公司的客户忠诚度分析问题,详细阐述了选取和处理客户忠诚度分析数据 的过程及方法,分析了海尔公司中重点客户发现过程及结果,并结合不同的参数,对 其结果给出了详细的分析比较,归纳得出了参数变化对重点客户发现的影响规律;此 外。还运用聚类分析手段,得出了海尔客户数据中的大致类别,并从这些类别中选取 合适的数据对象组成训练集,采用神经网络预测算法给出了海尔客户关系数据的最终 的忠诚类别。从而证明了客户忠诚度分析系统的实用性。 最后,对本文的工作进行了总结和对研究前景的展望。 关键词:知识发现;数据挖掘:孤立点;预测;分类;聚类;客户忠诚度;模糊;神 经网络;数据预处理;数据离散化;数据可视化;平行坐标;分类图表 摘要一————————————————————————————————————————÷————_———————_——_——————————--———————●—————一—————-—●一 摘要 一————————————————————————————————————————÷————_———————_——_——————————--———————●—————一—————-—●一 Abstract Data Mining is a new technique developed from 1980s.It aims to extract the implicit, previously mffmown,and potentially useful knowledge from voluminous,non—complete, fuzzy,stochastic data.Outliers analysis is a important part of data mining research.Its purpose is to find the“small patterns”from dataset.An outlier is an object that is considerably

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档