- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据发掘技术中鉴于关系规则算法的研究
数据发掘技术中鉴于关系规则算法的研究
PAGE / NUMPAGES
数据发掘技术中鉴于关系规则算法的研究
数据发掘技术中鉴于关系规则算法的研究
纲要 数据发掘的主要目的在于能够从大型的数据库中发掘出对用户有价值的信息,以便为决议者地决议供给实用的数据依照本文对数据发掘技术的观点和内容做出了描绘,同时也对鉴于关系规则的数据发掘技术进行比较全面的归纳和剖析,并提出解决相应问题的鉴于关系规则发掘算法。
要点词 数据发掘;关系规则;算法
中图分类号 TP392 文件表记码 A 文章编号 1674-6708
2011) 45-0223-03
1 概括
1.1 课题的研究背景
现代计算机科学技术发展的历史,同时也是数据和信息
加工手段不停更新和改良的历史。跟着计算机硬件和软件不
断的发展,特别是数据库技术与应用的宽泛推行,摆在人们
眼前的问题出现了,这些急剧膨胀的信息数据,怎样有效利
用这一丰富数据大海的宝藏为人类服务,也已成为广大信息
技术工作者所要点关注的焦点之一。
传统的采集数据技术能够在必定程度上对采集来的数
据信息进行统计剖析,能够获取必定的数据价值,这类传统
的采集数据技术拥有必定的成效,但当这类方法在面对海量
的数据并从中进行数据剖析时,却没有一个比较好的解决方
案。不论是数据的统计、数据的查问、数据的报表等这些传
统的数据办理方式都是对采集来的数据简单的进行办理,而
不可以对这些数据内部所隐含的价值信息进行有效的提取和
剖析。在这些大批数据的背后隐蔽了好多拥有决议意义的信
息,怎样获取这些能够为我们供给决议依照的数据依照已经
成为目前的一个热点的研究方向。
1.2 研究目的和意义
数据发掘技术是面向应用型的。目前,在好多重要的领
域,数据发掘都能够发挥踊跃促使的作用, 特别是在如保险、交通、零售、银行、电信等商业应用领域。数据发掘能够帮
助用户解决很多典型的商业性的问题,此中包含:数据库营销、客户集体区分、背景剖析、交错销售等市场剖析行为,以及客户流失性剖析、客户信誉评分、欺骗发现等等。
数据发掘技术已经宽泛的在公司市场的营销中获取了应用,它以市场营销学的市场细分原理为基础,经过对波及到花费者花费行为的信息进行采集、加工和办理,得出结论以确立目标花费者地兴趣、花费偏向、习惯以及花费需求,进而能够推出目标花费者下一步的花费方向,而后以得出来的结论为基础,对目标花费者和花费集体进行定向的营销,这与传统的盲目营销的方式对比,能够在很大程度上节俭因营销而产生的开销,能够提升营销的成功率,进而能够为企
业带来更大的收益,也能够帮助公司建立起好的口碑。
数据发掘技术的理论基础
2.1 数据发掘技术概括
数据发掘的定义是能够从大批、有噪声、模糊、随机、
不完整、实质应用数据中提拿出隐含在此中的,又不为人们
所知的,同时拥有潜伏价值的知识和信息的过程,又被称为
从数据库中的知识发现。数据发掘不一样于传统的数据剖析,
二者有着实质的差别,数据发掘是在没有明确假定的前提下
去发掘信息、发现知识。经过发掘所获取的信息应当拥有未
知、有效和适用等 3 个特点。整个 KDD 往常会有若干个挖
掘的步骤构成,往常,数据发掘是此中最重要的一个步骤。
往常状况来讲,数据发掘与知识发现这两个观点很简单被人们所混杂,其主要原由是它们有相像性以及共同点,而且究其表面信息来讲,仿佛一模一样。可是就其实质来讲,二者是有明显不一样的 [1] 。
2.2 数据发掘的任务
数据发掘的任务主若是关系剖析、聚类剖析、分类、预
测、误差剖析和时序模式。
关系剖析
关系规则发掘是由 2 个或 2 个以上变量来取值的。这些
变量之间若是存在着某种关系,就能够称这些变量之间互相
关系。数据的关系在数据库中能够把分为简单、时序和因果
的关系,同时也是目前对数据关系的一个热点的研究方向。
聚类剖析
聚类剖析就是把数据按其相像性进行分类,分为不一样的
类型,同一类型中的数据是相像的,不一样类中的数据是不相
同的。经过聚类剖析我们能够发现数据的散布模式,经过数
据的散布模式找出可能的数据属性之间的关系。
分类
分类就是在数据的剖析过程中找到一个分类的观点,然
后对这个分类的观点进行详尽的概括,不一样的分类代表不一样
类型数据的信息,并用对这类分类的详尽定义来结构相应的
模型,这类结构的模型一般用决议树的模式或许规则模式进
行详尽的描绘。
展望剖析
展望就是希望经过对数据的系统剖析,以找到数据变化
的趋向和发展的规律,并依照这类趋向和发展的规律成立对
应的数学模型,而后用这类数学模型对数据的将来走势和发
展进行对应的展望。对展望结果关怀的是展望的正确度,这
个正确度往常能够用展望的方差进行胸怀。
误差剖析
在对误差的剖析过程中能够用到好多的知识,而数
文档评论(0)