20090307113曹晨《数据挖掘》期末大作业.pdfVIP

20090307113曹晨《数据挖掘》期末大作业.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘原理、算法及应用 学 号:20120311145 学生所在学院:信息工程学院 学 生 姓 名 : 颜 伟 泰 任 课 教 师 : 汤 亮 教师所在学院:信息工程学院 2015 年 12 月 12 年级 决策树分类算法 颜 伟 泰 12 软件( 1)班 一、 摘要 一) 、决策树算法简介: 决策树算法是一种归纳分类算法 , 它通过对训练集的学 ( 习 , 挖掘出有用的规则 , 用于对新集进行预测。 决策树算法可设计成具有良好可伸 缩性的算法 , 能够很好地与超大型数据库结合 , 处理相关的多种数据类型 , 并且 , 其运算结果容易被人理解 , 其分类模式容易转化成分类规则。 (二)、算法思想: 该算法的基本思想是:首先找出所有的频集,这些项集出现 的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规 则必须满足最小支持度和最小可信度。然后使用第 1 步找到的频集产生期望的规 则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采 用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小 可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。 三)、算法运用领域: ( (1)Apriori 算法广泛应用于商业中,应用于消费市场价格分析中,它能够很快 的求出各种产品之间的价格关系和它们之间的影响。通过数据挖掘,市场商人可 以瞄准目标客户,采用个人股票行市、最新信息、特殊的市场推广活动或其他一 些特殊的信息手段,从而极大地减少广告预算和增加收入。百货商场、超市和一 些老字型大小的零售店也在进行数据挖掘,以便猜测这些年来顾客的消费习惯。 (2 )Apriori 算法应用于网络安全领域,比如时候入侵检测技术中。早期中大 型的电脑系统中都收集审计信息来建立跟踪档,这些审计跟踪的目的多是为了性 能测试或计费,因此对攻击检测提供的有用信息比较少。它通过模式的学习和训 练可以发现网络用户的异常行为模式。 采用作用度的 Apriori 算法削弱了 Apriori 算法的挖掘结果规则,是网络入侵检测系统可以快速的发现用户的行为模式,能 够快速的锁定攻击者,提高了基于关联规则的入侵检测系统的检测性。 (3)Apriori 算法应用于高校管理中。随着高校贫困生人数的不断增加,学校 管理部门资助工作难度也越加增大。针对这一现象,提出一种基于数据挖掘算法 的解决方法。将关联规则的 Apriori 算法应用到贫困助学体系中,并且针对经典 Apriori 挖掘算法存在的不足进行改进,先将事务数据库映射为一个布尔矩阵, 用一种逐层递增的思想来动态的分配内存进行存储,再利用向量求 与 运算,寻 找频繁项集。实验结果表明,改进后的 Apriori 算法在运行效率上有了很大的提 升,挖掘出的规则也可以有效地辅助学校管理部门有针对性的开展贫困助学工作。

文档评论(0)

拉拉链 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档