基于Apriori算法的数据挖掘系统设计.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Apriori算法的数据挖掘系统设计.doc

基于Apriori算法的数据挖掘系统设计   摘 要:近年来,网络的快速发展和普及,使人们真正进入到了信息时代。同样的,随之而来的就是人们面对这么一大堆信息如何检索的问题。人们面对这么一大堆数据资源,迫切的需要新的数据分析的方法,以便更快更智能的检索出自己需要的信息,将需要的信息转化成有用的知识,为我们的决策提供科学的支持。   关键词:Apriori算法;数据挖掘;系统设计   中图分类号:TP311   1 数据挖掘   目前人工智能和数据库领域研究的热点问题之一便是数据挖掘,英文称之为Datemining,国内学者也将其译为数据库的知识发现。数据挖掘简单来讲,就是从复杂的数据库中找到隐含的,也是先前不被众人所知的具有很大的隐含价值的信息的过程。数据挖掘主要基于机器学习、人工智能、模式识别、可视化、数据库、统计学等原理,是一种决策支持过程。他能够根据企业庞大的数据库,通过归纳分析,作出最理性的判断。并且能够从数据库中挖掘出潜在的客户信息,帮助企业家根据市场走向调整策略,规避风险。   2 数据挖掘项目计   MATLAB数学平台与数据挖掘系统有以下功能:   2.1 最优化   包括一些常用的最优化方法的程序实现,使一些实际问题分析求解的过程功能化,求解简一化,求解结果精确化。   2.2 数值计算   包括一些重要的典型算法的功能程序化、界面化,使一些大型的数据分析及功能运算模式化,机器化。   2.3 数据挖掘   包括一些重要的分类方法的程序实现,便于使用者对巨大的数据具有初步的处理和挖掘,为其科学决策提供支持。   3 数据挖掘系统设计思路   本系统的设计思路与其他系统开发的思路相同,采用模块化的思路来实现系统各个不同的功能,最后通过模块之间的耦合,来完成系统的整体开发。   本系统分为三个模块,在不同的模块下耦合了一些子模块:   3.1 最优化模块   加步长搜索法、对分法、Newton切线法、黄金分割法、抛物线插值法。   3.2 数值计算模块   (1)线性方程组直接解法:高斯消去法、LU分解法、QR分解法、反射矩阵法、旋转矩阵法。   (2)多项式函数插值法:多项式插值法、拉格朗日插值法、牛顿插值法、埃尔米特插值法、三次样条插值法。   (3)函数逼近:三角正交函数系逼近、勒让德正交多项式逼近、切比雪夫正交多项式逼近、埃尔米正交特多项式逼近。   (4)数值微分:变步长与外推加速技术法、变步长梯形法、牛顿――科茨法、高斯公式法、蒙特卡洛模拟求积法。   (5)数值积分:基于接格朗日多项式法、基于样条函数的求导法。   3.3 数据挖掘模块   (1)数据与处理:缺省值处理、噪声处理、数据集成、集度规约、数据变换。   (2)决策树:计算信息熵、C4.5方法、CART方法、SLIQ方法、SPRINT方法。   (3)分类挖掘:贝叶斯检测法、K―近邻方法。   (4)关联挖掘:Apriori算法。   (5)聚类挖掘:K-MEANS法。   4 系统设计流程   4.1 概要设计   首先,对系统设计要有一个总体上的规划,也就是系统的设计概要。系统的概要设计需要充分考虑软件的设计,包括如下方面:系统处理流程、数据的结构设计、系统的组织结构、接口设计、更能分配、模块儿划分、出错处理设计等,在以上充分考虑的基础上,作为软件设计的基础工作。   4.2 详细设计   软件系统的详细设计需要建立在系统概要设计的基础之上。软件的详细设计也就是在概要设计上丰富化,主要涉及到的内容有软件的主要算法、聚类的层次结构和调用关系以及数据结构等内容。设计者在软件详细设计时,为了进行编码和测试,应当充分考虑每一个子程序的设计。还要保证各个模块之间相互的协调,以保证对软件整体的支持。   4.3 编码   系统编码阶段,也是整个系统设计的核心阶段。为了实现软件各方面的功能,需要对目标系统的功能、界面和接口等方面进行调试。这个阶段要求设计者要有足够的耐心和细心,需要根据之前的详细设计,对数据结构、模块实现和算法等方面理解透,然后才可以进行具体的编写程序工作。   4.4 系统耦合   在编码的基础上,根据各个子系统的特性通过几口设计将各个模块藕合在一起,形成最原始的挖掘系统,在设计接口的过程中要做到高内聚低耦合,有利于下一步的系统测试及相关问题的解决。   4.5 系统调试   根据设计初衷,对系统各个功能进行测试,发现问题并解决问题,测试过程中要做到黑盒和白盒测试法的交互进行,相关程序编码人员辅助进行尽量做到用户界面友好性。在此过程中如发现一些与设计初衷有出入,权衡系统的健壮性与实用性,或修改设计方案,或作适当取舍。   5 部分模块算法分析

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档