- 1、本文档共53页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
天津工业大学
硕士学位论文
基于多最小支持度的关联规则研究
姓名:赵林莉
申请学位级别:硕士
专业:计算机技术
指导教师:尹绍宏;刘录增
201111
摘
?
???
??,
??锄???????????.???
出舰????锄????????
??
?
印?????甿
?
?
?
???
??阨???毽岫???,?????毹???
?????????沁?琣
?
印???絜
??.???.?,? ??
??
?
????蒬 ?????瓵????
???
?巴玜 ??
??????
?
?
?????,???辒 ??
???? ???
???????
?????
???
?
?????
?
第一章绪论
随着计算机网络应用和数据库应用的普及和近几十年相关技术的不断发展,
技术由此应运而生。
关联规则挖掘是数据挖掘中一个重要的研究领域,也是数据挖掘中最活跃的
基本思想是找出频繁项集,由频繁项集产生强关联规则。
??????????????
???????????????
???????舶?龋?饧钢炙惴ǖ氖?荻际欠植嫉摹;?贏???
类的串行算法有采用分块挖掘的????算法口’、采用动态??和剪枝策略的
提出的采用基于前缀的待价类技术和自底向上搜索策略的??惴╪训、采用基
于前缀的等价类技术和混合搜索策略的眦??算法、采用团的等价类技术和
自底向上搜索策略的??吣算法等。增量挖掘算法有参数增量算法和数据增量
算法,参数增量算法主要有??蚉????菰隽克惴ㄖ饕S蠪?、??和
????萵???匾回妗R陨纤惴ň?峭诰虿???衅捣毕預?。
算法相比较,不产生候选集,在挖掘效率上有了数量级的提高,在性能上获得了
??论文的结构
蔓二兰堑堡
于矩阵的多最小支持度关联规则挖掘算法和基于无向图的多最小支持度关联规
天津工业大学硕士学位论文
从上个世纪?年代开始,在不到半个世纪的时间里,数据库技术得到迅猛
发展,数据库管理系统得到广泛应用,人们收集、存储、加工数据的能力越来越
强,随着数据量的急剧增大,人们积累的数据越来越多,而这些数据背后隐藏大
最有用的信息。“数据富有但知识贫乏’’,面对过量信息,如何挖掘出有用知识,
如何利用这些信息为人类服务成为人们急需解决的问题。
目前人们对于数据的分析和使用更多的是采用传统的数据分析工具,如:录
入、查询、统计等,这些分析方法都是在用户提出明确假设的前提下进行的。但
有些蕴含在数据的知识是人们未曾预料到的,是用直觉感知不到的,数据挖掘技
术是解决这一问题的最佳工具。利用数据库技术来存储管理数据,利用机器学习
的方法来分析数据,从而挖掘出大量的隐藏在数据背后的知识,这些思想的结合
最终形成了备受人们关注的研究领域:数据库中的知识发现?????
?????肈??嬲?,??,其中,数据挖掘技术便是?貲中的一个最为关
键的环节。数据挖掘是?世纪?年代末开始逐步发展超来的一个新的研究领域,
它是多个学科和技术相结合的产物,包括机器学习统计、数据库、人工智能、信
息检索和可视化。
??数据挖掘概念
受、可以理解并且可以利用的,它们只需满足特定的用户需求。
天津工业大学硕士学位论文
??数据挖掘功能
测性挖掘任务对当前数据进行推断,以做出预测。数据挖掘的主要任务有概念描
图??数据挖掘过程示意图
天津工业大学硕士学位论文
这一阶段的工作主要包括数据选择、数据预处理和数据转换。
数据选择的目的就是确定数据挖掘任务所涉及的目标数据,要从相关数据源
这一阶段要根据挖掘任务定义选择数据挖掘实施算法,如分类、聚类、关联
??数据挖掘应用及发展
目前,数据挖掘的研究非常热门,应用也极其广泛,在金融服务、市场营销、
科学研究、电信业、体育界、医学及因特网的筛选均可见数据挖掘的应用。在市
场营销方面,企业通过收集客户信息和销售记录,运用数据挖掘技术可以了解不
同类型用户对企业产品的兴趣,从而制作有针对性的营销策略和促销策略。零售
业通过对销售记录分析可以总结出哪些商品经常被顾客一同购买,这有利于零售
厂商制定销售策略。银行业根据客户基本信息和信贷信息,可以对账户进行归类,
可以制定出信用评估规则。在体育界,????喔銮蚨佣疾捎昧薎?公司
提供的数据挖掘工具对场上数据进行分析,为教练制定技战术提供依据。电信业
通过采用数据挖掘技术可以制定故障分析系统。针对网站的数据挖掘对于优化网
第二章数据挖掘
综上所述,数据挖掘已渗透到社会各领域之中,其前景非常广阔,国内外许
多研究机构均在进行数据挖掘产品的研究,今后研究的焦点可能集中在网络环境
下数据挖掘技术的实现;可视化方法的研究,以便用户能更好地理解知识发现的
过程,更好地
您可能关注的文档
- 基于單片机的车载数字音乐播放系统的设计.doc
- 基于電化学方法检测工作场所气体颗粒物中重金属的研究.doc
- 基于電化学噪声技术的X70钢点蚀初期行为研究.doc
- 基于電网脆弱性和经济性的PMU最优配置研究.doc
- 基于方案區分度的组合赋权优化研究.doc
- 基于訪问控制技术的部队装备仓库管理系统研究.doc
- 基于非單调性效用函数之均值——方差模型的构建与分析.doc
- 基于非正規LDPC码的协作通信系统的性能研究.doc
- 基于分位數回归的股指期货风险度量研究.doc
- 基于風险控制视角的SD航空公司安全管理系统建设研究.doc
- 注册验船师高频真题题库2025.docx
- 注册验船师高频题库带解析2025.docx
- 注册验船师考试必备资料2025.docx
- 注册验船师精选题库带分析2025.docx
- 注册验船师考前冲刺必刷题附答案2025.docx
- 新高考生物二轮复习讲练测第10讲 人体的稳态与免疫调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第13讲 生物技术与工程(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第9讲 神经调节与体液调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第7讲 遗传的基本规律与伴性遗传(检测)(原卷版) .docx
- 新高考生物二轮复习讲练测第13讲 生物技术与工程(检测)(原卷版).docx
文档评论(0)