- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
内蒙
内蒙古科技大学硕士学位论文
独 创 性 说 明
本人郑重声明:所呈交的论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得内蒙 古科技大学或其他教育机构的学位或证书所使用过的材料。与我一同工 作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示 了谢意。
签名: 日期:
关于学位论文使用授权的说明
本人完全了解内蒙古科技大学有关保留、使用学位论文(纸质版和 电子版)的规定,即:本人唯一指定研究生院有权保留送交学位论文在 学校相关部门存档,允许论文在校内被查阅和借阅,可以采用影印、缩 印或其他复制手段保存论文。在论文作者同意的情况下,研究生院可以 转授权第三方使用查阅该论文。
(保密的论文在解密后应遵循此规定)
签名: 导师签名: 日期:
- 1 -
I
I
摘 要
随着数据收集工具的广泛应用,海量数据的收集和积累导致“数据爆炸”,已经 超出了人们理解和掌握的能力,传统的数据分析方法已不能满足需求,数据挖掘和知 识发现技术应运而生并得到广泛应用。关联规则挖掘是数据挖掘研究的一个重要分 支,用于发现存在于数据库中的属性集之间有趣的关系。量化关联规则挖掘是关联规 则挖掘的一个重要研究课题,由于其在商业、生产等诸多领域的广泛应用,越来越受 到数据挖掘界的重视与关注。
本文在对关联规则挖掘研究的背景下,仔细分析了现如今国内外对量化关联规则 挖掘研究的现状以及所采用的挖掘方法,在此基础上展开了对基于数据场的量化关联 规则挖掘的研究工作。首先,介绍了数据挖掘技术的基本概念、挖掘对象、挖掘任务、 基本过程和分类,然后介绍了关联规则的一些基本理论、概念、挖掘关联规则的基本 步骤,重点研究了经典的关联规则的挖掘算法 Apriori 算法和其在挖掘量化关联规则 中所存在的问题。在此基础上,通过运用数据场的思想,并结合数据场中数据之间所 呈现出来的特性,提出了基于数据场的量化关联规则,该方法较以往的量化关联规则 挖掘方法有以下几点改进:第一,在对数据集挖掘量化关联规则时,先将数据集中的 每个数据都映射为数据场中的一个具有一定数据能量的数据点,每个数据点独立地向 周围辐射并接收其他数据辐射过来的能量,以体现不同数据对数据挖掘任务的不同作 用;第二,聚类部分,对量化属性进行整体聚类,使得聚类得到的属性区间簇更加合 理;第三,在选择聚类算法时,结合数据场的特性,分析了 K-均值聚类算法的优缺 点,扬长补短,从而提高聚类的效果;第四,在计算支持度和置信度时,将每个数据 对数据挖掘任务的不同作用体现出来,从而使得计算出来的支持度和置信度对规则的 描述更合理。
算法使用 Microsoft Visual Studio 2008 开发工具编程实现,为了验证该算法 的有效性,分别通过对 Iris 数据集、身体脂肪 bodyfat 数据集以及临床医学数据进 行量化关联规则的挖掘分析,挖掘得到的量化关联规则与实际相关领域的知识相一 致。
关键字:数据挖掘;量化关联规则;聚类分析;数据场
II
II
Abstract
With the wide application of data collection tools, collection and accumulation of massive data made it explodes, and it is beyond the ability of people to understand and master. The traditional data analysis methods can’t meet the needs, so the data mining technology came into being, and it is widely used. Association rule mining is an important branch of data mining research for discovering interesting relations between the set of properties that exist in the database. Mining quantitative association rules is an important research topic in association rules mining. It is more and more attended and concerned by the data mining community, because of its widely applicati
您可能关注的文档
- 基于平稳位置置乱与密钥反馈机制的图像加密算法-信息安全专业论文.docx
- 基于内外网结构的电子政务系统的设计与实现-计算机应用技术专业论文.docx
- 基于无模型自适应的烧结终点控制系统的研究-控制科学与工程专业论文.docx
- 基于数字基带预失真和Doherty技术的HPA系统构建-测试计量技术及仪器专业论文.docx
- 基于区域划分策略的动态实时路径导航研究-计算机科学与技术专业论文.docx
- 基于颜色和纹理特征的图像检索技术研究-计算机应用技术专业论文.docx
- 基于剖面的山东省龙泉站金矿矿体三维模型的建立与应用-摄影测量与遥感专业论文.docx
- 基于视频分析的自动门防夹系统研究-控制科学与工程专业论文.docx
- 基于拓扑变换的模糊推理分析-电力电子与电力传动专业论文.docx
- 基于内容的音频检索的研究与实现-信息与通信工程专业论文.docx
- 基于时间特性的网络结构推荐-计算机软件与理论专业论文.docx
- 基于遗传算法的海洋地震拖缆控制研究-轮机工程专业论文.docx
- 基于人工免疫理论的动态异常检测方法研究-计算机技术专业论文.docx
- 基于无线传感器网络的楼宇监控平台设计与实现-通信与信息系统专业论文.docx
- 基于视觉心理学理论的空气调节系统与家居卧室环境的和逸性研究-设计艺术学专业论文.docx
- 基于遗传算法的排课问题研究及其应用-计算机软件与理论专业论文.docx
- 基于无线网络的人脸识别门禁系统的研究与实现-计算机技术专业论文.docx
- 基于遗传禁忌算法的网络信息过滤模型研究-计算机软件与理论专业论文.docx
- 基于网络的信息技术教师专业发展共同体分析-教育技术学专业论文.docx
- 基于随机森林法和几何哈希法的流水线目标匹配研究-控制工程专业论文.docx
文档评论(0)