- 3
- 0
- 约4.89万字
- 约 61页
- 2019-02-15 发布于上海
- 举报
分类号:
分类号: 学校代号:11845
UDC: 密级: 学 号:
广东工业大学硕士学位论文
(工学硕士)
基于OCAT逻辑方法的细精度关联规则挖掘 研究与应用
王彪
指导教师姓名、职称: 鎏路副数拯 学科(专业)或领域名称: 筮鲑王猩 学生所属学院: 让篡扭堂院
论文答辩日期: 2015—05—29
万方数据
Jltillltttlllllllf897
Jltillltttlllllllf
897
A Dissertation Submitted to Ouangdong University of Technology for the Degree of Master
(Master of Engineering Science)
Ba s ed on t he OCAT I og i C met hod of
f i Re‘__‘g r a i ned as soc i at i on r u I es m i n i ng
r e sea r ch and app I i cat i on
Candidate:Wang Biao Supervi sor:Liang Lu
May 2015
School of Computer Science and Technology Guangdong University of Technology Guangzhou,Guangdong,P.R.Chi na,5 1 0006
万方数据
摘要摘要
摘要
摘要
随着计算机技术的广泛使用,信息化如今已经渗透到每一个行业,企业在运营过 程中积累了大量的历史数据,与此同时,人们却面临着历史数据臃肿,有用信息匮乏 的窘境,如何充分利用这些海量数据并从中挖掘有效的信息对每个行业都是挑战。关 联规则挖掘是一种常用的分析数据属性之间相互作用能对事务产生何种影响的技术, 比如露点温度与空气湿度是怎样影响天气,降雨与否跟哪些因素有关等等,其相关性 分析结果在一定程度上有助于为企业提供决策支持,因此在各行业中被大量使用。常 见的关联规则挖掘方法具有描述简单、表达直观和结果可解释性强等优势,自提出以 来,众多学者的不断完善与改进,已经取得长足的发展和广泛的应用。然而在实际生 活生产需求中,现有的关联规则挖掘方法在处理关系型数据集时,通常以属性为粒度 求解属性之间的相关性,可能存在属性相关性不够精细的问题,从而无法剖析属性的 内在结构、内涵及隐藏的细粒度的相关规律。也就是说,如何提高算法的fme精度已 然成为了一个新的突破点。
基于此,本文尝试从逻辑学的角度出发,以期通过某种算法挖掘得到粒度更小的 关联规则,为关联规则挖掘提供一个新的角度。本文的具体实现是首先基于领域特征 从逻辑学角度提出用某种二进制编码的方法对属性进行分解得到属性片段,由于常规 的关联规则挖掘方法并不能处理粒度更小的的属性片段,因此我们采用了基于逻辑 OCAT(One Clause At ATime)方法。OCAT方法要求数据集能且只能被分为两类,并 且只适合处理二进制化的数据集,因此需要将上述属性片段构造正负样本训练集E+和 E.。OCAT方法得到关联规则的过程即是集合覆盖的过程,它每次得到当前最优的子式, 该子式能接受E+中所有样本,但是尽可能多地拒绝E.中的样本,当所有子式合取得到 的合取范式能接受所有E+中的样本,并且接受所有E.中的负样本的时候,算法结束, 此时得到的合取范式即为关联规则的表达式。
为了验证方法的有效性,文中将该方法应用在电信客户流失预测和气象领域中的 降雨预测。不同领域的数据集的特点不一样,因此OCAT逻辑方法在应用到具体领域 时的需要结合数据集的具体情况,比如,文中用于电信客户流失预测的数据集聚类的 个数比较多,因此较少的二进制位来表示各个类;而用于降雨预测的数据集聚类个数 比较少,因此可以根据二进制数的每一位变化来表示各个类。实验结果表明,基于这
万方数据
广东工业大学硕士学位论文种方法产生的关联规则粒度减小,提高了关联规则的fme精度,从而更直观,同时关
广东工业大学硕士学位论文
种方法产生的关联规则粒度减小,提高了关联规则的fme精度,从而更直观,同时关 联规则是合取范式形式,易于实施并行计算以提高效率,能很好地满足海量数据挖掘 的需求。
关键词: 关联规则挖掘;逻辑方法;OCAT;fme精度
H
万方数据
ABSTRACTABSTRACT
ABSTRACT
ABSTRACT
With the wide use of computer technology,all walks of life has entered the information age,enterprise accumulated a large amount o
您可能关注的文档
- 基于OBB层次包围盒树的实时碰撞检测算法-计算机应用技术专业论文.docx
- 基于OBB碰撞检测及其算法改进研究-计算机应用技术专业论文.docx
- 基于OBD-Ⅱ的便携式汽车故障检测仪研究-机械制造及其自动化专业论文.docx
- 基于OBd-Ⅱ的通信控制与应用开发-电子与通信工程专业论文.docx
- 基于OBDA的尺寸极限与配合知识库系统研究-计算机应用技术专业论文.docx
- 基于OBDD的符号Petri网分析与FMS调度算法研究-计算机应用技术专业论文.docx
- 基于OBDD的描述逻辑推理算法研究-计算机应用技术专业论文.docx
- 基于OBDD的描述逻辑循环术语集推理算法研究-计算机应用技术专业论文.docx
- 基于OBD的汽车数据通信研究与应用-电路与系统专业论文.docx
- 基于ObjectARX2000的船舶结构CAD研究-工程力学专业论文.docx
- 基于OCC模型的文本情感识别方法的研究-计算机应用技术专业论文.docx
- 基于OCF2OPF映射模型的地理信息服务语义检索研究-电子与通信工程专业论文.docx
- 基于OCL的产品配置引擎研究与实现-计算机应用技术专业论文.docx
- 基于OCM的康泰公司项目群管理研究-工商管理专业论文.docx
- 基于OCP-IP协议的片上网络接口设计-电路与系统专业论文.docx
- 基于OCQ 方法的企业文化建设效果测量-工商管理专业论文.docx
- 基于OCQ量表的行政组织文化测量研究-行政管理专业论文.docx
- 基于OCR的纸币冠字号识别及硬件仿真-测试计量技术及仪器专业论文.docx
- 基于OCSVM和主动学习的DDOS攻击分布式检测系统-计算机软件与理论专业论文.docx
最近下载
- 2025-2026学年小学科学五年级下册教科版(2024)教学设计合集.docx
- 2025年电信笔试——企业文化.pdf VIP
- (2026春新版)苏教版二年级数学下册《第3单元 两位数乘、除以一位数》PPT课件.pptx
- 公路窄幅钢箱组合梁桥设计与施工技术指南.pdf VIP
- 11-ZJ401楼梯栏杆(中南-4).pdf VIP
- 一起做家务 课件 2025北师大版数学一年级下册.pptx
- 中华人民共和国城镇建设行业标准-臭氧发生器.PDF VIP
- 实习协议(模板).docx VIP
- 2023年青岛港湾职业技术学院单招数学考试试题及答案解析.docx VIP
- KS焊线机培训教材.pdf VIP
原创力文档

文档评论(0)