- 5
- 0
- 约4.81万字
- 约 63页
- 2019-04-05 发布于上海
- 举报
摘要
移动企业是典型的数据密集行业,拥有海量的用户数据。随着移动服务普及 程度和需求程度的日益提高,移动企业的竞争也日趋激烈。企业在竞争中获胜的 关键在于如何充分的利用移动数据库中的历史数据,挖掘出隐藏在数据背后对企 业有价值有意义的知识,帮助企业制定精准化营销策略,使得企业在竞争中处于 优势地位。
本文首先研究了数据挖掘的相关技术、方法和数据挖掘的挖掘过程,着重对 关联规则经典算法 Apriori 算法进行了深入研究,针对 Apriori 算法的缺点和不足, 它需要频繁的扫描数据库和生成大量的候选项集,提出了一种有效的改进算法。 该算法通过减少行扫描数和候选项集的生成数量,从而大大提高算法的效率,实 验证明该算法的执行效率明显高于经典 Apriori 算法。
然后,针对传统数量型关联规则划分边界过硬等问题,本文基于模糊集理论
及其性质对边界进行软化,应用模糊 c-均值聚类算法把原始数值型属性转化为相 应隶属度值,有效的避免尖锐边界问题。并通过设定相应阈值,减少支持度的计 算量,有效的减少模糊关联规则挖掘的时间,提高模糊关联规则挖掘效率。
最后,结合青海移动的海量历史数据,依据数据挖掘 CRISP-DM 流程模型, 将改进的布尔型关联规则算法和模糊关联规则算法应用到青海移动 GPRS 业务数 据中,从而挖掘出客户特征和移动 GPRS 业务之间的关联关系。挖掘结果证明了 算法的可行性与实用性,并且对移动的营销和策划人员具有积极的指导作用。
关键词:关联规则 Apriori 算法 模糊集 移动业务
Abstract
Mobile Enterprises are typical data-intensive industries, which have mass user data. With the increased popularization and requirement of mobile services, the competitions of mobile enterprises are becoming fiercer. Meanwhile, the key role to excel in competitions is how to utilize the historical data in mobile database to mine the hidden knowledge, which are valuable and meaningful to help enterprises make accurate marketing strategy and consolidate their dominance.
In this paper, we focus on the following contributions:
First, we study the relevant techniques, methods and the procedure of data mining, especially for the classic Apriori algorithm. It needs to scan databases frequently and then generate a large amount of candidate itemsets. Aiming at the shortcomings and insufficiency of Apriori algorithm, an improvement algorithm is proposed to optimize it. The efficiency of the algorithm can be improved by reducing the times of scanning and controlling the generated candidate itemsets. The analysis and simulation results show the efficiency of the new algorithm is significantly higher than the classic Apriori algorithm.
Second, because the traditional quantitative association rules have the problems of boundary division hard, this paper based on fuzzy set theory and their properties to soft the border and adop
您可能关注的文档
- 广西地域美术资源在区内高中美术课程的应用研究-学科教学(美术)专业论文.docx
- 贵州省实验中学高中生物模拟实验教学研究-学科教学(生物)专业论文.docx
- 光泽县生态公益林可持续发展研究-林业专业论文.docx
- 广东省CBA球队技战术抗变性初步研究-体育教育训练学专业论文.docx
- 广州市民营企业产假政策执行情况研究-行政管理专业论文.docx
- 关于翻译语境类型的研究-外国语言学与应用语言学专业论文.docx
- 汉语“程度副词+名词”结构的语法转喻阐释-外国语言学与应用语言学专业论文.docx
- 哈尔滨市青年自组织发展问题研究-公共管理专业论文.docx
- 国电集团贵州火力发电企业竞争力提升的对策研究-工商管理专业论文.docx
- 关于亚纯函数正规族与唯一性的一些结果-数学;基础数学专业论文.docx
- 河北盐山中学等校2025-2026学年上学期高三一模化学试卷(含解析).docx
- 河北正定中学2025-2026学年高一上学期期末考试物理试卷(含解析).docx
- 河北张家口市怀安县2025-2026学年第一学期期末教学综合评价八年级地理试卷(含解析).docx
- 河南安阳市殷都区2025-2026学年第一学期期末教学质量检测七年级地理试卷(含解析).docx
- 河南安阳市滑县2025一2026学年第一学期期末学业质量监测八年级地理试题(含解析).docx
- 河南安阳市林州市2025-2026学年上学期期末考试高一政治试题(含解析).docx
- 河南焦作市武陟县第一中学2025-2026学年高一上学期1月月考语文试卷(含解析).docx
- 河南济源市2025-2026学年上学期期末学业质量调研七年级历史试卷(含解析).docx
- PICC导管并发症的紧急处理与护理.pptx
- 河南鹤壁市2025-2026学年高二上学期期末考试生物试题(含解析).docx
最近下载
- C-V2X与单车智能融合研究.pptx VIP
- 消防改造设计任务书.docx VIP
- 广东省佛山市顺德区2024-2025学年六年级下册期中考试语文试卷(有答案).pdf VIP
- 消防设计任务书.docx VIP
- 实施指南《GB12268-2012危险货物品名表》实施指南.pptx VIP
- 带电作业安全距离PPT课件.pptx VIP
- 林业成果图制作—林业专题图及制图(GIS制图技术).pptx
- 高中英语课件7开课名师-郭贝老师from page to screen.pdf VIP
- 丙种球蛋白被动免疫治疗原因不明性反复自然流产研究.pdf VIP
- (二模)南通市2025届高三第二次调研测试英语试卷(含标准答案).docx
原创力文档

文档评论(0)