- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库原理、设计的与应用第6章
第6章现代数据挖掘技术与发展 ;现代数据挖掘技术与发展 ;6.1知识挖掘系统的体系结构 ;
;1.知识发现系统管理器
控制并管理整个知识发现过程
2.知识库和商业分析员
知识库包含了源于各方面的知识。商业分析员要按一种有效的方式指导关注信息的发现。
3.数据仓库的数据库接口
知识发现系统的数据库接口可以直接与数据仓库通信。
4.数据选择
确定从数据仓库中需要抽取的数据及数据结构
5.知识发现引擎
将知识库中的抽取算法提供给数据选择构件抽取的数据
6.发现评价
有助于商业分析员筛选模式,选出那些关注性的信息
7.发现描述
发现、评价并辅助商业分析员在知识库中保存关注性发现结果以备将来引用,并保持知识发现与管理人员的通信。 ;6.2现代挖掘技术及应用 ; 2.关联规则的应用目标
置信度或正确率可以定义为:
?
(6.5)
?
覆盖率可以定义为
“兴趣度”为目标的关联规则; 3.关联规则的算法
Apriori算法
1.找出所有支持度大于最小支持度的项集,这些项集称为频集,包含k个项的频集称为k-项集。
2.使用第1步找到的频集产生所期望的规则。
Apriori算法的第1步采用了递归方法,算法表示为
L1={large 1-itemsets};//产生频繁1项集L1
for (k=2;Lk-1≠○;k++) do //循环产生频繁2项集L2直到某个r使Lr为空
begin
Ck=apriori-gen(Lk-1);//产生k-项集的候选集
for all transactions t∈D do
begin
Ct=subset(Ck,t);//事务t中包含的候选集
for all candidates c∈Ct do
c.count++;
end
Lk={c∈Ck|c.count≥minsup}
end
Answer=UkLk;第2步算法较为简单。如果只考虑规则的右边只有一项的情况,给定一个频集Y=I1,I2,I3,…,Ik,k≥2,Ij∈I,那么只有包含集合{ I1,I2,I3,…,Ik}中的项的规则最多有k条。这种规则形如I1,I2,I3,…Ii-1,Ii+1…,Ik→Ii,。这些规则置信度必须大于用户给定的最小置信度。
;数据库D;4.关联规则的应用;6.2.2 神经网络型现代挖掘技术 ;6.2.2 神经网络型现代挖掘技术 ;6.2.2 神经网络型现代挖掘技术 ;6.2.2 神经网络型现代挖掘技术 ;6.2.3 遗传算法型现代挖掘技术 ;6.2.3 遗传算法型现代挖掘技术 ;6.2.3 遗传算法型现代挖掘技术 ;6.2.3 遗传算法型现代挖??技术 ;6.2.3 遗传算法型现代挖掘技术 ;6.2.4 粗糙集型现代挖掘技术;6.2.4 粗糙集型现代挖掘技术;6.2.5 决策树型现代挖掘技术;6.2.5 决策树型现代挖掘技术;6.2.5 决策树型现代挖掘技术;6.2.5 决策树型现代挖掘技术;6.2.5 决策树型现代挖掘技术;6.2.5 决策树型现代挖掘技术;6.3知识发现工具与应用;6.3知识发现工具与应用;6.3知识发现工具与应用;6.3知识发现工具与应用;6.4数据挖掘技术的发展;6.4数据挖掘技术的发展;6.4数据挖掘技术的发展;6.4数据挖掘技术的发展;6.4数据挖掘技术的发展;6.4数据挖掘技术的发展;练 习 ;练 习 ;练 习
您可能关注的文档
- 执业医师资格考试伦的理试题.doc
- 扩展语句压缩语段学的案.doc
- 执医-卫人网精讲-医的学伦理学.doc
- 扬州大学2010年博士的研究生招生专业目录.doc
- 技术创新的理论与方的法——最全的答案.doc
- 技术创新的理论与方的法考试题库.doc
- 扫描1920-1080项目返慕案及注意事项.doc
- 把南京大学建设成为的我国 核天体物理学 研究.ppt
- 抑郁性精神障碍1103的16法医系.ppt
- 抑郁障碍的诊治及特的殊情况的处理.ppt
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)