- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘期末考试计算题及答案
题一:
一阶项目集 支持度 a 5 b 4 c 2 d 5 e 3 f 4 g 6
一阶频繁集 支持度 a 5 b 4 d 5 f 4 g 6
二阶候选集 支持度 3 ad 4 af 2 ag 5 bd 3 bf 1 bg 3 df 3 dg 4 fg 3
二阶 支持度 4 ag 5 dg 4
三阶候选集 支持度 4
三阶频繁集 支持度 4
题二
Distance(G,A)2=0.1; Distance(G,B)2=0.03; Distance(G,C)2=0.11
Distance(G,D)2=0.12; Distance(G,E)2=0.16; Distance(G,F)2=0.05
G的三个最近的邻居为B,F,A,因此G的分类为湖泊水
Distance(H,A)2=0.03; Distance(H,B)2=0.18; Distance(H,C)2=0.22
Distance(H,D)2=0.03; Distance(H,E)2=0.21; Distance(H,F)2=0.16
H的三个最近的邻居为A,D,F,因此H的分类为冰川水
题三
首先计算各属性的信息增益
Gain(Ca+浓度)=0
Gain(Mg+浓度)=0.185
Gain(Na+浓度)=0
Gain(Cl-浓度)=0.32
选择 Cl-浓度作为根节点
计算各属性的信息增益
Gain(Ca+浓度)=0
Gain(Mg+浓度)=0.45
Gain(Na+浓度)=0.24
选择Mg+浓度作为节点
计算各属性的信息增益
Gain(Ca+浓度)=0.24
Gain(Na+浓度)=0.91
题四
P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低 | 类型=冰川水)*P(冰川水)
=P(Ca+浓度=低 | 类型=冰川水)* P(Mg+浓度=高 | 类型=冰川水)* P(Na+浓度=高| 类型=冰川水)* P(Cl-浓度=低 | 类型=冰川水) *P(冰川水)
=0.5*0.75*0.5*0.5*0.5=0.0468
P(Ca+浓度=低,Mg+浓度=高,Na+浓度=高,Cl-浓度=低 | 类型=湖泊水)*P(湖泊水)
=P(Ca+浓度=低 | 类型=湖泊水)* P(Mg+浓度=高 | 类型=湖泊水)* P(Na+浓度=高| 类型=湖泊水)* P(Cl-浓度=低 | 类型=湖泊水) *P(湖泊水)
=0.5*0.25*0.5*1*0.5=0.03123
第一个样本为冰川水
P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高 | 类型=冰川水)*P(冰川水)
=P(Ca+浓度=高 | 类型=冰川水)* P(Mg+浓度=高 | 类型=冰川水)* P(Na+浓度=低| 类型=冰川水)* P(Cl-浓度=高 | 类型=冰川水) *P(冰川水)
=0.5*0.75*0.5*0.5*0.5=0.0468
P(Ca+浓度=高,Mg+浓度=高,Na+浓度=低,Cl-浓度=高 | 类型=湖泊水)*P(湖泊水)
=P(Ca+浓度=高 | 类型=湖泊水)* P(Mg+浓度=高 | 类型=湖泊水)* P(Na+浓度=低| 类型=湖泊水)* P(Cl-浓度=高 | 类型=湖泊水) *P(湖泊水)
=0.5*0.25*0.5*0*0.5=0
第二个样本为冰川水
题五
A,B,C,D,E,F,G之间的距离矩阵如下表
A B C D E F G A B 1 C D E F 1.5 G
根据距离矩阵建立的树如下
题六
第一次迭代以A,B作为平均点,对剩余的点根据到A、B的距离进行分配
{A,C,D,E,F,G,H}, {B}
计算两个簇的平均点
(6.5, 1.7), (4, 5)
第二次迭代,对剩余的点根据到平均点的距离进行分配,得到两个簇
{D,E,F,H}和{A,B,C,G}
计算两个簇的平均点
(9.1, 0.5), (3.25, 3.75)
第三次迭代,对剩余的点根据到平均点的距离进行分配,得到两个簇
{D,E,F,H}和{A,B,C,G}
由于所分配的簇没有发生变化,算法终止。
?
冰川水
Cl-浓度
高
低
Cl-浓度
冰川水
高
?
低
湖泊水
Mg+浓度
低
高
Cl-浓度
低
高
Mg+浓度
冰川水
低
高
低
湖泊水
Na+浓度
冰川水
湖泊水
高
B
C
D
A
E
F
G
您可能关注的文档
- 打造庐江完整新能源产业链,全年高增长确定.PDF
- 我市征迁再敲 重锤.PDF
- 执教人:贵溪市余家中学 周丽芳.PPT
- 护脑尧护眼尧节能的迪尔康直流护脑灯闪亮登场.PDF
- 报送城管问题,就能赢话费.PDF
- 拒绝谢师宴文明谢师恩.PDF
- 持续关连交易购销总合同.PDF
- 推拿理筋文凭COMTtechniqueDiploma.PDF
- 提供担保暨关联交易的核查意见.PDF
- 择校风有禁不止要问责政府.PDF
- 山西省百校联考2023-2024学年高二下学期7月期末考试英语试卷(不含音频,答案不全) - 原卷.pdf
- 甘肃省天水市张家川县2023-2024学年高二下学期6月联考历史试卷(含答案).pdf
- 成都市石室成飞中学2024-2025学年下期五月月考高2023级地理试卷.pdf
- 部编人教版八年级语文下册期末复习古诗 文言文理解性默写合集练习(含答案).pdf
- 上海市浦东新区浦东北2024-2025学年七年级下学期期末考试英语试卷(含答案,无听力原文及音频).pdf
- 西安市长安区第一中学2024-2025学年高一下学期第一次教学质量检测英语试卷(含答案,无听力原文及音频).pdf
- 哈尔滨市第九中学校2024-2025学年高一下学期6月考试英语试卷(含答案,无听力原文及音频).pdf
- 重庆市育才中学2025届高三全真模拟考试政治试卷.pdf
- 江西省南昌市第二十八中学教育集团2024-2025学年七年级下学期期中生物试题 (含答案).pdf
- 辽宁省朝阳市多校2024-2025学年高一下学期6月联合考试政治试卷(含答案).pdf
最近下载
- 浙江省杭州市八县区2023-2024学年八年级下学期期末考试道德与法治试卷(含答案).pdf VIP
- 串联盘式励磁磁力制热系统及其制热方法.pdf VIP
- 西安交通大学23春“法学”《科技法学》平时作业试题库附答案.docx VIP
- 2025最新消毒技能竞赛个人竞赛试题(+答案).docx VIP
- 2025年班组长综合管理技能竞赛理论考试题库500题(含答案).doc VIP
- 《高性能纳米保温材料》课件.ppt VIP
- 学龄前儿童感觉处理测量量表的汉化及信度与效度研究.PDF VIP
- 跨学科项目式学习背景下,人工智能在小学科学教育中的应用教学研究课题报告.docx
- 霍兰德职业兴趣测试量表及答案对照表.docx VIP
- 浙江省消防技术规范难点问题操作技术指南-2025修订稿(定稿).pdf VIP
文档评论(0)