- 12
- 0
- 约4.22千字
- 约 18页
- 2021-11-16 发布于上海
- 举报
精品文档
一、 考虑表中二元分类问题的训练样本集
1. 整个训练样本集关于类属性的熵是多少?
2. 关于这些训练集中 a1,a2 的信息增益是多少?
3. 对于连续属性 a3,计算所有可能的划分的信息增益。
4. 根据信息增益, a1,a2,a3 哪个是最佳划分 ?
5. 根据分类错误率, a1,a2 哪具最佳?
6. 根据 gini 指标, a1,a2 哪个最佳?
答 1.
P(+) = 4 / 9 and P(- ) = 5 / 9
- 4/9 log 2 (4/9) - 5/9 log 2 (5/9) = 0 .9911 .
精品文档
精品文档
答 2 :
(估计不考)
精品文档
精品文档
您可能关注的文档
最近下载
- 我的快乐寒假生活PPT主题班会课件.pptx VIP
- 2025年福建省中考数学试题(含标准答案及解析).pdf
- 毕业论文设计《碟式分离机设计》.doc VIP
- 二级注册计量师计量法律法规及综合知识(计量综合知识)模拟试卷10.doc VIP
- Think1 Unit3 知识清单及作业单.pdf VIP
- 规范《GB5085.3-1996-危险废物鉴别标准浸出毒性鉴别》.pdf VIP
- 含特殊药品复方制剂培训教材.ppt VIP
- 改革开放以来浙江省基层团建工作的发展.pdf VIP
- (高清版)DG∕TJ 08-2183-2015 城市道路养护维修作业安全技术规程.docx VIP
- IEC60335家用和类似用途电器的安全通用要求-1.pdf VIP
原创力文档

文档评论(0)