- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3)Overfitting(过适合)
* 3) Overfitting(过适合) 4. 其他属性选择标准: the gain criterion tends to favor attributes with many values. A be an attribute with values A1, A2, ... Av A be an attribute formed from A by splitting one of the values into two. gain(A) = gain(A) “信息增益比” 表2.1 – 褐 淡黄 矮 8 – 褐 黑 高 7 – 兰 黑 高 6 – 兰 黑 矮 5 – 褐 淡黄 高 4 + 兰 红 高 3 + 兰 淡黄 高 2 + 兰 淡黄 矮 1 类别 眼睛 头发 高度 例子号 [头发=淡黄∨红色][眼睛=蓝色] → + [头发=黑色] ∨[眼睛=褐色] → – 第三章 规则学习算法 1. 基本概念: 定义1 (例子). 设E=D1×D2 ×… ×Dn 是n维有穷向量空间,其中 Dj是有穷离散符号集。E中的元素e=(V1,V2, …,Vn)简记为Vj叫做例子。其中Vj∈Dj。 例如:对表2.1 D1={高,矮};D2={淡黄,红,黑};D3={兰,褐} E=D1 × D2 × D3 例子 e=(矮,淡黄,兰) 定义2。选择子是形为[xj=Aj]的关系语句,其中xj为第j个属性,Aj ? Dj; 公式(或项)是选择子的合取式,即 [xj=Aj], 其中 J ? {1, …,n}; 规则是公式的析取式,即 ,其中Li为公式。 一个例子e=V1, …Vn满足选择子[xj=Aj]当且仅当Vj是Aj的元素,即Vj? Aj; e满足一个公式当且仅当它满足该公式的每一个选择子;e满足一条规则当且仅当e满足该规则的至少一个公式。 例子满足选择子(公式、规则)也称做选择子(公式、规则)覆盖该例子。 例如: 例子e=矮,淡黄,兰 满足选择子[头发=淡黄∨红色]和 [眼睛=蓝色] ;满足公式[头发=淡黄∨红色] [眼睛=蓝色] 。 定义3:普化(generalize) :减少规则的约束,使其覆盖更多的训练例子叫普化。 定义4:特化(specialize) : 增加规则的约束,使其覆盖训练例子较少叫特化。 定义5:一致:只覆盖正例不覆盖反例的规则被称为是一致的。 定义6:完备:覆盖所有正例的规则被称为是完备的。 2. GS算法: GS算法 输入: 例子集; 输出: 规则; 原则: (a) 从所有属性中选出覆盖正例最多的属性; (b) 在覆盖正例数相同的情况下,优先选择只覆盖正例不覆盖反例的属性值; 设PE,NE是正例,反例的集合。 PE’,NE’是临时正,反例集。CPX表示公式,F表示规则(概念描述)。 F←true; PE’ ←PE, NE’ ←NE, CPX←true; 按上述(a) (b)两规则选出一个属性值V 0 , 设V 0 为第j0个属性的取值,建立选择子[Xj0=V0]并加入公式中,CPX←CPX∧ [Xj0=V0] 如果[Xj0=V0]覆盖NE’中的反例,转(5); 否则 F←F∨CPX, 转(6); (5) 重新构造PE’和NE’, PE’含有原来PE’中被[Xj0=V0]覆盖的例子,NE’含有原来NE’中被[Xj0=V0]覆盖的例子,转(3); (6) PE←PE\PE’,如果PE= ,停止,否则转(2); GS算法举例: 例子集见表2.3 学习结果: [ESR=normal][Ausculation=bublelike] [X-ray=spot][ESR=normal] 3.AQ算法: 普化(generalize) : 特化(specialize) : 一致 完备 肺炎 Normal fasts flack mediu low 5 Dry-peep Fast Spot slight absent 4 Normal Normal Strip slight low 3 核 Dry-peep Fast Hole heavy high 2 肺结 Normal Normal Strip slight absent 1 Bubblelike Normal Flack slight mediu 5 Bubblelike Normal Flack mediu high 4 Dry-peep Normal Spot slight low 3 Bubblelike Normal Flack heavy mediu 2 肺炎 Bubblelike Normal Flack heavy h
您可能关注的文档
- 2014年度辽宁省社会科学规划.doc
- 2014年浙江大学软件学院卓越工程师计划创新基地项目.doc
- 2014年铅市场评述与2015年展望.PDF
- 2015年北京外国语大学翻译硕士MTI考研真题,考研参考书.pdf
- 2015年口腔执业助理医师考点:呕血的体格检查最新考试试题库(完整版).docx
- 2015年北京第二外国语学院俄语语言文学考研真题,考研参考书,考研经验,复试分数线.pdf
- 2015年外交学院外交学考研《权力制度文化》复习方略.pdf
- 2015年度中国中铁五四红旗团委、五四红旗团支部、优秀团.doc
- 2016北京远见育成.PDF
- 2016届高考地理一轮总复习提升练习:人类与地理环境的协调发展.doc
文档评论(0)