- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
还可以表达的知识有 大三角{x1,x2,x5}∩{x1,x2}={x1,x2} 蓝色的小的圆形{x5,x7,x8}∩{x3,x4,x7}∩{x3,x4,x6,x7}={x7} 蓝色的或者中的积木{x5,x7,x8}∪{x6,x8}={x5,x6,x7,x8}。 所有的这些能够用交、并表示的概念以及加上上面的三个基本知识(A/R1,A/R2,A/R3)一起就构成了一个知识系统: R=R1∩R2∩R3 它所决定的所有知识是A/R={{x1,x2},,,,,,}以及A/R中集合的并。 假设给定了一个A上的子集合X={x2,x5,x7} 用我们的知识库中的知识应该怎样描述它呢? 红色的三角? ****的大圆? ...都不是 “蓝色的大方块或者蓝色的小圆形”这个概念:{x5,x7}作为X的下近似。 选择“三角形或者蓝色的”{x1,x2,x5,x7,x8}作为它的上近似。 {x2,x5,x7} {x5,x7} {x1,x2,x5,x7,x8} “稳定”的集合 {x1,x2,x5} “不稳定”的集合 {x3,x4,x6,x7,x8} 是否所有的基本知识:颜色、形状、大小都是必要的? 他们的上下近似都是一样。 去掉“颜色”属性? 知识系统变成A/(R-R1)={{x1,x2},{x3,x4,x7},,,}以及这些子集的并集。 如果用这个新的知识系统表达“稳定”概念得到上下近似仍旧都是:{x1,x2,x5},“不稳定”概念的上下近似也还是{x3,x4,x6,x7,x8} ,所以说颜色属性是多余的可以删除。 去掉“大小”属性呢? 知识系统变成A/(R-R1-R3)=A/R2={{x1,x2},{x5,x8},{x3,x4,x6,x7}}。 同样考虑“稳定”在知识系统A/R2中的上下近似分别为:{x1,x2}和{x1,x2,x5,x8},已经和原来知识系统中的上下近似不一样了,同样考虑“不稳定”的近似表示也变化了,所以删除属性“大小”是对知识表示有影响的故而不能去掉。 得到化简后的知识库R2,R3 决策规则: 大三角---稳定,大方块---稳定,小圆---不稳定,中圆---不稳定,中方块---不稳定, 进一步化简得到:大---稳定, 圆---不稳定, 中方块---不稳定。 这些有用知识是从数据库有粗糙集方法自动学习得到的。 实际上我们只要把这个数据库输入进粗糙集运算系统,而不用提供任何先验的知识,粗糙集算法就能自动学习出知识来。 (这是它能够广泛应用的根源所在。而在模糊集、可拓集等集合论中我们还要事先给定隶属函数。) (1) 它能处理各种数据, 包括不完整( incomplete) 的数据以及拥有众多变量的数据; (2) 它能处理数据的不精确性和模棱两可(ambiguity) , 包括确定性和非确定性的情况; (3) 它能求得知识的最小表达( reduct); (4) 它能从数据中揭示出概念简单, 易于操作的模式(pattern) ; 粗糙集理论的特点 利用粗糙集理论对疾病诊断结果和症状之间的关系进行数据挖掘,确定疾病诊断的主要症状和冗余症状,得到最小症状组合,提取简洁的诊断规则。 练习 一个简单的练习 又一个练习 3、随机变量及概率 医学中通常所说的发病率、病死率、治愈率等都是频率,常用百分数表示。显然,0≤fn(A)≤l。当试验次数n逐渐增多时,fn(A)在一个常数附近摆动,摆动的幅度随着n的增大将愈来愈小,而逐渐稳定下来,这就是频率的稳定性。 0≤fn(A)≤l 频率的稳定性充分说明随机事件出现的可能性是事物本身固有的一种客观属性,因此可以对它进行度量。 在大量重复试验中却具有某种规律性的现象称为随机事件(Random events),简称事件。 例如,{某病患的治疗结果} {某批药丸的合格率是99%} … 都是随机事件,随机事件通常用字母A,B,C等表示。 随机变量 在大量重复试验中,如果事件出现的频率稳定地在某一常数p的附近摆动,便称常数p为事件A的概率(Probability),记作P(A)=p。 概率 频率表现为变数 当试验次数足够多,频率相当稳定时,便可把频率作为概率的近似估计: 概率则为常数 P(A)≈fn(A) 定理1 若事件A和B是两个互不相容的事件,则 概率的加法法则 P(A+B)=P(A)+P(B) 【例3-2】 在20片外观相同的药片中,有黄连素1
文档评论(0)