模糊数学03课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模糊数学 示例的模糊化 样本 样本 为什么要模糊化? 原本不就是模糊的吗? 传统示例学习样本的初始化——离散化 将连续属性分割为不相交区间,并以符号表示 离散化方便了处理,却损失了信息。如果这些信息很关键,将导致我们做出错误的判断 降低离散化力度可以吗?有时候不行,也不需要,我们只需要找出主要因素。 模糊就是推迟做出的离散化。信息不足的时候,先不作出决定。 模糊化不是概率化 概率是无原则的相似 两个对象之间相似的程度 模糊是有中心的接近 与真相之间的距离 方法一、利用概率密度函数 在数学中,一个连续型随机变量的概率密度函数是一个描述这个随机变量的输出值在某一个确定的取值点附近的可能性的函数。 样本模糊化的思路是? 模糊化的方法 数理统计(参数估计,分布假设)★ 专家干预 Photoshop的模糊化方法 采用矩阵,判断矩阵边缘与矩阵核心的差,通过增减相互靠拢,对于隶属于那块图像不做明确的界限。 假设一张黑白图片,0和1表示每个点,模糊化 用隶属函数可以进行模糊化 采用隶属函数代替概率密度函数 借鉴概率密度函数的计算方法 隶属函数是有中心的密度函数 示例学习的一切信息来自样本 知识来自样本示例学习的基本原则 如何从样本确定中心点? 如何由中心点展开? 什么函数才被称为隶属函数 假设数据符合概率密度函数pdf,我们所设计的隶属函数应该是接近pdf的 隶属函数必须满足的三项要求 必须在0至1之间,这是统计函数所必须保证的 隶属函数的数学期望其本质是与中心位置之差,称之为 置信度。置信度的最低要求为c。 置信度大于c,同时模糊性最小的隶属函数,被称为 最优隶属函数 最优隶属函数 最优隶属函数(0至1的闭区间内) 模糊性+确定型-期望限=1() 保持了一致性原则 一致性:可能性不小于概率值 使用最优隶属函数代替pdf的前提条件 只损失信息、不添加不可靠信息 pdf最优隶属度函数举例 指数分布 正态分布 方法二、 Maxmin方法 隶属函数 F(R)表示隶属函数全体集合 a,位置参数 b,规模参数 在闭区间 且 非空 Maxmin方法 如果某个样本为 则参数的估计值为 c为经验值 多项式类型 假设K=2 μ=1-t^2; c=(2+1)^0.5/2=0.8660 正态类型 μ=exp(-pi*t.^2); c=(pi/2)^0.5=1.2533 指数类型 μ=2.7183.^(-abs(t)); c=0.5 圆弧类型 μ=(1-t.^2).^0.5; c = 0.7071 Maxmin方法 Maxmin方法只适合已知数据分布的情况 这里也就隐含了如果训练样本与数据分布之间有偏差,则很难被察觉 该方法主要适合拥有大量样本或对样本分布非常清楚的时候 下面介绍基于相似性的样本模糊化方法 方法三、基于相似性的方法 排序 比较差异 相似分组 三角隶属函数 该方法非常简单 但损失了大量信息 方法四、基于聚类的迭代算法 最大k值(小于样本数量) 最小k值(大于等于3) 初始化时,平均分配m点 随机选取样本点 按事先设定的学习率修改距离样本点最近的m点 迭代直至收敛 小结 重点:样本的模糊化对于筛选样本中的信息意义 * 19805 Number of Web Hits: No Missing Values? Classification Associated Tasks: 1992-07-01 Date Donated 7 Number of Attributes: Categorical, Integer, Real Attribute Characteristics: Computer Area: 6000 Number of Instances: Multivariate Data Set Characteristics:?? 1 0 line 0 0 0 20 20.00 46.10 1 1 line 19 0 19 8 8.00 46.10 1 2 line 0 20 19 8 22.47 46.10 1 3 line 0 20 8 42 23.41 46.10 1 4 line 19 8 8 42 35.74 46.10 CLASS OBJNUM TYPE XX1 YY1 XX2 YY2 SIZE DIAG 10181 Number of Web Hits: N/A Missing Values? Regression Associated Tasks: 2009-04-30 Date Donated 10 Numb

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档