模糊聚类案例重点.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模糊数学方法及其应用 论文题目: 模糊聚类方法案例分析 小组成员: 王季光 宋申辉 兰洁 陈倩芸 肖仑 杨洋 吴云峰 2013年 10 月 27 日 模糊聚类分析方法 1.1距离和相似系数 为了将样品(或指标)进行分类,就需要研究样品之间关系。目前用得最多的方法有两个:一种方法是用相似系数,性质越接近的样品,它们的相似系数的绝对值越接近1,而彼此无关的样品,它们的相似系数的绝对值越接近于零。比较相似的样品归为一类,不怎么相似的样品归为不同的类。另一种方法是将一个样品看作P维空间的一个点,并在空间定义距离,距离越近的点归为一类,距离较远的点归为不同的类。但相似系数和距离有各种各样的定义,而这些定义与变量的类型关系极大,因此先介绍变量的类型。 由于实际问题中,遇到的指标有的是定量的(如长度、重量等),有的是定性的(如性别、职业等),因此将变量(指标)的类型按以下三种尺度划分: 间隔尺度:变量是用连续的量来表示的,如长度、重量、压力、速度等等。在间隔尺度中,如果存在绝对零点,又称比例尺度,本书并不严格区分比例尺度和间隔尺度。 有序尺度:变量度量时没有明确的数量表示,而是划分一些等级,等级之间有次序关系,如某产品分上、中、下三等,此三等有次序关系,但没有数量表示。 名义尺度:变量度量时、既没有数量表示,也没有次序关系,如某物体有红、黄、白三种颜色,又如医学化验中的阴性与阳性,市场供求中的“产”和“销”等。 不同类型的变量,在定义距离和相似系数时,其方法有很大差异,使用时必须注意。研究比较多的是间隔尺度,因此本章主要给出间隔尺度的距离和相似系数的定义。 设有个样品,每个样品测得项指标(变量),原始资料阵为 其中为第个样品的第个指标的观测数据。第个样品为矩阵的第行所描述,所以任何两个样品与之间的相似性,可以通过矩阵X中的第K行与第L行的相似程度来刻划;任何两个变量与之间的相似性,可以通过第列与第列的相似程度来刻划。 1.2 F相似关系 1.2.1定义 设,如果具有自反和对称关系,则称为上的一个相似关系(表示模糊) 当论域为有限时,相似关系可以用矩阵表示。具有F相似关系的矩阵,称为相似矩阵。在实际应用时,通常只能得到自反矩阵和对称举证,即相似矩阵。现在的问题是对具有相似关系的元素怎样进行分类,也就是如何将相似矩阵改造为等价矩阵。 1.2.2 定理 若,则称为对称矩阵。(1) 若(是单位矩阵),则称为自反矩阵。(2) 若,则称为传递的关系。(3) 若满足上面三点则称为等价矩阵。 定理1:相似矩阵的传递闭包是等价矩阵,且。 证 只需要证明是自反的、对称的。 因是自反的,故,。不难得到不减,因此,即是自反的。 因为,,故是对称的。 有定理1可见,要想将相似矩阵改变为等价矩阵,只需求相似矩阵的传递闭包。 定理2:设是自反矩阵,则任意自然数,都有 证 由自反性推得 当时,有 1.3 聚类分析 所谓聚类分析,就是用数学的方法对事物进行分类,它有广泛的实际应用。在模糊数学产生之前,聚类分析已是数理统计多元分析的一个分支,然而现实的分类问题往往伴有模糊性。例如,环境污染分类、春天连阴雨预报、临床症状资料分类、岩石分类,等等。对这些伴有模糊性的聚类问题,用模糊数学语言来表达更为自然。 模糊聚类分析的步骤: 第一步:数据标准化 数据矩阵 设论域为被分类的对象,每个对象由m个指标表示其性状, 即 于是得到原始数据矩阵为 数据标准化 在实际问题中,不同的数据一般有不同的量纲。为了使有不同的量纲的量也能进行比较,通常需要对数据作适当的变换。但是,即使这样,得到的数据也不一定在区间[0,1]上。因此,这里说的数据标准化,就是要根据模糊矩阵的要求,将数据压缩到区间[0,1]上。 通常需要作如下集中变换。 平移标准差变换 平移极差变换 对数变换 第二步 标定(建立模糊相似矩阵) 设为待分类的全体。其中每一待分类对象由一组数据表征如下: 现在的问题是如何建立和之间的相似关系。这有许多方法(这里选一些,列在下面),我们可以按照实际情况,选其中一种来求与的相似关系。 (1)形似系数法 数量积法 其中M为一适当选择之正数,满足 夹角余弦法 相关系数法 其中 最大最小法 算术平均最小法 几何平均最小法 绝对值指数法 绝对值减数法 其中,适当选取,使。 (2)距离法 1)直接距离法 海明距离 欧几里得距离 切比雪夫距离 倒数距离法 指数距离法 选择上述哪一个方法好,要按实际情况而定。在实际应用时,最好采用多种方法,选取分类最符合实际的结果。 第三步 聚类(求动态聚类图)。 由第一步得到的矩阵一般只满足自反性和对称性,即是相似矩阵,需将它改造成模糊等价矩阵。为此,采用平方法求出的传递闭包,便

文档评论(0)

希望之星 + 关注
实名认证
文档贡献者

我是一名原创力文库的爱好者!从事自由职业!

1亿VIP精品文档

相关文档