模糊聚类案例重点.docVIP

下载本文档

13
0
约2.47千字
约 8页
2017-05-16 发布于湖北
举报
版权申诉

模糊聚类案例重点.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

模糊数学方法及其应用论文题目：模糊聚类方法案例分析小组成员：王季光宋申辉兰洁陈倩芸肖仑杨洋吴云峰 2013年 10 月 27 日模糊聚类分析方法 1.1距离和相似系数为了将样品（或指标）进行分类，就需要研究样品之间关系。目前用得最多的方法有两个：一种方法是用相似系数，性质越接近的样品，它们的相似系数的绝对值越接近1，而彼此无关的样品，它们的相似系数的绝对值越接近于零。比较相似的样品归为一类，不怎么相似的样品归为不同的类。另一种方法是将一个样品看作P维空间的一个点，并在空间定义距离，距离越近的点归为一类，距离较远的点归为不同的类。但相似系数和距离有各种各样的定义，而这些定义与变量的类型关系极大，因此先介绍变量的类型。由于实际问题中，遇到的指标有的是定量的（如长度、重量等），有的是定性的（如性别、职业等），因此将变量（指标）的类型按以下三种尺度划分：间隔尺度：变量是用连续的量来表示的，如长度、重量、压力、速度等等。在间隔尺度中，如果存在绝对零点，又称比例尺度，本书并不严格区分比例尺度和间隔尺度。有序尺度：变量度量时没有明确的数量表示，而是划分一些等级，等级之间有次序关系，如某产品分上、中、下三等，此三等有次序关系，但没有数量表示。名义尺度：变量度量时、既没有数量表示，也没有次序关系，如某物体有红、黄、白三种颜色，又如医学化验中的阴性与阳性，市场供求中的“产”和“销”等。不同类型的变量，在定义距离和相似系数时，其方法有很大差异，使用时必须注意。研究比较多的是间隔尺度，因此本章主要给出间隔尺度的距离和相似系数的定义。设有个样品，每个样品测得项指标（变量），原始资料阵为其中为第个样品的第个指标的观测数据。第个样品为矩阵的第行所描述，所以任何两个样品与之间的相似性，可以通过矩阵X中的第K行与第L行的相似程度来刻划；任何两个变量与之间的相似性，可以通过第列与第列的相似程度来刻划。 1.2 F相似关系 1.2.1定义设，如果具有自反和对称关系，则称为上的一个相似关系（表示模糊）当论域为有限时，相似关系可以用矩阵表示。具有F相似关系的矩阵，称为相似矩阵。在实际应用时，通常只能得到自反矩阵和对称举证，即相似矩阵。现在的问题是对具有相似关系的元素怎样进行分类，也就是如何将相似矩阵改造为等价矩阵。 1.2.2 定理若，则称为对称矩阵。（1）若（是单位矩阵），则称为自反矩阵。（2）若,则称为传递的关系。（3）若满足上面三点则称为等价矩阵。定理1：相似矩阵的传递闭包是等价矩阵，且。证只需要证明是自反的、对称的。因是自反的，故，。不难得到不减，因此，即是自反的。因为，，故是对称的。有定理1可见，要想将相似矩阵改变为等价矩阵，只需求相似矩阵的传递闭包。定理2：设是自反矩阵，则任意自然数，都有证由自反性推得当时，有 1.3 聚类分析所谓聚类分析，就是用数学的方法对事物进行分类，它有广泛的实际应用。在模糊数学产生之前，聚类分析已是数理统计多元分析的一个分支，然而现实的分类问题往往伴有模糊性。例如，环境污染分类、春天连阴雨预报、临床症状资料分类、岩石分类，等等。对这些伴有模糊性的聚类问题，用模糊数学语言来表达更为自然。模糊聚类分析的步骤：第一步：数据标准化数据矩阵设论域为被分类的对象，每个对象由m个指标表示其性状，即于是得到原始数据矩阵为数据标准化在实际问题中，不同的数据一般有不同的量纲。为了使有不同的量纲的量也能进行比较，通常需要对数据作适当的变换。但是，即使这样，得到的数据也不一定在区间[0,1]上。因此，这里说的数据标准化，就是要根据模糊矩阵的要求，将数据压缩到区间[0,1]上。通常需要作如下集中变换。平移标准差变换平移极差变换对数变换第二步标定（建立模糊相似矩阵）设为待分类的全体。其中每一待分类对象由一组数据表征如下：现在的问题是如何建立和之间的相似关系。这有许多方法（这里选一些，列在下面），我们可以按照实际情况，选其中一种来求与的相似关系。（1）形似系数法数量积法其中M为一适当选择之正数，满足夹角余弦法相关系数法其中最大最小法算术平均最小法几何平均最小法绝对值指数法绝对值减数法其中，适当选取，使。（2）距离法 1）直接距离法海明距离欧几里得距离切比雪夫距离倒数距离法指数距离法选择上述哪一个方法好，要按实际情况而定。在实际应用时，最好采用多种方法，选取分类最符合实际的结果。第三步聚类（求动态聚类图）。由第一步得到的矩阵一般只满足自反性和对称性，即是相似矩阵，需将它改造成模糊等价矩阵。为此，采用平方法求出的传递闭包，便