- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
武汉理工大学
模式识别导论
题 目: 模式识别综述
完 成 人: 师敏
班 级: 1001班
专 业: 电路与系统
学 制: 2.5年
学 号: 104972102821
模式识别综述
摘要:本文主要介绍了模式识别中常用的模糊k-均值及最小均方误差两种算法。介绍了模糊k-均值算法的基本思路及步骤和最小均方误差验证可分性及分类算法的原理和方法。并使用MATLAB软件编写程序实现了具体的例子,给出了实验结果并对结果进行了分析。
关键词:模糊k-均值 最小均方误差 可分性
0 引言
聚类是数据分析中的一项重要技术【1】,是众多科学领域和工程技术中的一项基础性工作。聚类分析被广泛应用于生物学、天体物理学、模式识别、决策支持、数据挖掘、图像处理、最优化问题等。所谓聚类是把d维特征空间中N个数据点分成k个不同的类,使类内数据点的相似度高、不同类之问的数据点的相似度低【2-5】。这里的相似在特征空间中表现为距离近,所以距离可以用来对2个数据点进行相似性测度。在模糊聚类分析法中,模糊集合相当于模糊类,模式之间的相似性通常用模糊关系、隶属度来表示。模糊聚类分析的具体方法很多,而且新方法不断出现,本文讨论的是模糊k-均值算法。最小均方误差(Least Mean Square Error, LMSE)算法的推导利用了梯度概念,它除了对线性可分的模式类收敛外,对线性不可分的情况也可以在算法的迭代过程中明确的表示出来,避免造成空等现象白白浪费时间。这个独特的性能使这种算法成为设计模式分类器的有用工具。
1 模糊k-均值算法
模糊k-均值算法在聚类过程中每次得到的类别边界仍然是模糊的,每类聚类中心的修改都要用到所有的样本,此外聚类准则也体现了模糊性。模糊k-均值算法聚类的结果仍然是模糊集合,但是如果实际问题需要一个明确的界限,也可以对结果进行去模糊化,通过一定得规则将模糊聚类转化为确定性分类。
基本思路
模糊k-均值算法的基本思路是先设定一些类及每个样本对各类的隶属度,然后通过迭代不断调整隶属度至收敛。收敛条件是隶属度的变化量小于规定的阈值。
2)实现步骤
(1)假定要聚为个类,由人为决定个类中心,,为样本个数。
(2)根据先验知识确定样本对各模式类的隶属度,建立初始隶属度矩阵,其中矩阵的行号为类别编号,列号为样本编号。表示第个元素对第类的隶属度。对隶属度矩阵的第列而言,它表示第个元素分别对各模式类的隶属度,因此矩阵的每列元素之和等于1。
(3)求各类的聚类中心,为迭代次数。
式中参数,是一个控制聚类结果模糊程度的常数,即模糊化指数。可以看出各聚类中心的计算必须用到全部的个样本,这是与非模糊k-均值算法的区别之一。在k-均值算法中,某一类的聚类中心只由该类样本决定,不涉及其他类。
(4)计算新的隶属度矩阵,矩阵元素的计算方法【6】为
为每个聚类的中心,是第个样本对于第类的隶属度函数。
(5)回到第三步,重复至收敛。收敛条件为
其中为规定的参数。
当算法收敛时就得到了各类的聚类中心以及表示各样本对各类隶属程度的隶属度矩阵,模糊聚类到此结束。这时准则函数达到最小。
当需要给出确定的分类结果时,可以根据隶属度矩阵,按照隶属原则进行划分,即若
则
3)实验分析
实例:
设有九个一维样本[-5.0,-4.5,-4.1,-3.9,2.5,2.8,3.1,3.9,4.5],取参数,利用模糊k-均值算法把她们聚为两类。
用MATLAB软件编写程序如下:
clear all
%初始化参数值
D=[-5.0,-4.5,-4.1,-3.9,2.5,2.8,3.1,3.9,4.5] %聚类样本
k=2; %聚类中心数
b=2; %模糊化指数
J=100;
%模糊聚类主程序
[i,j]=size(D) %得到数据样本规格,j为数据个数,i为样本的维度。
%初始化隶属度矩阵
member=rand(j,k)
for ii=1:j %归一化隶属度函数矩阵member
temp1=0;
for iii=1:k
temp1=(member(ii,iii))+temp1
end
您可能关注的文档
最近下载
- 2024年安徽省初中学业水平考试中考数学试卷(真题+答案).docx VIP
- 习概期末考复习测试附答案.docx
- GB 25194_杂物电梯制造与安装安全规范.pdf VIP
- 开放系统11846《商法》期末机考真题及答案(第110套).docx VIP
- 2025届苏州中考一模英语试卷及答案 .pdf VIP
- 2025年人教版七年级下册数学期中复习专题01 相交线与平行线(考题猜想,11种易错重难点与解题模型73题专项训练)原卷版.docx VIP
- 社区工作者考试300题附完整答案【各地真题】.docx VIP
- 七年级美术教案(人教版)全册.doc
- 2025青海省从优秀村(社区)党组织书记中考录乡镇公务员32人笔试备考试题及答案解析.docx VIP
- 欧盟新法规MDR培训.pptx VIP
文档评论(0)