信研班师敏
武汉理工大学
模式识别导论
题 目: 模式识别综述
完 成 人: 师敏
班 级: 1001班
专 业: 电路与系统
学 制: 2.5年
学 号: 104972102821
模式识别综述
摘要:本文主要介绍了模式识别中常用的模糊k-均值及最小均方误差两种算法。介绍了模糊k-均值算法的基本思路及步骤和最小均方误差验证可分性及分类算法的原理和方法。并使用MATLAB软件编写程序实现了具体的例子,给出了实验结果并对结果进行了分析。
关键词:模糊k-均值 最小均方误差 可分性
0 引言
聚类是数据分析中的一项重要技术【1】,是众多科学领域和工程技术中的一项基础性工作。聚类分析被广泛应用于生物学、天体物理学、模式识别、决策支持、数据挖掘、图像处理、最优化问题等。所谓聚类是把d维特征空间中N个数据点分成k个不同的类,使类内数据点的相似度高、不同类之问的数据点的相似度低【2-5】。这里的相似在特征空间中表现为距离近,所以距离可以用来对2个数据点进行相似性测度。在模糊聚类分析法中,模糊集合相当于模糊类,模式之间的相似性通常用模糊关系、隶属度来表示。模糊聚类分析的具体方法很多,而且新方法不断出现,本文讨论的是模糊k-均值算法。最小均方误差(Least Mean Square Error, LMSE)算法的推导利用了梯度概念,它除了对线性可分的模式类收敛外,对线性不可分的情况也可以在算法的迭代过程中明确的表示出来,避免造成空等现象白白浪费时间。这个独特的性能使这种算法成为设计模式分类器的有用工具。
1 模糊k-均值算法
模糊k-均值算法在聚类过程中每次得到的类别边界仍然是模糊的,每类聚类中心的修改都要用到所有的样本,此外聚类准则也体现了模糊性。模糊k-均值算法聚类的结果仍然是模糊集合,但是如果实际问题需要一个明确的界限,也可以对结果进行去模糊化,通过一定得规则将模糊聚类转化为确定性分类。
基本思路
模糊k-均值算法的基本思路是先设定一些类及每个样本对各类的隶属度,然后通过迭代不断调整隶属度至收敛。收敛条件是隶属度的变化量小于规定的阈值。
2)实现步骤
(1)假定要聚为个类,由人为决定个类中心,,为样本个数。
(2)根据先验知识确定样本对各模式类的隶属度,建立初始隶属度矩阵,其中矩阵的行号为类别编号,列号为样本编号。表示第个元素对第类的隶属度。对隶属度矩阵的第列而言,它表示第个元素分别对各模式类的隶属度,因此矩阵的每列元素之和等于1。
(3)求各类的聚类中心,为迭代次数。
式中参数,是一个控制聚类结果模糊程度的常数,即模糊化指数。可以看出各聚类中心的计算必须用到全部的个样本,这是与非模糊k-均值算法的区别之一。在k-均值算法中,某一类的聚类中心只由该类样本决定,不涉及其他类。
(4)计算新的隶属度矩阵,矩阵元素的计算方法【6】为
为每个聚类的中心,是第个样本对于第类的隶属度函数。
(5)回到第三步,重复至收敛。收敛条件为
其中为规定的参数。
当算法收敛时就得到了各类的聚类中心以及表示各样本对各类隶属程度的隶属度矩阵,模糊聚类到此结束。这时准则函数达到最小。
当需要给出确定的分类结果时,可以根据隶属度矩阵,按照隶属原则进行划分,即若
则
3)实验分析
实例:
设有九个一维样本[-5.0,-4.5,-4.1,-3.9,2.5,2.8,3.1,3.9,4.5],取参数,利用模糊k-均值算法把她们聚为两类。
用MATLAB软件编写程序如下:
clear all
%初始化参数值
D=[-5.0,-4.5,-4.1,-3.9,2.5,2.8,3.1,3.9,4.5] %聚类样本
k=2; %聚类中心数
b=2; %模糊化指数
J=100;
%模糊聚类主程序
[i,j]=size(D) %得到数据样本规格,j为数据个数,i为样本的维度。
%初始化隶属度矩阵
member=rand(j,k)
for ii=1:j %归一化隶属度函数矩阵member
temp1=0;
for iii=1:k
temp1=(member(ii,iii))+temp1
end
您可能关注的文档
- 人教版生物七年级下册复习提纲 整理版 第四单元 生物圈中的人.doc
- 人教版试题试卷河南省郑州市盛同学校-学年高二下学期期末考试生物试题.doc
- 人教版小学数学三年级下册两位数乘两位数练习.doc
- 人教版开元盛世知识全解.doc
- 人教版语文三年级下册单元试卷第八单元.doc
- 人教版试题试卷北师大燕化附中-学年高二下学期期中考试生物(理)试题.doc
- 人教课标版小学语文一年级下册教案第课手捧空花盆的孩子.doc
- 人教版第十一讲简单机械.doc
- 人教版语文三下形近字组词.doc
- 人教版语文八下全册通假字归纳.doc
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
最近下载
- 传媒法规与伦理教学课件(共22章)新闻伦理研究综述.pdf VIP
- 汽车行驶记录仪产品使用说明书.PDF VIP
- 2026年成都市美容医疗诊所医美项目安全规范运营可行性研究报告.docx VIP
- ocean培训petrel re快速入门工作流程.pdf VIP
- (四年级奥数班讲义.doc VIP
- 单病种病案数据填报指导手册.doc
- 企业 IPO 筹备方案(最新版,附时间表 + 材料).docx VIP
- 深圳初三数学联考模拟试题.docx VIP
- 高考历史二轮总复习精品课件 第四板块 世界现代史 第十七讲 现代科技的发展与当今世界发展的趋势.ppt VIP
- 2024年菏泽职业学院单招数学考试模拟试题及答案解析.docx VIP
原创力文档

文档评论(0)