K-means聚类算法分析应用研究.docVIP

下载本文档

30
0
约2.71千字
约 5页
2017-05-07 发布于北京
举报
版权申诉

K-means聚类算法分析应用研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

K-means聚类算法分析应用研究.doc

K-means聚类算法分析应用研究　　摘要：本文浅谈了数字图像处理的发展概况、研究背景并对彩色图像K-means算法进行分析.主要详细谈论了是对K-means算法的一些认识，并且介绍K-means聚类的算法思想、工作原理、聚类算法流程、以及对算法结果进行分析，得出其特点及实际使用情况。　　关键字：数字图像处理；K-means算法；聚类　　　　一、数字图像处理发展概况及边缘的概念　　数字图像处理（Digital Image Processing）即计算机图像处理，就是利用计算机对图像进行去除噪声、增强、复原、分割、特征提取、识别等处理的理论、方法和技术[1]。最早出现于20世纪50年代，它作为一门学科大约形成于20世纪60年代初期。它以改善图像的质量为对象，以改善人的视觉效果为目的。在处理过程中，输入低质量图像，输出质量高图像，图像增强、复原、编码、压缩等都是图像处理常用的方法[1]。数字图像处理在航天、航空、星球探测、通信技术、军事公安、生物工程和医学等领域都有广泛的应用，并取得了巨大的成就。　　边缘就是图像中灰度有阶跃变化或屋顶变化的像素的集合，边缘是图像最重要的特征之一，它包含了图像的大部分信息。实质上边缘检测就是采用算法提取图像中对象与背景间的交界线。在目标与背景、目标与目标、区域与区域、基元与基元之间都存在边缘，这是图像分割所依赖的最重要的特征之一。根据灰度变化的剧烈程度，边缘可以分为两种：一种是屋顶边缘，一种为阶跃性边缘。对于屋顶状边缘，二阶导数在边缘初取极值，而对阶跃性边缘，二阶导数在边缘处零交叉；。　　二、彩色图像的K-means聚类算法　　（一）K-means聚类　　聚类就是把数据分成几组，按照定义的测量标准，同组内数据与其他组数据相比具有较强的相似性。K-means聚类就是首先从n个数据对象任选k个对象作为初始聚类中心；剩下的其它对象，则根据它们与这些聚类中心的距离（相似度），分别将它们分配给与其最相似的（聚类中心所代表的）聚类；然后再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值）；一直重复此过程直至标准测度函数收敛为止。通常都采用均方差作标准测度函数。k个聚类有以下特点：各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。　　聚类的用途是很广泛的。在商业上，聚类可以帮助市场分析人员从消费者数据库中区分出不同的消费群体来，并且概括出每一类消费者的消费模式或者说习惯。它作为数据挖掘中的一个模块，可以作为一个单独的工具以发现数据库中分布的一些深层的信息，并且概括出每一类的特点，或者把注意力放在某一个特定的类上以作进一步的分析；并且，聚类分析也可以作为数据挖掘算法中其他分析算法的一个预处理步骤。　　（二）算法思想分析　　输入：聚类个数k，以及包含 n个数据对象的彩色图片。　　输出：满足方差最小标准的k个聚类。　　处理流程：　　(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心；　　 (2)根据每个聚类对象的均值（中心对象），计算每个对象与这些中心对象的距离；并根据最小距离重新对相应对象进行划分；　　(3)重新计算每个（有变化）聚类的均值（中心对象）；　　(4)循环(2)到(3)直到每个聚类不再发生变化为止。　　首先设置K值，也就是确定若干个聚类中心。使用rand函数随机获得K个颜色值，存放在矩阵miu中，第一次对每个像素点中的K种颜色进行迭代运算，得到最小的颜色矩阵的2范数，同时标记该颜色，依次相加的到各点的颜色矩阵总值。再次迭代得到K中颜色的各个矩阵均值。最后提取出标记的各个颜色，依次对各个点进行颜色赋值，使每个像素点的颜色归类。得到聚类后的图像。　　（三）算法的数学描述　　■ 　　（四）算法过程分析　　设置K值为8，读入一幅图片后计算图像上所有的像素点个数为N，即令N=size(X,1)*size(X,2)，令颜色矩阵R为矩阵[N,K]并清零。随机获得颜色聚类中心为Miu=fix(255*rand(K,3))。　　在10次迭代中，对每一个像素点进行k=8次迭代，计算该点颜色值与各个聚类中心的欧氏距离dis。若dis最小，则标记此时颜色矩阵为R(n,k)=1。依次对8个聚类中心迭代，计算标记的每一个坐标点的颜色总值sum1和总数量sum2，计算新的聚类中心Miu(k,:)=sum1/sum2。再次对所有点进行迭代，根据第一次迭代时标记的R(n,k)值，若R(n,k)为真时，对该点颜色赋值为聚类中心k的颜色值。依次分析聚类出最终效果图。　　■ 　　图 K-means聚类算法流程图　　（五）K-means算法结果分析　　K-means算法取K值为8，就是通过对每个像素点进行8次迭代找到