K-均值聚类算法报告.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
K-均值聚类算法报告 1.算法思想 K-均值算法也称C-均值算法,是根据函数准则进行分类的聚类算法,基于使聚类准则函数最小化。K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类中心,然后计算其他数据距离这三个聚类中心的距离,将数据归入与其距离最近的聚类中心,之后再对这K个聚类的数据计算均值,作为新的聚类中心,继续以上步骤,直到新的聚类中心与上一次的聚类中心值相等时结束算法。 准则函数:聚类集中每一样本点到该类中心的距离平方和。对于第j个聚类集,准则函数定义为: Sj:第j个聚类集(域),聚类中心为Zj ; Nj:第j个聚类集Sj中所包含的样本个数。 对所有K个模式类有: K-均值算法的聚类准则:聚类中心的选择应使准则函数J极小,即使Jj的值极小。 即有: 可解得: 上式表明,Sj类的聚类中心应选为该类样本的均值。 2.算法描述 (1)任选K个初始聚类中心:Z1(1), Z2(1),…,ZK(1)括号内序号:迭代运算的次序号。 (2)按最小距离原则将其余样品分配到K个聚类中心中的某一 个,即: 则 (3)计算各个聚类中心的新向量值: Nj:第j类的样本数。 (4)如果 则回到(2),将模式样本逐个重新分类,重复迭代计算。 如果 ,则算法收敛,计算完毕。 3.算法讨论 结果受到所选聚类中心的个数和其初始位置,以及模式样本的几何性质及读入次序等的影响。实际应用中需要试探不同的K值和选择不同的聚类中心起始值,一般可选择样本集中前K个样本作为初始聚类中心。 4.计算流程 本次程序计算过程严格按照算法描述,通过选取初始聚类中心、计算距离、计算新的聚类中心、判断结果的收敛性等迭代过程,最终得出聚类结果和聚类中心。具体流程如下图: 5.分类结果 读取前50个数据时的两类聚类中心矢量Z1和Z2,以及对应的两类数据集合G1和G2聚类结果如下: 读取前100个数据时的两类聚类中心矢量Z1和Z2,以及对应的两类数据集合G1和G2聚类结果如下: 读取全部数据时的两类聚类中心矢量Z1和Z2,以及对应的两类数据集合G1和G2聚类结果如下: 附:源代码 #includeiostream.h #includefstream.h #includestdlib.h #includemath.h #define COUNT 150 //数据个数 struct data { float dx; float dy; float dz; float dm; int symbol; //标号 }data[150],Zdata[2],Cz[2]; int time=0; //记录迭代次数 int judge(float i,float j) //判断数据属于哪个分类 { if(i=j) return 1; else return 2; } void main() { int z1=0,z2=0; // 存放每个聚类的元素个数 float a=0,b=0,c=0,d=0,e[2],t[8]; float sum=0; int count; fstream outputFile; outputFile.open(IrisData.txt,ios::in); //打开文件 if(!outputFile) { coutCant open the File!endl; exit(0); } for(count=0;countCOUNT;count++) //读入数据 { outputFiledata[count].dx; outputFiledata[count].dy; outputFiledata[count].dz; outputFiledata[count].dm; data[count].symbol=0; } outputFile.close(); for(count=0;count2;count++) //初始化聚类 { Zdata[count].dx=data[count].dx; Zdata[count].dy=data[count].dy; Zdata[count].dz=data[count].dz; Zdata[count].dm=data[count].dm; Zdat

文档评论(0)

xx88606 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档