K-均值聚类算法报告.docVIP

下载本文档

14
0
约4.8千字
约 7页
2015-07-27 发布于安徽
举报
版权申诉

K-均值聚类算法报告.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

K-均值聚类算法报告 1.算法思想 K-均值算法也称C-均值算法，是根据函数准则进行分类的聚类算法，基于使聚类准则函数最小化。K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类中心，然后计算其他数据距离这三个聚类中心的距离，将数据归入与其距离最近的聚类中心，之后再对这K个聚类的数据计算均值，作为新的聚类中心，继续以上步骤，直到新的聚类中心与上一次的聚类中心值相等时结束算法。准则函数：聚类集中每一样本点到该类中心的距离平方和。对于第j个聚类集，准则函数定义为： Sj：第j个聚类集（域），聚类中心为Zj ； Nj：第j个聚类集Sj中所包含的样本个数。对所有K个模式类有： K-均值算法的聚类准则：聚类中心的选择应使准则函数J极小，即使Jj的值极小。即有：可解得：上式表明，Sj类的聚类中心应选为该类样本的均值。 2.算法描述（1）任选K个初始聚类中心：Z1(1)， Z2(1)，…，ZK(1)括号内序号：迭代运算的次序号。（2）按最小距离原则将其余样品分配到K个聚类中心中的某一个，即：则（3）计算各个聚类中心的新向量值： Nj：第j类的样本数。（4）如果则回到（2），将模式样本逐个重新分类，重复迭代计算。如果，则算法收敛，计算完毕。 3.算法讨论结果受到所选聚类中心的个数和其初始位置，以及模式样本的几何性质及读入次序等的影响。实际应用中需要试探不同的K值和选择不同的聚类中心起始值，一般可选择样本集中前K个样本作为初始聚类中心。 4.计算流程本次程序计算过程严格按照算法描述，通过选取初始聚类中心、计算距离、计算新的聚类中心、判断结果的收敛性等迭代过程，最终得出聚类结果和聚类中心。具体流程如下图： 5.分类结果读取前50个数据时的两类聚类中心矢量Z1和Z2，以及对应的两类数据集合G1和G2聚类结果如下：读取前100个数据时的两类聚类中心矢量Z1和Z2，以及对应的两类数据集合G1和G2聚类结果如下：读取全部数据时的两类聚类中心矢量Z1和Z2，以及对应的两类数据集合G1和G2聚类结果如下：附：源代码 #includeiostream.h #includefstream.h #includestdlib.h #includemath.h #define COUNT 150 //数据个数 struct data { float dx; float dy; float dz; float dm; int symbol; //标号 }data[150],Zdata[2],Cz[2]; int time=0; //记录迭代次数 int judge(float i,float j) //判断数据属于哪个分类 { if(i=j) return 1; else return 2; } void main() { int z1=0,z2=0; // 存放每个聚类的元素个数 float a=0,b=0,c=0,d=0,e[2],t[8]; float sum=0; int count; fstream outputFile; outputFile.open(IrisData.txt,ios::in); //打开文件 if(!outputFile) { coutCant open the File!endl; exit(0); } for(count=0;countCOUNT;count++) //读入数据 { outputFiledata[count].dx; outputFiledata[count].dy; outputFiledata[count].dz; outputFiledata[count].dm; data[count].symbol=0; } outputFile.close(); for(count=0;count2;count++) //初始化聚类 { Zdata[count].dx=data[count].dx; Zdata[count].dy=data[count].dy; Zdata[count].dz=data[count].dz; Zdata[count].dm=data[count].dm; Zdat