- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
K-均值聚类算法报告
1.算法思想
K-均值算法也称C-均值算法,是根据函数准则进行分类的聚类算法,基于使聚类准则函数最小化。K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类中心,然后计算其他数据距离这三个聚类中心的距离,将数据归入与其距离最近的聚类中心,之后再对这K个聚类的数据计算均值,作为新的聚类中心,继续以上步骤,直到新的聚类中心与上一次的聚类中心值相等时结束算法。
准则函数:聚类集中每一样本点到该类中心的距离平方和。对于第j个聚类集,准则函数定义为:
Sj:第j个聚类集(域),聚类中心为Zj ;
Nj:第j个聚类集Sj中所包含的样本个数。
对所有K个模式类有:
K-均值算法的聚类准则:聚类中心的选择应使准则函数J极小,即使Jj的值极小。
即有:
可解得:
上式表明,Sj类的聚类中心应选为该类样本的均值。
2.算法描述
(1)任选K个初始聚类中心:Z1(1), Z2(1),…,ZK(1)括号内序号:迭代运算的次序号。
(2)按最小距离原则将其余样品分配到K个聚类中心中的某一 个,即:
则
(3)计算各个聚类中心的新向量值:
Nj:第j类的样本数。
(4)如果 则回到(2),将模式样本逐个重新分类,重复迭代计算。
如果 ,则算法收敛,计算完毕。
3.算法讨论
结果受到所选聚类中心的个数和其初始位置,以及模式样本的几何性质及读入次序等的影响。实际应用中需要试探不同的K值和选择不同的聚类中心起始值,一般可选择样本集中前K个样本作为初始聚类中心。
4.计算流程
本次程序计算过程严格按照算法描述,通过选取初始聚类中心、计算距离、计算新的聚类中心、判断结果的收敛性等迭代过程,最终得出聚类结果和聚类中心。具体流程如下图:
5.分类结果
读取前50个数据时的两类聚类中心矢量Z1和Z2,以及对应的两类数据集合G1和G2聚类结果如下:
读取前100个数据时的两类聚类中心矢量Z1和Z2,以及对应的两类数据集合G1和G2聚类结果如下:
读取全部数据时的两类聚类中心矢量Z1和Z2,以及对应的两类数据集合G1和G2聚类结果如下:
附:源代码
#includeiostream.h
#includefstream.h
#includestdlib.h
#includemath.h
#define COUNT 150 //数据个数
struct data
{
float dx;
float dy;
float dz;
float dm;
int symbol; //标号
}data[150],Zdata[2],Cz[2];
int time=0; //记录迭代次数
int judge(float i,float j) //判断数据属于哪个分类
{
if(i=j)
return 1;
else
return 2;
}
void main()
{
int z1=0,z2=0; // 存放每个聚类的元素个数
float a=0,b=0,c=0,d=0,e[2],t[8];
float sum=0;
int count;
fstream outputFile;
outputFile.open(IrisData.txt,ios::in); //打开文件
if(!outputFile)
{
coutCant open the File!endl;
exit(0);
}
for(count=0;countCOUNT;count++) //读入数据
{
outputFiledata[count].dx;
outputFiledata[count].dy;
outputFiledata[count].dz;
outputFiledata[count].dm;
data[count].symbol=0;
}
outputFile.close();
for(count=0;count2;count++) //初始化聚类
{
Zdata[count].dx=data[count].dx;
Zdata[count].dy=data[count].dy;
Zdata[count].dz=data[count].dz;
Zdata[count].dm=data[count].dm;
Zdat
文档评论(0)