浅谈模式识别大作业-k近邻.docVIP

下载本文档

12
0
约6.86千字
约 10页
2017-07-05 发布于湖北
举报

浅谈模式识别大作业-k近邻.doc

姓名：学号：题目对sonar和wdbc中数据表分类实验结果表表1 实验数据维数个数wdbc 2 30 =357 =212 sonar 2 60 =98 =110 解：实验结果准确率 Sonar 0.5569 Wdbc 0.8514 K-Means聚类算法一.算法思想 K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类中心，然后计算其他数据距离这三个聚类中心的距离，将数据归入与其距离最近的聚类中心，之后再对这K个聚类的数据计算均值，作为新的聚类中心，继续以上步骤，直到新的聚类中心与上一次的聚类中心值相等时结束算法。在本次算法实现中，选择在两类样本点中随机选择两个点作为两类数据的初始聚类中心，然后在开始迭代，计算，直至找到最优分类。二.算法流程图三.程序运行结果 1、对sonar数据进行k均值聚类表一：sonar（Kmeans）运行次数准确率 1 0.5913 2 0.6030 3 0.5048 4 0.5817 5 0.4904 6 0.5192 7 0.6731 8 0.5721 9 0.5096 10 0.5240 平均准确率 0.5569 程序迭代次数：6 得到第一类聚类中心是（0.0325 0.0443 0.0469 0.0585 0.0717 0.0983 0.1162 0.1306 0.1742 0.1990 0.2179 0.2389 0.2562 0.2737 0.2965 0.3458 0.3568 0.3937 0.4486 0.5130 0.5266 0.4825 0.4894 0.5234 0.5312 0.5745 0.5790 0.6056 0.5951 0.5803 0.5220 0.4791 0.5020 0.5387 0.5508 0.5327 0.4823 0.4541 0.4271 0.3914 0.3547 0.3225 0.2724 0.2381 0.2208 0.1799 0.1263 0.0908 0.0525 0.0223 0.0161 0.0144 0.0118 0.0118 0.0107 0.0091 0.0091 0.0089 0.0094 0.0073）得到第二类聚类中心是（0.0264 0.0336 0.0413 0.0501 0.0781 0.1097 0.1263 0.1383 0.1811 0.2159 0.2510 0.2596 0.2874 0.3155 0.3397 0.4055 0.4647 0.5007 0.5511 0.6043 0.6771 0.7411 0.7769 0.7957 0.7943 0.8032 0.8037 0.7669 0.6808 0.5814 0.4900 0.4060 0.3473 0.2916 0.2621 0.2630 0.2661 0.2453 0.2422 0.2450 0.2353 0.2418 0.2252 0.1943 0.1778 0.1447 0.1193 0.0919 0.0514 0.0189 0.0160 0.0126 0.0098 0.0102 0.0081 0.0075 0.0068 0.0072 0.0067 0.0058） 2、对wdbc数据进行k均值聚类表二：wdbc（Kmeans）运行次数准确率 1 0.8514 2 0.8514 3 0.8514 运行了几次程序，发现准确率一直保持不变，分析可能是由于两类数据比较集中而类间距离又足够大导致，随机选择的样本点对数据分类没有产生什么影响。程序迭代次数：11 得到的第一类聚类中心是： 1.0e+003 * （0.0194 0.0217 0.1282 1.1859 0.0001 0.0001 0.0002 0.0001

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

浅谈模式识别大作业-k近邻.docVIP