基于聚类和svm的数据分类方法与试验研究梁修荣1杨正益21重庆.docVIP

下载本文档

1
0
约6.16千字
约 6页
2017-08-20 发布于天津
举报
版权申诉

基于聚类和svm的数据分类方法与试验研究梁修荣1杨正益21重庆.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于聚类和svm的数据分类方法与试验研究梁修荣1杨正益21重庆

基于分类方法梁修荣1，杨正益2 （，）（，）摘要K-均值聚类分组支持向量机在不删减任何样本信息的情况下，该方法轮廓系数作为类分离度量参数对数据的正、负类样本聚类分组交叉结合训练得到不同的SVM分类器，根据测试样本聚类中心欧氏距离的加权来选择的SVM分类器，方法实现了一个二分类问题为多个细分的二分类效果由差变好。实验结果表明，与传统的SVM方法相比，该算法提高分类的准确率。关键词分组；轮廓系数；加权欧氏距离实际数据分类中图分类号 TP39 文献标识码 ANew Method of Data Classification with the Experimental Research based on Clustered Group SVM LIANG Xiu-rong，YANG Zheng-yi (1. Department of Information Engineering，Urban Vocational College of Chongqing, Yongchuan, Chongqing， 402160, China) (2.School of Soft Engineering，Chongqing University, Shapingba，Chongqing，401331,China) Abstract A new data classification method, K-means clustering group support vector machine (CG-SVM) method is proposed. Under no circumstances deletion of any sample information, this method uses the silhouette coefficient as the class separation metric parameter clustering and grouping positive and negative samples. And different SVM classifiers are obtained after that the group is crossed and trained. The SVM classifier is selected according to the weight of the Euclidean distance of the test sample to the clustering center. The method achieves a two classification problem into more simple binary classification problems. And the effect is improved. The simulation data and the actual data classification experiment are carried out respectively. Compared with the traditional SVM method, experimental results show that CG-SVM method can effectively improve the accuracy of classification. Keywords Clustering Group SVM; Silhouette Coefficient; Weighted Euclid Distance; Actual Data Classification 0 引言本世纪九十年代支持向量机SVM) 这种有效的机器学习方法被提出来[1]。SVM是以统计学理论基础的是一种实际体现最小化结构风险的思想，能有效地解决许多学习算法中的实际问题如非线性高维数小样本、局部极小点等，具有推广。目前分类、时间预测函数估计等领域，成为国际上机器学习与人工智能领域重要的研究点。近年来，随着SVM分类器训练算法的广泛应用与数据集都对分类训练数据量较大时，都将影响分类效率。针对分类效率的提升人们越来越多的算法，归纳两种：第一分解原二次优化问题子问题，按照的迭代策略反复求解子问题，最终原问题的收敛最优解，块算法(chunking)[3]序贯最小优化算法[]是第一种中的两种典型，这算法的优点是对训练过程有一定程度的优化提升，是工作集策略缓存效率算法影响较大；第二思想是按照规则删减样本，通过减少支持向量数目来降低分类复杂度，近邻方法[]和聚类方法[6-7]是第种中的，思想算法的优点是分类器速度得到很大提升