基于粒子群优化的快速KNN分类算法.pptVIP

基于粒子群优化的快速KNN分类算法.ppt

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于粒子群优化的 快速KNN分类算法 主要内容 1 论文背景与意义 2 k近邻分类文本分类算法 3 粒子群优化算法 4 基于粒子群算法的K近邻分类算法 5 实验结果 1 论文背景与意义 基于机器学习的文本分类过程,与智能优化技术结合,对于庞大的文档集合分类,利于提高分类的速度和精度。 智能优化应该作为文本分类的重要一环。 2 k近邻分类文本分类算法 ① 计算测试文本X的特征项权重,文档特征向量w=[w1, w2,…, wM]; ② 对训练集中的任一文本Xj,生成文档向量wj=[wj,1, wj,2,…, wj,M]; ③ 计算训练文本集样本与测试文本的相似度,选出与测试文本最相似的 k个文本; ④ 在新文本的 k个近邻中,依次计算每类的权重 ⑤ 比较类的权重,将文本分到权重最大的类CI中。 3 粒子群优化算法PSO 粒子群优化算法是群体智能优化方法 使用并行和结构化策略,随机但有指导性地加强高维空间的搜索能力。 所搜索的目标空间点有最小的适应度函数值 具有全局搜索和快速收敛的特点 3 粒子群优化算法 PSO种群中任一粒子i的移动速度 PSO种群中任一粒子i的位置 4 基于PSO的K近邻分类算法 文档分类的训练样本集规模很大 KNN方法穷尽搜索整个样本空间的代价很大 粒子群算法群体的随机搜索能力,群体利用与其k个随机样本距离最近的粒子信息指导种群粒子的移动,在很小的搜索空间内快速获得k个近邻样本。 输入:文档集合文档总数N,近邻个数k,粒子群种群个数Q,误差阈值ε。 (1) 生成测试文档的文档特征向量w; (2) 用随机函数在区间[1,N]内为Q个粒子各选择出k个整数(对应文档集合的文档序号)作为每个粒子的初始k个近邻位置,粒子群的初始速度为0; (3) 计算w的k个最优近邻有序集合作为粒子群的全局最优位置,各粒子的位置先作为其局部最优位置。 (4) 置n=n+1,计算每个粒子的移动速度(即其k个近邻的序号偏移量) (5) 从种群移动历史中选择w的k个最优近邻有序集合作为全局指导, If ,则 ;从粒子j的移动历史中 选择其k个最优近邻有序集合作为局部指导。 (6) 根据计算有序集合 和 与测试文档X的相似度 和 ,如果 算法停止,输出集合 作为测试文档X的k个近邻。 5 实验结果 KNN算法的参数包括k近邻的选择,本文分别对k=25和k=35进行了实验, 特征维数分别为50和100。 表1 特征向量维数为100时的结果 当特征向量的维数是100时,相对算法KNN的分类时间而言,本文算法PSOKNN平均减少了69%的分类时间; 当特征向量的维数为50时,PSOKNN算法比KNN的分类时间平均减少72%。PSOKNN算法在保持分类性能不变的情况下,可以大大减少分类时间 * * 张景祥 济南大学计算机工程学院 计算机专业英语教程 科技英语, 专业英语, IT英语 特点:词汇、术语、专用语 北京石油化工学院 张国英 沙芸 江慧娜 KNN 75 157 75 140 PSOKNN 75 48 75 43 算法 k=35 k=25 误分率 时间(s) 误分率 时间(s) KNN 70.2 107 70.2 101 PSOKNN 70.2 31 70.2 29 算法 k=35 k=25 误分率 时间(s) 误分率 时间(s) 表2 特征向量维数为50时的结果

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档