- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
KNN分类算法的MapReduce并行化实现-JournalOfNUAA-南京
45 4 Vo l . 4 5 N o. 4
2013 8 Journal of N anjing U niversit y of A ero nautics A st ronautics Aug . 2013
KNN MapReduce
1 1, 2 3
闫永刚 马廷淮 王 建
1. , , 210044 ; 2 . , , 2 10044;
3. , , 210093)
: 为了提高k-near est neig hbor algo r ithm K N N ) 算法处理大数据集的能力, 本文利用M ap Reduce 并行编程模
型, 同时结合 算法自身的 点, 给出了 算法在 平台下的并行化实现。通过设计 、
K NN K NN Hadoo p M ap Co mbine
和R educe 3 个函数, 实现了K N N 算法的并行化。M a p 函数完成每 个测试样本与训练样本之间的相似度计算,
Combine 函数作为一个本地的Reduce 操作, 用以减少中间计算量及通信开销, Reduce 函数则根据上述函数得到
的中间结果计算出k 近邻并作出分类判断。实验结果表明: 较之以往的单机版方法, 在Hadoo p 集群上实现的并
行化K N N 算法具有较好的加速比和良好的扩展性。
: K N N 分类; 并行计算; M ap Reduce 模型; Hadoop
: T P391: A : 1005-2615 2013) 04 -0550-06
Parallel Implementing KNN Classification Algorithm Using
MapReduce Programming Mode
Yan Yongg ang 1 , M a Ting h uai1, 2 , W ang J ian3
1. Schoo l o f Co mput er and Softw ar e, N anjing U niver sity of I nfo rmat ion Science T echnolo gy , N anjing , 2 10044, China;
2. Jiang su Eng ineering Center o f N etw or k M onito ring, Nanj ing U niver sity o f Infor mation Science T echnolog y, Nanj ing,
210044, China ; 3 . School o f Electr onic Science and Engineer ing , N anjing U niver sity , N anjing , 210093, China )
Abstract: In order t o im pro ve t he abilit y of K N N algo rithm t o process massive dat a, a new t echnique
based on Hadoop plat f orm is u sed. Co nsidering t he char act erist ics o f the K N N alg orit hm itself, the par -
allel ism of K N N based on th
您可能关注的文档
- 2017年林业技术专业技能考试大纲-湖北生态工程职业技术学院.DOC
- 2017年黄山学院团员教育评议结果.DOC
- 2017年春节期间北京城区和郊区大气PM及其中多环-环境化学.PDF
- 2018年7月宾汉姆顿大学家长联络报亲爱的学生家长及家庭成员们宾.PDF
- 2018年需求书-天津轻工职业技术学院.DOC
- 2018年浙江技术发明奖推荐项目公示表-上海大学科技处.DOC
- 20180223107学基北区各入学管道宣导简报-新北中等教育.PDF
- 2018级学生心理普查工作方案.PDF
- 2018年深圳人力资源场工资指导价位-深圳人力资源和社会.PDF
- 2723相似三角形应用举例.PDF
- 实验室危废随意倾倒查处规范.ppt
- 实验室危废废液处理设施规范.ppt
- 实验室危废处置应急管理规范.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第20课时 中国的地理差异.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第21课时 北方地区.ppt
- 危险废物处置人员防护培训办法.ppt
- 危险废物处置隐患排查技术指南.ppt
- 2026部编版小学数学二年级下册期末综合学业能力测试试卷(3套含答案解析).docx
- 危险废物处置违法案例分析汇编.ppt
- 2026部编版小学数学一年级下册期末综合学业能力测试试卷3套精选(含答案解析).docx
原创力文档


文档评论(0)