- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于k最近邻居算法文本分类器设计论文
基于k-最近邻居算法文本分类器设计论文
基于k-最近邻居算法的文本分类器设计
摘 要:K-最近邻居算法是指存在一份要求分类的新样本,可通过在存在的训练样本中找出K个
与其最相近的样本加以分析,得出待分类样本的类别就是这K个样本中占比例最大的类别。K-
nearest文本分类器是根据K-最近邻居算法设计的以解决当今越来越急需的文本分类的工具,本文
在此设计过程中严格按照软件工程所要求的步骤来分析和实现及测试,并对测试项目作详细说明。
关键词:数据挖掘;分类算法;K-最近邻居算法;文本分类
Abstract: K-nearest algorithm is that finding the similar stylebook which request classifying
in training stylebook, the most proportion of sorts in these stylebook is the sort which waiting
for classifying stylebook. K-nearest sorter can solve now the more and more urgently needed
text classification. K-nearest sorter designing process analyzes and realize that strictly
according to the step which the software engineering requests, meanwhile has made the test to
this sorter, and to test the item to give the explanation.
Keywords: Data mining; classification algorithm; K-nearest algorithm; Text categorization
目 录
前 言 ..................................................................... 2
......................................................... 4
1.1 文本分类简介 .................................................................................................................................... 4 1.2 文本的表示 ........................................................................................................................................ 4 1.3 文本分类的过程 ................................................................................................................................ 5 1.4 K-最近邻居算法 .............................................................................................................................. 6
1.4.1 算法介绍 ................................................................................................................................... 6
1.4.2 在文本中的应用 ....................................................................................................................... 7
........................................ 8
2.1 K-NEAREST分类器的需求分析 ......................................................
您可能关注的文档
- 城公交网点与人口分布互动关系的理论模型.pdf
- 城林业复习题学生用.doc
- 培训技能及会议管理讲座.ppt
- 基于FSM的IPv6邻居发现协议一致性测试的研究可编辑.doc
- 基于GPU的血管造影图像增强方法.pdf
- 基于Kalman滤波的储备池多元时间序列在线预报器.pdf
- 基于SCP范式b分析b以色列企业孵化器b产业b的发展.pdf
- 基于VC的自动钻铆机铆接数据库系统的开发.doc
- 基于关联的城公交换乘查询算法.pdf
- 基于履带式的沙滩行走机器人教育.doc
- 某县纪委监委开展“校园餐”突出问题专项整治工作汇报22.docx
- 中小学校园食品安全与膳食经费管理专项整治工作自查报告66.docx
- 某县委常委、宣传部部长年度民主生活会“四个带头”个人对照检查发言材料.docx
- XX县委领导班子年度述职述廉报告3.docx
- 某县纪委关于校园餐问题整治工作落实情况的报告.docx
- 中小学校园食品安全与膳食经费管理专项整治工作自查报告22.docx
- 某县税务局党委领导班子年度民主生活会“四个带头”对照检查材料.docx
- 某县委书记在县委常委班子年度民主生活会专题学习会上的讲话.docx
- 某县纪委校园餐问题整治工作落实情况的报告.docx
- 某区委副书记、区长年度民主生活会对照检查材料.docx
文档评论(0)