基于TFIDF的简单文档分类系统设计与实现分析.docVIP

  • 37
  • 0
  • 约4.43万字
  • 约 61页
  • 2017-08-26 发布于安徽
  • 举报

基于TFIDF的简单文档分类系统设计与实现分析.doc

毕 业 设 计(论 文) 题 目 基于TF/IDF的简单文档分类系统设计与实现 姓 名 徐超群 学 号 0710311111 所在学院 计算机学院 专业班级 07计算1 指导教师 钮焱 日 期 2011 年 6月 7日 毕业设计(论文)任务书 学 院 计算机 指导教师 钮焱 职 称 教授 学生姓名 徐超群 专业班级 07计算1 学 号 0710311111 设计题目 基于TF/IDF的简单文档分类系统设计与实现 设 计 内 容 目 标 和 要 求 (设计内容目标和要求、设计进度等) 一、设计内容 本系统是基于TF/IDF的文档分类系统,采用词匹配法。系统分两大模块,第一部分将文档进行分词处理。该部分主要采用两种基本算法,基于字符串的正向最大匹配算法与基于字符串的反向最大匹配算法。第二部分将前一部分得到单词处理,利用TF/IDF算法将该文档与各类别进行匹配,找到匹配度最高的类别。 二、设计进度 第一阶段:准备阶段(2011年3月—2011年4月) 明确课题研究方向、研究思路,制定研究计划,构思课题名称,并进行可行性分析。 查阅与课题相关的文献资料,搜集相关

文档评论(0)

1亿VIP精品文档

相关文档