实用开题报告范本.docVIP

  • 23
  • 0
  • 约1.41千字
  • 约 4页
  • 2016-09-29 发布于浙江
  • 举报
实用开题报告范本.doc

本科生毕业论文(设计)开题报告题目 学生姓名 学 号 2006 学院专业年级 指导教师 职称、学历 讲师 硕士研究生 计划完成时间 2010年5月20日 开题报告 一、选题的意义 1.目的与意义 文本分类作为信息检索、信息过滤、搜索引擎、文本数据库、数学化图书馆等领域的技术基础,有着广泛的应用前景。在文本分类过程中,由于文本数据的半结构化甚至于无结构化的特点,使得表示文本数据特征向量高达几万维甚至于几十万维。即使经过初始化筛选处理(使用停用词表、稀有词处理、单词归并),还会有很多高维数的特征向量留下。高维的特征对分类机器的学习未必全是至关重要的,有益的。高维的特性可能会大大增加机器学习的时间而仅产生与之小得多的特征子集一样的分类结果。特征提取算法能够删除对分类贡献不大的词条,选择出能够代表文本或类别特征的词条,一方面减少了文本向量的维数,另一方面使特征向量能更好地代表文本或者类别特征。文本维数的减少,有利于分类算法的运用,使各种分类算法能够运用到文本分类中,为选择更好的分类算法提供了条件。因此,在进行文本分类中,文本特征的提取的显得至关重要。 2.国内外研究概况 到目前为止,文本自动分类在国外大致经历了三个发展阶段:第一阶段(1958-1964)主要进行自动分类的可行性研究。第二阶段(1965-1974)进行自动分类的试验研究。第三阶段(1975-至今)进行实

文档评论(0)

1亿VIP精品文档

相关文档