- 23
- 0
- 约1.41千字
- 约 4页
- 2016-09-29 发布于浙江
- 举报
实用开题报告范本.doc
本科生毕业论文(设计)开题报告题目 学生姓名 学 号 2006 学院专业年级 指导教师 职称、学历 讲师 硕士研究生 计划完成时间 2010年5月20日 开题报告
一、选题的意义
1.目的与意义
文本分类作为信息检索、信息过滤、搜索引擎、文本数据库、数学化图书馆等领域的技术基础,有着广泛的应用前景。在文本分类过程中,由于文本数据的半结构化甚至于无结构化的特点,使得表示文本数据特征向量高达几万维甚至于几十万维。即使经过初始化筛选处理(使用停用词表、稀有词处理、单词归并),还会有很多高维数的特征向量留下。高维的特征对分类机器的学习未必全是至关重要的,有益的。高维的特性可能会大大增加机器学习的时间而仅产生与之小得多的特征子集一样的分类结果。特征提取算法能够删除对分类贡献不大的词条,选择出能够代表文本或类别特征的词条,一方面减少了文本向量的维数,另一方面使特征向量能更好地代表文本或者类别特征。文本维数的减少,有利于分类算法的运用,使各种分类算法能够运用到文本分类中,为选择更好的分类算法提供了条件。因此,在进行文本分类中,文本特征的提取的显得至关重要。
2.国内外研究概况
到目前为止,文本自动分类在国外大致经历了三个发展阶段:第一阶段(1958-1964)主要进行自动分类的可行性研究。第二阶段(1965-1974)进行自动分类的试验研究。第三阶段(1975-至今)进行实
您可能关注的文档
- 安徽锅炉、压力容器收费标准.doc
- 安恩贝加盟政策0507.doc.deflate.doc
- 安新委托代理销售协议111.doc
- 安检中级.doc
- 安检初级.doc
- 安顺市老年公寓项目可行性报告.doc
- 宋兰纳税服务讲话.doc
- 宋宇哲开题报告.doc
- 完整的图书管理系统.doc
- 完整的论文1.doc
- 2026年互联网医疗行业政策解读与市场机遇.docx
- 自适应数字教育资源动态生成与个性化推送在远程教育中的实践与探索教学研究课题报告.docx
- 基于机器学习的智能辅导系统在音乐教育中的个性化教学研究教学研究课题报告.docx
- 基于AI的初中化学实验实验教学资源开发与利用课题报告教学研究课题报告.docx
- 校园AI失物招领系统中的社交分享功能开发课题报告教学研究课题报告.docx
- 初中生物细胞分裂动画制作与课堂教学融合课题报告教学研究课题报告[001].docx
- 2026年处方药电商合规分析报告.docx
- 小学科学课程中探究式学习的实践与评价体系构建课题报告教学研究课题报告.docx
- 基于物联网技术的数字化教学管理绩效评估指标体系构建与实施研究教学研究课题报告.docx
- 初中化学错题智能生成与自适应练习系统应用效果课题报告教学研究课题报告.docx
原创力文档

文档评论(0)