基于贝叶斯文本自动分类应用研究和实现.docVIP

  • 3
  • 0
  • 约1.22万字
  • 约 16页
  • 2016-08-06 发布于安徽
  • 举报

基于贝叶斯文本自动分类应用研究和实现.doc

基于贝叶斯文本自动分类应用研究和实现.doc

毕业设计(论文)任务书 题目 基于贝叶斯的文本自动分类的研究和实现 专业 学号 姓名主要内容、基本要求、主要参考资料等: 近年来随着Internet的大规模普及和企业信息化程度的提高,有越来越多的信息积累,而需要信息的人还没有特别方便的工具去从来自异构数据源的大规模的文本信息资源中提取符合需要的简洁、精炼、可理解的知识,文本挖掘正是解决这一问题的一个方法。 本课题研究基于贝叶斯的文本分类系统,可以用于以下领域和系统中:企业知识门户、信息增值服务、智能搜索引擎 、数字图书馆 、情报分析 、信息安全和过滤、电子商务系统。文本自动分类不需人工干预的自动分类技术,有效提高非结构化信息资源的加工效率。利用朴素贝叶斯分类文法的分类器,分析已经手动分类的文本,根据文本内容计算分类条件概率,再利用训练好的分类器分析未分类的文本,根据分类器算出的所属领域概率最大的进行分类。 本课题任务要求: 学习关于朴素贝叶斯分类文法,查找相关的资料以供参考; 实现朴素贝叶斯分类文法的分类器; 人工对样本数据进行分类和标注; 利用贝叶斯分类文法的分类器,利用样本进行训练,然后对分类数据进行自动分类; 根据分类结果,调整分类阈值,弥补分类器的不足。 根据实验数据和结果,按时完成毕业设计论文。 主要参考资料:贝叶斯分类算法的论文和资料,未分类文本语料。 完成期限: 指导教师签章:

文档评论(0)

1亿VIP精品文档

相关文档