- 3
- 0
- 约1.22万字
- 约 16页
- 2016-08-06 发布于安徽
- 举报
基于贝叶斯文本自动分类应用研究和实现.doc
毕业设计(论文)任务书
题目 基于贝叶斯的文本自动分类的研究和实现
专业 学号 姓名主要内容、基本要求、主要参考资料等:
近年来随着Internet的大规模普及和企业信息化程度的提高,有越来越多的信息积累,而需要信息的人还没有特别方便的工具去从来自异构数据源的大规模的文本信息资源中提取符合需要的简洁、精炼、可理解的知识,文本挖掘正是解决这一问题的一个方法。
本课题研究基于贝叶斯的文本分类系统,可以用于以下领域和系统中:企业知识门户、信息增值服务、智能搜索引擎 、数字图书馆 、情报分析 、信息安全和过滤、电子商务系统。文本自动分类不需人工干预的自动分类技术,有效提高非结构化信息资源的加工效率。利用朴素贝叶斯分类文法的分类器,分析已经手动分类的文本,根据文本内容计算分类条件概率,再利用训练好的分类器分析未分类的文本,根据分类器算出的所属领域概率最大的进行分类。
本课题任务要求:
学习关于朴素贝叶斯分类文法,查找相关的资料以供参考;
实现朴素贝叶斯分类文法的分类器;
人工对样本数据进行分类和标注;
利用贝叶斯分类文法的分类器,利用样本进行训练,然后对分类数据进行自动分类;
根据分类结果,调整分类阈值,弥补分类器的不足。
根据实验数据和结果,按时完成毕业设计论文。
主要参考资料:贝叶斯分类算法的论文和资料,未分类文本语料。
完成期限:
指导教师签章:
您可能关注的文档
- 基于单片机红外遥控密码锁.doc
- 基于单片机红外遥控开关设计.doc
- 基于单片机脉搏测量仪论文.doc
- 基于固定场景多目标跟踪开题报告.doc
- 基于宽带薪酬制度设计.doc
- 基于我国人本思想公务员绩效考核应用研究.doc
- 基于文本Web图片搜索引擎应用研究.doc
- 基于新高考方案学科思考(高中语文).doc
- 基于旅游者感知旅游目地形象应用研究.doc
- 基于激励理论员工绩效考评.doc
- GB/T 12690.13-2026稀土金属及其氧化物中非稀土杂质化学分析方法 第13部分:钼、钨含量的测定.pdf
- 《GB/T 12690.13-2026稀土金属及其氧化物中非稀土杂质化学分析方法 第13部分:钼、钨含量的测定》.pdf
- JJF 2396-2026高通量基因测序仪校准规范.pdf
- 《JJF 2396-2026高通量基因测序仪校准规范》.pdf
- 计量规程规范 JJF 2396-2026高通量基因测序仪校准规范.pdf
- 计量规程规范 JJF 2392-2026超声猝发音信号源校准规范.pdf
- JJF 2392-2026超声猝发音信号源校准规范.pdf
- JJG 1078-2026医用数字摄影系统(DR)X射线辐射源检定规程.pdf
- 《JJF 2392-2026超声猝发音信号源校准规范》.pdf
- 《JJG 1078-2026医用数字摄影系统(DR)X射线辐射源检定规程》.pdf
原创力文档

文档评论(0)