- 0
- 0
- 约3.43千字
- 约 30页
- 2026-03-22 发布于广东
- 举报
第五章决策树-应用实例模式识别与人工智能授课教师:栾声扬汇报人:何紫齐
CONTENTS数据选择1数据处理2分类模型3
PART01数据选择
5.6.1数据选择文本分类文本分类是指用计算机对文本按照一定的分类体系或标椎进行自动分类标记。随着信息技术的高速发展,各机关、企事业单位形成的档案爆炸式增长,档案分类是必不可少的,而传统的档案分类通常需要耗费大量的人力、物力、财力,效率低下。基于此,文本分类的类型,就是档案分类,提出了基于决策树的档案自动归类模型。第六节应用实例
5.6.1数据选择挑选合适的样本数据是首要任务,将直接影响分类模型能否成功建立以及分类结果的可操作性和可信度。档案样本数据挑选原则:应避免字迹不清晰、卷面不整洁,以及容易造成混淆的照片和图表类档案。扫描文件的分辨率须在300dpi以上(档案界普遍认同的属性),以保证图像达到一定的OCR识别率。第六节应用实例
5.6.1数据选择选用的图像识别软件为目前较为成熟的OCR软件,这里选用ABBYYFineReader11作为识别工具,其档案识别结果如图1所示:图1某文件内容识别结果第六节应用实例
5.6.1数据选择分类法则为体现对机关事业单位所承担的社会职能与自身职能的概括与提炼,档案类目一般分为行政综合、党群工作、财
您可能关注的文档
- 【模式识别与人工智能】05-第一章-第五节-线性回归-优化算法3.pptx
- 【模式识别与人工智能】06-第一章-第六节-线性回归-非线性归回.pptx
- 【模式识别与人工智能】08-第一章-第八节-线性回归-正则归回2.pptx
- 【模式识别与人工智能】10-第一章-第十节-线性回归-应用实例.pptx
- 【模式识别与人工智能】11-第二章-第一节-对数几率回归-建立模型.pptx
- 【模式识别与人工智能】12-第二章-第二节-对数几率回归-学习策略.pptx
- 【模式识别与人工智能】13-第二章-第三节-对数几率回归-优化算法.pptx
- 【模式识别与人工智能】14-第二章-第四节-对数几率回归-多元分类.pptx
- 【模式识别与人工智能】17-第三章-第二节-支持向量机-学习策略.pptx
- 【模式识别与人工智能】18-第三章-第三节-支持向量机-优化算法.pptx
- 广西南宁市第二中学2025-2026学年八年级下学期开学收心自测英语试卷(含解析).docx
- 广西南宁市武鸣区武鸣高级中学等校2026年高考模拟信息卷数学试题(含解析).docx
- 广西壮族自治区崇左市江州区2025-2026学年八年级上学期期末语文试题(含解析).docx
- 广西壮族自治区防城港市防城区2025—2026学年八年级上学期期末地理试题(含解析).docx
- 部编版一年级下册语文第五单元培优卷A卷(含答案).docx
- 福建省厦门海沧实验中学2025-2026学年高二上学期期末地理试题(含解析).docx
- 甘肃省天水市甘谷县模范初级中学2025-2026学年九年级数学下学期第一次检测考试试题(含解析).docx
- 甘肃省武威市凉州区爱华育新学校2025-2026学年九年级上学期12月月考英语试题(解析版).docx
- 甘肃张掖市2025--2026学年下学期九年级数学阶段反馈试卷(含解析).docx
- 广东惠州博罗县2025-2026学年九年级上学期阶段诊断历史试卷(含解析).docx
原创力文档

文档评论(0)