【模式识别与人工智能】38-第五章-第六节-决策树-应用实例.pptxVIP

  • 0
  • 0
  • 约3.43千字
  • 约 30页
  • 2026-03-22 发布于广东
  • 举报

【模式识别与人工智能】38-第五章-第六节-决策树-应用实例.pptx

第五章决策树-应用实例模式识别与人工智能授课教师:栾声扬汇报人:何紫齐

CONTENTS数据选择1数据处理2分类模型3

PART01数据选择

5.6.1数据选择文本分类文本分类是指用计算机对文本按照一定的分类体系或标椎进行自动分类标记。随着信息技术的高速发展,各机关、企事业单位形成的档案爆炸式增长,档案分类是必不可少的,而传统的档案分类通常需要耗费大量的人力、物力、财力,效率低下。基于此,文本分类的类型,就是档案分类,提出了基于决策树的档案自动归类模型。第六节应用实例

5.6.1数据选择挑选合适的样本数据是首要任务,将直接影响分类模型能否成功建立以及分类结果的可操作性和可信度。档案样本数据挑选原则:应避免字迹不清晰、卷面不整洁,以及容易造成混淆的照片和图表类档案。扫描文件的分辨率须在300dpi以上(档案界普遍认同的属性),以保证图像达到一定的OCR识别率。第六节应用实例

5.6.1数据选择选用的图像识别软件为目前较为成熟的OCR软件,这里选用ABBYYFineReader11作为识别工具,其档案识别结果如图1所示:图1某文件内容识别结果第六节应用实例

5.6.1数据选择分类法则为体现对机关事业单位所承担的社会职能与自身职能的概括与提炼,档案类目一般分为行政综合、党群工作、财

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档