《中文文本信息处理》课件 第十二章 文本分类.pptVIP

  • 7
  • 0
  • 约1.08万字
  • 约 90页
  • 2018-01-28 发布于江西
  • 举报

《中文文本信息处理》课件 第十二章 文本分类.ppt

中文文本信息处理的原理与应用 Weka使用实例 下面是使用Weka C4.5分类算法的实例 打开数据 Weka 3.4界面 中文文本信息处理的原理与应用 Weka使用实例(续1) 参数设置及实验 中文文本信息处理的原理与应用 Weka使用实例(续2) 决策树导出 中文文本信息处理的原理与应用 TANAGRA介绍 TANAGRA是法国里昂大学的研究人员专门为学术研 究开发的一个数据挖掘软件。 其下载地址为:http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html Tanagra1.4界面 中文文本信息处理的原理与应用 其它相关软件 Rainbow /~mccallum/bow/ BoosTexter /~schapire/BoosTexter/ TiMBL http://ilk.kub.nl/software.html#timbl C4.5 http://www.cs.uregina.ca/~dbd/cs831/notes/ml/dtrees/c4.5/tutorial.html 中文文本信息处理的原理与应用 Thanks 中文文本信息处理的原理与应用 常用分类器 Rocchio方法——相似度计算方法 Na?ve Bayes ——贝叶斯方法 KNN方法——K近邻方法 SVM——支持向量机

文档评论(0)

1亿VIP精品文档

相关文档