一个基于概念的中文文本分类模型.docVIP

  • 4
  • 0
  • 约 6页
  • 2017-08-22 发布于重庆
  • 举报
一个基于概念的中文文本分类模型.doc

一个基于概念的中文文本分类模型 苏伟峰 李绍滋 厦门大学计算机科学系 厦门 361005 摘 要 本文提出一个电子文档的自动分类的模型:基于《知网》之上,经过对文档的关键词的抽取和排岐, 进而得到关键词的概念,再对关键词的概念进行综合而得到该文本的所属的类别,实验证明该模型有较好的效果。 关键词 文本分类 概念 《知网》 全信息 一 、引 言 在过去几年中随着科学技术的迅猛发展,特别是随着因特网的快速发展,各种信息情报激增,特别是网上信息浩如烟海,人们可能通过因特网能很快地得到大量的资料,因此如何对所获得资料进行科学有效地管理是摆在人们面前一个不可回避而又很有意义的问题。对资料进行管理一个很常见的方法就是对它们系统地进行分类。 显然,用人工对文本材料进行分类的过程是通读所有文章,然后再对它们进行归类保存。 当然这需要许多具有丰富经验和专门知识的分类人员做大量的工作,显然这个过程具有周期长、费用高、效率低的特点,在信息爆炸的今天很难满足实际需要,如何运用计算机进行自动分类成了许多人的研究方向。 一般而言,文本分类方法可分为两个类型: 基于外延方法的分类方法:这种类型的分类方法不关心文本的语义,根据文本的外在特征进行分类。最常见的方法是基于

文档评论(0)

1亿VIP精品文档

相关文档