- 4
- 0
- 约 6页
- 2017-08-22 发布于重庆
- 举报
一个基于概念的中文文本分类模型.doc
一个基于概念的中文文本分类模型
苏伟峰 李绍滋
厦门大学计算机科学系 厦门 361005
摘 要 本文提出一个电子文档的自动分类的模型:基于《知网》之上,经过对文档的关键词的抽取和排岐, 进而得到关键词的概念,再对关键词的概念进行综合而得到该文本的所属的类别,实验证明该模型有较好的效果。
关键词 文本分类 概念 《知网》 全信息
一 、引 言
在过去几年中随着科学技术的迅猛发展,特别是随着因特网的快速发展,各种信息情报激增,特别是网上信息浩如烟海,人们可能通过因特网能很快地得到大量的资料,因此如何对所获得资料进行科学有效地管理是摆在人们面前一个不可回避而又很有意义的问题。对资料进行管理一个很常见的方法就是对它们系统地进行分类。
显然,用人工对文本材料进行分类的过程是通读所有文章,然后再对它们进行归类保存。
当然这需要许多具有丰富经验和专门知识的分类人员做大量的工作,显然这个过程具有周期长、费用高、效率低的特点,在信息爆炸的今天很难满足实际需要,如何运用计算机进行自动分类成了许多人的研究方向。
一般而言,文本分类方法可分为两个类型:
基于外延方法的分类方法:这种类型的分类方法不关心文本的语义,根据文本的外在特征进行分类。最常见的方法是基于
您可能关注的文档
最近下载
- 铁路信息机房通用-技术规范.pdf VIP
- 电子病历应用管理规范(试行).docx
- 梅州市梅江区2025-2026学年第二学期三年级语文期中考试卷(部编版含答案).docx VIP
- 中华人民共和国国民经济和社会发展第十五个五年规划纲要解读PPT.pptx VIP
- 深度解析(2026)《GBT 3105-2002普通螺栓和螺钉 头下圆角半径》(2026年)深度解析.pptx VIP
- 2026新人教版八年级数学下学期期中综合质量评估试卷及答题卡.docx
- 《落叶清扫机设计》毕业学术论文.doc VIP
- 实施指南(2025)《GBT3105-2002普通螺栓和螺钉头下圆角半径》.pptx VIP
- 结核预防性治疗方案.pdf VIP
- 文始初学实践.pdf VIP
原创力文档

文档评论(0)