- 22
- 0
- 约9.31千字
- 约 34页
- 2017-09-27 发布于广西
- 举报
文档分类.ppt
;章节: 1、引言 2、相关工作 3、提出的分类方法 4、实验结果与分析 5、结论和未来工作;1、引言 食品是人类赖以生存和发展的物质基础。近几年来,接连不断发生的恶性食品安全事故,引发了人们对食品安全的高度关注,致使网络上涌现出海量的食品投诉文档。然而消费者在网站上发布的食品投诉文本是杂乱无章的,没有有效的组织,而不同的信息用户,对于投诉信息有着不同的需求。本文针对食品投诉文本的特点,提出一种基于主题的食品投诉文本分类器,有效地组织和管理这些投诉文本,将它们按主题归类,使人们能快速准确地从中找到人们所需要的信息。; 网络上的食品投诉文本大多数都是短文本,内容较短,表达文本主题的特征也比较稀疏,因此,短文本的特征选择尤为重要。目前,国内外对于短文本分类的研究已经有很多了,Zelikovitz, S等提出将LSI应用于短文本分类的特征选择 。目前,已经有许多基于本体的语义知识来指导分类的研究,例如人们利用像WordNet, Euro WordNet, CoreNet和HowNet这样的通用本体,给出一种模仿人手动标记文档的直观方法,这些通用本体中的多种语义关系被用作一个桥梁,提供与人脑中的知识相同的功能,将类和未标记文档链接起来,实现自动文本分类。;本文基于食品
原创力文档

文档评论(0)