重庆邮电大学硕士论文 摘要
摘要
随着计算机网络在各个领域中的广泛应用,产生了庞大的网络信息,其中,
以手机短信、QQ聊天记录、博客评论、新闻评论等短文本形式存在的信息也得到
了空前的膨胀,如何对这些以短文本形式存在海量知识进行有效的组织和管理,
使用户能方便准确的查找到所需信息,是文本自动知识获取迫切需要解决的问题。
由于短文本长度短、描述概念信号弱,使得用于长文本时效果比较好的分类
方法,在作用于短文本时,分类效果不理想,为了解决上述问题,我们采用了一
种利用额外信息来辅助短文本分类的方法。
对于词语之间的语义关系的研究和学习,一直是信息处理和自然语言处理中
不可缺少的一部分,其中,词语间的上下位关系在语义关系中扮演着重要的角色,
引入上下位关系这个额外信息来辅助短文本分类是目前的一个研究热点,此前也
有很多关于提取上下位关系的研究,尽管这些研究在获取上下位词对时有很大的
效用,但如何提取具有上下位关系的词对,仍然是一个富有挑战性的任务。利用
上下位关系对短文本的特征向量进行扩展,能够在一定程度上增强短文本的概念
描述能力。本文是基于上
原创力文档

文档评论(0)