- 9
- 0
- 约 7页
- 2017-09-01 发布于河北
- 举报
维普资讯
第 21卷 第 6期 中文信息学报 Vo1.21,No.6
2007年 11月 JOURNAL OFCHINESEINFORMATIoN PROCESSING NOV.,2007
文章编号 :1003—0077(2007)06—0109—07
利用上下文提高文本聚类的效果
丘志宏 ,宫雷光
(1.汕头大学 计算机系 广东 汕头 515063;2.IBM 华生研究 中心 ,美 国 纽约 NY 10532)
摘 要 :传统文本聚类的向量空间模型中,认为词的权重只和词频有关,而与词语 出现的上下文无关。本文介绍 了
如何借助按词语之间关系组织的本体论词典对文章进行上下文分析,得到文章中词语之间意义上的相互关系,进
而用相关词语 的词频 以及关系的权重量化地给 出一个词语受到上下文的支持程度 ,所 以在衡量词语权重时不仅考
虑其词频 ,而且考虑上下文的支持情况 。文章还介绍 了如何用 自动构建的方法得到本文所
原创力文档

文档评论(0)