基于全切分获取网络流行语的方法的研究.docVIP

  • 5
  • 0
  • 约8.83千字
  • 约 18页
  • 2018-10-15 发布于福建
  • 举报

基于全切分获取网络流行语的方法的研究.doc

基于全切分获取网络流行语的方法的研究

基于全切分获取网络流行语的方法的研究   (华中师范大学 a.计算机科学系; b.国家语言资源监测与研究中心网络媒体分中心, 武汉 430079)      摘 要:   利用统计和规则相结合的算法从互联网的动态信息流中提取网络流行语。在利用全切分算法获取候选词集的基础上,依次对候选词集进行三次过滤:首先基于向量空间模型的权重过滤,运用语言模型进行过滤;然后利用垃圾串过滤规则获取网络流行词语候选词集;最后利用提出的流行词语评分模型进行筛选得到网络流行词语。实验表明,在不影响流行词语准确率的前提下,利用该方法自动获取网络流行词语的速度明显提高。   关键词:网络流行词语; 中文信息处理; 全切分   中图分类号:TP391文献标志码:A   文章编号:1001-?B3695(2009)04-?B1260-?B03      Study on popular words and phrases extraction of networkbased on omni-segmentation   WU Bao-zhena,b, HE Ting-tinga,b, LI Lia,b, ZHANG Yonga,b, CHEN Longa,b   ( a.Dept. of Computer Science, b.Monitor Research Center for Na

文档评论(0)

1亿VIP精品文档

相关文档