- 5
- 0
- 约8.83千字
- 约 18页
- 2018-10-15 发布于福建
- 举报
基于全切分获取网络流行语的方法的研究
基于全切分获取网络流行语的方法的研究
(华中师范大学 a.计算机科学系; b.国家语言资源监测与研究中心网络媒体分中心, 武汉 430079)
摘 要:
利用统计和规则相结合的算法从互联网的动态信息流中提取网络流行语。在利用全切分算法获取候选词集的基础上,依次对候选词集进行三次过滤:首先基于向量空间模型的权重过滤,运用语言模型进行过滤;然后利用垃圾串过滤规则获取网络流行词语候选词集;最后利用提出的流行词语评分模型进行筛选得到网络流行词语。实验表明,在不影响流行词语准确率的前提下,利用该方法自动获取网络流行词语的速度明显提高。
关键词:网络流行词语; 中文信息处理; 全切分
中图分类号:TP391文献标志码:A
文章编号:1001-?B3695(2009)04-?B1260-?B03
Study on popular words and phrases extraction of networkbased on omni-segmentation
WU Bao-zhena,b, HE Ting-tinga,b, LI Lia,b, ZHANG Yonga,b, CHEN Longa,b
( a.Dept. of Computer Science, b.Monitor Research Center for Na
您可能关注的文档
最近下载
- 2026年新苏教版三年级下册科学全册知识点梳理(新教材).pdf
- 达坂城区防风林初步设计文本.doc VIP
- 场平土石方工程归档资料.docx VIP
- 2025年长沙县县内选调教师考试试题附答案.docx VIP
- 小学数学课标测试题题库及答案.doc VIP
- 浅析中德文化差异对商务谈判的影响及应对策略.docx VIP
- 新疆2022系列标准设计图集新22D6 防雷与接地工程.docx VIP
- 湖南省近六年(2014年-2019年)对口招生考试医卫类专业综合知识试题.docx VIP
- 场平土石方工程归档资料.doc VIP
- 三一履带起重机SCC13800TM_产品手册用户使用说明书技术参数图解图示电子版.pdf VIP
原创力文档

文档评论(0)