- 18
- 0
- 约1.26万字
- 约 4页
- 2018-04-07 发布于北京
- 举报
第9卷第1期 江南大学学报(自然科学版) V01.9No.1
2010年2月 of Science Feb.2010
Journal
JiangnanUniversity(NaturalEdition)
基于统计的中文关键短语自动抽取
张永刚2, 梁颖红1, 颜振祥2, 姚建民心
(1.江苏省现代企业信息化应用支撑软件工程技术研究开发中心,江苏苏州215104;2.苏州大学
计算机学院,江苏苏州215006)
摘 要:用统计的方法从单文本中自动抽取关键短语。在实验中验证了频度、首位置作为特征的有
效性。用各种方法过滤非法词串,综合短语位置和统计特征对候选短语进行权重计算,并依据关键
短语分布规律选择关键短语。另外,通过分析关键短语分布特点为Ⅳ元短语在过滤、按比例选择方
面提供了依据。获得了比较好的实验结果:TOP5精确率21.80%,召回率28.27%,F—measure25%;
TOPl0精
原创力文档

文档评论(0)