基于统计的中文关键短语自动抽取.pdfVIP

  • 18
  • 0
  • 约1.26万字
  • 约 4页
  • 2018-04-07 发布于北京
  • 举报
第9卷第1期 江南大学学报(自然科学版) V01.9No.1 2010年2月 of Science Feb.2010 Journal JiangnanUniversity(NaturalEdition) 基于统计的中文关键短语自动抽取 张永刚2, 梁颖红1, 颜振祥2, 姚建民心 (1.江苏省现代企业信息化应用支撑软件工程技术研究开发中心,江苏苏州215104;2.苏州大学 计算机学院,江苏苏州215006) 摘 要:用统计的方法从单文本中自动抽取关键短语。在实验中验证了频度、首位置作为特征的有 效性。用各种方法过滤非法词串,综合短语位置和统计特征对候选短语进行权重计算,并依据关键 短语分布规律选择关键短语。另外,通过分析关键短语分布特点为Ⅳ元短语在过滤、按比例选择方 面提供了依据。获得了比较好的实验结果:TOP5精确率21.80%,召回率28.27%,F—measure25%; TOPl0精

文档评论(0)

1亿VIP精品文档

相关文档