基于N—gram统计模型的搜索引擎中文纠错.pdfVIP

  • 61
  • 0
  • 约1.35万字
  • 约 5页
  • 2017-09-14 发布于重庆
  • 举报

基于N—gram统计模型的搜索引擎中文纠错.pdf

第3期 中同鼋;珂譬研宪F宪譬摹鱼 V01.4No.3 ofCAEIT 2009年6月 Joumal Jun.2009 基于N—gram统计模型的搜索引擎中文纠错 陈智鹏,吕玉琴,刘华生,刘 刚,屠 辉 (北京邮电大学电子工程学院,北京100876) 摘要:搜索引擎中的关键词纠错是提高检索效率的一项重要辅助功能。提出了一种完全通过分 析上下文统计信息的方法,根据中文语言的特点,在建立N.gram统计模型并分析比较的基础上,再 通过计算TF/IDF的权重来获得最优的纠错结果,最后通过实验验证了该方法实现了搜索引擎中 对输入关键词的自动检查和纠错。 关键词:搜索引擎;输入纠错;N—gram模型;TWIDF 中图分类号:TP393文献标识码:A 文章编号:1673-5692(2009)03—323-04 Chinese CorrectioninSearch

文档评论(0)

1亿VIP精品文档

相关文档