基于N—gram统计模型的搜索引擎中文纠错.pdfVIP

下载本文档

61
0
约1.35万字
约 5页
2017-09-14 发布于重庆
举报

基于N—gram统计模型的搜索引擎中文纠错.pdf

第3期中同鼋；珂譬研宪F宪譬摹鱼 V01．4No．3 ofCAEIT 2009年6月 Joumal Jun．2009 基于N—gram统计模型的搜索引擎中文纠错陈智鹏，吕玉琴，刘华生，刘刚，屠辉 (北京邮电大学电子工程学院，北京100876) 摘要：搜索引擎中的关键词纠错是提高检索效率的一项重要辅助功能。提出了一种完全通过分析上下文统计信息的方法，根据中文语言的特点，在建立N．gram统计模型并分析比较的基础上，再通过计算TF／IDF的权重来获得最优的纠错结果，最后通过实验验证了该方法实现了搜索引擎中对输入关键词的自动检查和纠错。关键词：搜索引擎；输入纠错；N—gram模型；TWIDF 中图分类号：TP393文献标识码：A 文章编号：1673-5692(2009)03—323-04 Chinese CorrectioninSearch

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于N—gram统计模型的搜索引擎中文纠错.pdfVIP

基于N—gram统计模型的搜索引擎中文纠错.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档