一种大规模中文搜索日志的层次聚类方法.pdfVIP

  • 20
  • 0
  • 约 3页
  • 2017-04-10 发布于北京
  • 举报

一种大规模中文搜索日志的层次聚类方法.pdf

一种大规模中文搜索日志的层次聚类方法.pdf

第 28 卷第 8 期 2012 年 8 月 科技通报 Vol.28 No.8 Aug. 2012 BULLETIN OF SCIENCE AND TECHNOLOGY 一种大规模中文搜索日志的层次聚类方法 孙锐,金澎 (乐山师范学院智能信息处理及应用重点实验室,四川乐山 614∞4) 摘要:提出一种层次聚类算法,旨在对搜索引擎的查询日志数据进行聚类分析。算法基于搜狗实验室 公开的查询日志数据,通过3次划分完成查询文本聚类,每一次划分实现不同程度的降维。相似度参数 可根据不同的聚类需求调整,算法可扩展性强。实验结果为查询推荐、相关性排序等提供了有力的依 据。 ? 关键词:搜索引擎;查询日志;层次聚类;聚类分析 中图分类号:TP393 文献析、识码:A 文章编号: 1∞1-7119( 2012 )08-∞83-03 Hierarchical Clustering Method for Large-scale Chinese Query Logs SUNR山, JIN Peng ( Laboratory of Intelligent Information Processing and Application Leshan Normal University,Leshan 614004, China) Abstract: This paper propose a hier

文档评论(0)

1亿VIP精品文档

相关文档