基于大规模日志分析的搜索引擎用户行为分析 -教学教育大中小学课堂教案研究作业报告幻灯片投影片培训课件专题材料素材.docVIP

基于大规模日志分析的搜索引擎用户行为分析 -教学教育大中小学课堂教案研究作业报告幻灯片投影片培训课件专题材料素材.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大规模日志分析的搜索引擎用户行为分析 -教学教育大中小学课堂教案研究作业报告幻灯片投影片培训课件专题材料素材

第 21卷 第 1期 2007年 1月  中文信息学报 J OU RNAL O F C H IN ESE IN FO RMA TION PROCESSIN G  Vol. 21 , No . 1 J an. , 2007 基于大规模日志分析的搜索引擎用户行为分析 余慧佳1 ,刘奕群1 ,张敏1 ,茹立云2 ,马少平1 (1.清华大学智能技术与系统国家重点实验室 ,北京 100084 ; 2.搜狗公司研发中心 ,北京 100084) 摘 要 :用户行为分析是网络信息检索技术得以前进的重要基石 ,也是能够在商用搜索引擎中发挥重要作用的各 种算法的基本出发点之一。为了更好的理解中文搜索用户的检索行为 ,本文对搜狗搜索引擎在一个月内的近 5 000万条查询日志进行了分析。们从独立查询词分布、一 sessio n内的用户查询习惯及用户是否使用高级检 索功能等方面对用户行为进行了分析。分析结论对于改进中文搜索引擎的检索算法和更准确的评测检索效果都 有较好的指导意义。 关键词 :计算机应用 ;中文信息处理 ;网络信息检索 ;搜索引擎 ;用户行为分析 ;点击信息分析 中图分类号 : TP391    文献标识码 : A Research in Search Engine User Behavior Based on Log Analysis 1 1 1 2 1 (1. Depart ment of Comp uter Science and Technology , Tsinghua U niversity , Beijing 100084 ; 2. Sogo u R D Cent re , Beijing 100084) Abstract : U ser log analysis is impo rtant fo r bot h Web informatio n ret rieval technologies and co mmercial search engine algorit hms. In order to better understand search behavio r of Chinese Web search users , we p resent s an analysis of Sogo u Search Engine query log co nsisting of app roximately 50 million ent ries fo r search request s over a period of o ne mo nt h. The analysis includes search ret rieval behavio r in individual queries dist ributio n , user request customs in t he same session and whether using advanced search f unctions. Co nclusio ns may help imp rove Web informatio n ret rieval algorit hms and search perfo rmance evaluation met hods. Key words : co mp uter applicatio n ; Chinese information p rocessing ; web info rmation ret rieval ; search engine ; user behavio r analysis ; click t hrough data analysis 搜索引擎日志是网络搜索引擎用户行为的重要 1 引言载体 ,国内外的不少研究者都针对网络搜索引擎的 用户日志进行了相关的研究。网络信息检索工具得 随着网络与信息资源的飞速发展 ,网络搜索引到普及之后 ,面向网络信息检索的用户行为分析得 擎已经成为人们获取网络信息的主要途径。但现在到了更多的关注 ,文献 [ 1~3 ]就分别在 90年代中 人们通常只是简单地通过短短几个词的查询与检索期左右对 Web用户的浏览行为进行了调研和分析 ; 系统进行沟通 ,而在网络信息资源规模如此庞大的到 1998年前后 ,部分研究者如文献 [ 4 ,5 ]等就开始 情况下这种沟通是远远不够的 ,检索系统往往不能对商业搜索引擎的用户日志进行大规模的

您可能关注的文档

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档