中国人搜索行为研究实验室2007年度报告.pdf

中国人搜索行为研究实验室2007年度报告.pdf

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北京大学信息管理系-百度(中国)有限公司 中国人搜索行为研究实验室 年度报告 2007 二〇〇八年一月 北 京 目 录 中文搜索引擎搜索结果重合率研究 - 1 - 1. 引言- 5 - 2. 研究方法- 7 - 3. 数据统计结果- 10 - 4. 分析和讨论- 15 - 5. 结论- 16 - 致谢- 17 - 参考文献- 17 - 互联网用户搜索行为中检索语言与语言现象研究 ... - 19 - 一 搜索行为之语言研究概述- 22 - 二 网络用户问卷调查研究- 24 - 三 搜索引擎查询日志挖掘研究- 34 - 四 对比实验研究- 41 - 五 研究结论- 45 - 致 谢- 46 - 北京大学信息管理系获 SEWM2007 中文网页分类比赛第六名 - 47 - - 1 - 中文搜索引擎搜索结果重合率研究 王益明 刘菲 北京大学信息管理系 摘 要 本研究的目的是测试主流中文搜索引擎搜索结果之间的重合程度和差异程度,并和主流 英文搜索引擎搜索结果的重合率进行比较。利用一个具有 11171 条来自真实用户的提问样本 集对百度、谷歌和雅虎进行实际测试,发现中文搜索引擎搜索结果之间的重合率很低。 三个搜索引擎第一页搜索结果的重合率只有 2.54%,三者间任何两个引擎之间重合的比 例为 8.11%,三者中任何一个引擎独有的搜索结果比例为 89.34%。三个引擎前两页搜索结果 的重合率更低。 三个引擎两两之间进行比较时,百度和雅虎之间的重合率最低,第一页的重合率为 6.82%,而谷歌和雅虎的之间的重合率最高,第一页的重合率为 9.65%,百度和谷歌之间的 重合率居中,第一页的重合率为 7.78%。三个引擎两两之间前两页搜索结果的重合率比相应 的第一页搜索结果的重合率都要低。 三个引擎第一条搜索结果的重合率只有 3.86%,但比整个第一页面的重合率 2.54%要高 出 50%多。三个引擎两两之间第一条搜索结果的重合率略高于两两之间第一页搜索结果的重 合率。百度和雅虎第一条搜索结果的重合率最低,只有 7.65%,谷歌和雅虎第一条搜索结果 的重合率最高,为 10.85%,百度和雅虎第一条搜索结果的重合率居中,为 9.20%。 通过和已有的英文搜索引擎重合率测试数据的比较,发现中英文搜索引擎搜索结果重合 率都很低,而且很接近。 本研究的结论是:不同的引擎,不同的结果。搜索引擎搜索结果之间的差异很大,重合 率很低。搜索引擎之间搜索结果重合率降低的趋势在今后一段时间内还会继续。 关键词:搜索引擎,搜索结果重合率,百度,谷歌,中国雅虎 - 1 - Abstract A Study of Results Overlap and Uniqueness among Major Chinese Web Search Engine Wang Yiming, Liu Fei (Department of Information management, Peking University, Beijing 100871) Abstract: Based on a large number of queries, this study is to measure the overlap and differences among search results across three most popular Chinese web search engines, which are Baidu, G and Y. The set of randomly sele

文档评论(0)

fkh4608 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档