- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎效果自动评价-北京大学网络与信息系统研究所
基于用户群体行为分析的搜索引擎自动性能评价 清华大学智能技术与系统国家重点实验室 马少平 2008年4月12日,南昌 提纲 研究背景 信息检索系统的评价方法 基于用户行为分析的搜索引擎性能评价 演示系统:搜索仪 结论与未来工作 研究背景 Web的发展带来了什么? 信息量的急剧增长 1994年,面向个人用户的浏览服务诞生 2002年,Web上所存储的数据超过500,000 TB 知识的获取空前简单与繁荣 “在信息化时代,知识实际上已经不是资源,智慧才是资源。” 从Web中有效的获取知识成为人们的必需技能 高科技企业员工1/3的时间用于查找资料 研究背景 网络信息检索工具成为人们生活和工作中的重要信息获取手段 全球范围内84%的互联网用户使用搜索引擎,其中超过一半的人几乎每天使用。 2007年1月,我国网民总人数为13700万人。 95%以上的中国网民使用过搜索引擎,84.5%的用户将搜索引擎作为得知新网站的主要途径。 商用搜索引擎竞争日趋激烈。 研究背景 性能评价对搜索引擎的重要作用 对搜索引擎用户而言: 挑选最有利于获取信息的手段 对搜索引擎工程师而言: 算法及数据处理方式有效性的判断 对搜索引擎广告商而言: 挑选最有效的广告投放手段 研究背景 搜索引擎评价的考察方式 搜索引擎作为网络服务供应商的属性 形式:用户问卷调查 举例:CNNIC中国搜索引擎市场调查报告 搜索引擎作为网络信息检索工具的属性 形式:传统的信息检索评价方法在网络环境中的应用。 举例:TREC VLC/Web/Terabyte track,SEWM评测等 提纲 研究背景 信息检索系统的评价方法 基于用户行为分析的搜索引擎性能评价 演示系统:搜索仪 结论与未来工作 信息检索系统的评价方法 评价在信息检索研究中发挥着重要的作用 评价在信息检索系统的研发中一直处于核心的地位,以致于算法与其效果评价方式是合二为一的(Saracevic, SIGIR 1995) 信息检索系统评价的起源 Kent等人第一次提出了关于Precision和Recall(开始称为relevance)的概念(Kent, 1955) 信息检索系统的评价方法 信息检索系统评价的起源(续) Cranfield-like evaluation methodology Cranfield在上世纪伍十年代末到六十年代初提出了基于查询样例集、标准答案集和语料库的评测方案,被称为IR评价的“grand-daddy” 确立了评价在信息检索研究中的核心地位 Gerard Salton 与 SMART 系统 Sparck-Jones 的著作 “Information retrieval experiment” 在线:/iaui/894.02/projects/irlib/ 信息检索系统的评价方法 网络信息检索系统效果评价的现状 数据对象繁杂,标注困难 Voorhees 估计,对一个规模为800万的文档集合进行针对1个查询主题的相关性评判需要耗费1名标注人员9个月的工作时间 TREC提出pooling方法,在保证评价结果可靠性的基础上大大减少了评判工作量 缺点:处理的查询数目少,针对小规模的查询集合,仍需要耗费十余名标注人员1-2个月的工作时间 提高搜索引擎评价方法的自动化程度势在必行 信息检索系统的评价方法 如何提高搜索引擎评价的自动化程度? 信息检索系统的评价方法 核心问题: 如何提高答案标注的自动化程度 利用伪相关反馈的方法进行结果自动标注 伪相关反馈的结果被认为是答案 Soboroff et.al, 2001; Nuray et.al, 2003; Beitzel et.al., 2003 标注的准确程度和可靠性不高 对查询词的近义词集合进行标注 根据结果网页的查询词及近义词词频进行评判 Amitay et.al, 2004 初始标注工作量大,评判的可靠性不高 信息检索系统的评价方法 核心问题: 如何提高答案标注的自动化程度 利用用户行为分析方法 Joachims et.al.(1997) 创建了一个元搜索接口,将不同搜索引擎的结果加以混杂,把用户点击不同结果的情况加以记录,并以此作为评判依据 用户行为分析的思路值得肯定 缺点:改变用户检索习惯、个体用户行为不可靠等 我们的研究思路 通过对搜索引擎记录下的用户行为日志进行分析,不额外增加用户负担。 使用用户群体,而不是个体的点击行为作为依据 提纲 研究背景 信息检索系统的评价方法 基于用户行为分析的搜索引擎性能评价 演示系统:搜索仪 结论与未来工作 基于用户行为分析的性能评价 总体思路 基于Cranfield方式进行评价 丰富的研究经验:评价指标、查询样例选取策略等 便于与传统的手工标注评价方式进行比较 基于用户关注程度进行查询样例选取 基于用户行为信
您可能关注的文档
- 扫描技术.ppt
- 扫描隧道显微镜-复旦大学物理教学实验中心FudanPhysics.DOC
- 承租香港住宅物业用的地产代理协议表格6供地产代理与租客-EPRC.PDF
- 承认仕样书品名中高压圆板绝缘形陶瓷电容器(安规品CSTYPE).PDF
- 技 术 要 求 一、投标要求: 1、所有设备要求为国产自主品牌,提供三年 .DOC
- 批准00000000000计量认证范围及限制要求-北京市计量检测科学.DOC
- 技术-北京博研信通智能科技有限公司.doc
- 技工学校学生心理辅导.PPT
- 技术公告 - Fike.PDF
- 技术与应用2016.1 广电设备与技术1 - 中国广播电视设备工业协会.PDF
- 初中英语平台学习的有效性研究教学研究课题报告.docx
- 政治课讨论法对学生思维能力的培养教学研究课题报告.docx
- 初中英语写作中的逻辑思维培养策略教学研究课题报告.docx
- 小学生参与社区活动的积极影响教学研究课题报告.docx
- 初中生情绪管理能力的培养方法教学研究课题报告.docx
- 初中生心理健康问题及解决措施研究教学研究课题报告.docx
- 小学生家庭作业有效管理方法研究教学研究课题报告.docx
- 学生评价教师教学的有效性研究教学研究课题报告.docx
- 小学心理健康教育有效策略教学研究课题报告.docx
- 2024-2025学年高中物理选择性必修 第三册人教版(2019)教学设计合集.docx
文档评论(0)