- 2
- 0
- 约5.97千字
- 约 43页
- 2016-12-13 发布于江西
- 举报
海量规模网络信息检索评测语料库的设计与实现 智能技术与系统国家重点实验室 刘奕群 马少平 2008年10月 研究背景 多少人在使用搜索引擎 全球范围内84%的互联网用户使用搜索引擎,其中超过一半的人几乎每天使用。 95%以上的中国网民使用过搜索引擎,84.5%的用户将搜索引擎作为得知新网站的主要途径。 商用搜索引擎竞争日趋激烈(市场规模约56亿元)。 从2007年9月开始,中国成为全球首个每月搜索请求超过100亿次的国家 研究背景 搜索引擎与性能评价 对搜索引擎用户:选择最有效获取信息的媒介 对广告商:选择最有效的盈利平台 对研究人员:算法改进、性能监控 效果评价是信息检索相关研究的基础内容 评价在信息检索系统的研发中一直处于核心的地位,以致于算法与它们的效果评价方式是合二为一的。 (Saracevic, 1995) 研究背景 如何对网络信息检索系统进行评价 Cranfield评价方法 被应用在包括TREC在内的几乎所有主流的信息检索研究工作中。 评价组成: 文本语料库,查询样例集,标准答案集 Cranfield评价方式的优势 有效控制系统变量 可以跨系统比较的评价结果 研究背景 网络信息检索评测语料库 建立评测语料库的必要性 信息检索是实证学科 真实规模的评测语料是算法有效性的保证 研究人员独立构建存在困难 海量网络资源抓取 真实用户需求获取 大规模用户查询的
您可能关注的文档
最近下载
- 森林生态课后思考题课后一题答案薛建辉.docx VIP
- 2026年贵州地生中考试卷及答案.docx
- 2025届贵州贵阳初中学业水平考试地理生物试卷真题(含答案)_可搜索.pdf VIP
- 武汉理工大学2022-2023学年《数据结构》期末考试试卷(B卷)附参考答案.docx
- 实名举报信范文【三篇】.docx VIP
- 崩塌·滑坡·泥石流监测规范DZ-T0221--2006.ppt VIP
- 2021电力金具用橡胶技术条件和试验方法.docx VIP
- 2025年德芙巧克力调研报告.docx VIP
- 2025年河北省中职对口升学考试高考英语试卷真题(含答案详解).pdf VIP
- 2025年6月四级真题和答案解析(第1套).docx VIP
原创力文档

文档评论(0)