从SIGIR看信息检索技术的.pptVIP

  • 2
  • 0
  • 约5.49千字
  • 约 28页
  • 2017-06-11 发布于四川
  • 举报
从SIGIR看信息检索技术的 过去与未来 马少平,张敏 清华大学计算机系; 智能技术与系统国家重点实验室 2007年3月10日,海口 缘起 过去三十五年中,我们在信息检索的路上走了多远? 在IR舞台上,什么是长盛不衰的? 哪些已经渐渐谢幕? 哪些即将登场? SIGIR 1971~2006年所有正式论文 主要内容 检索模型的发展 关键技术 检索任务的演变 人机交互与用户分析 信息检索的评价 信息检索中的自然语言处理 更多思考与讨论 检索模型的发展 信息检索模型 从一开始就沿两条路发展 来源于结构化数据处理的灵感 E.g. 数据库 直接从自由文本处理的角度 IR models 自由文本模型——三个阶段 向量空间模型 ——80年代初的重点 概率模型 -- 80年代末兴起,90年代逐渐成为主流 基于语言模型的检索 -- 1998年,里程碑 更多模型 -- 近两三年开始,标志IR进入新的阶段 关键技术 关键技术 实现 早期 倒排索引的提出与研究 2000后 大规模检索 最近 垃圾 … 走出实验室 面向海量数据、实时处理、真实网络环境… 关键技术 相关反馈 经久不衰的话题 3个阶段 早期 建立反馈机制 90年代中 CBIR 最近 区分不同主题 区分不同词 关键技术 集中式不能满足要求 分布式系统架构 3个阶段 早期: 通用系统设计 90年代中 分布式 大规模 扩展性、效率 最近

文档评论(0)

1亿VIP精品文档

相关文档