现代信息检索.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
现代信息检索 课程总结2 课程核心内容 检索理论 IR模型的形式化表示和类型,经典模型 检索语言,互操作,自然语言、本体论 文本检索 经典、现代文本处理和全文文本处理,分类和聚合 网络检索 网络检索、 PageRank和HITS算法 信息自动处理和系统评价 可视化、自动文摘、评价 多媒体检索 模型与语言,标引与检索,并行于分布式检索 数字图书馆 OPAC,文献模型、表达与存取,元数据,查新及数据库检索技能 课程总结4 研究历史和现状 1948年C. N. Mooers在其MIT硕士论文中第一次使用了“Information Retrieval”这个术语 1960-70年代在建立文摘检索系统中,产生了布尔模型(Boolean Model)、向量空间模型(Vector Space Model)和概率检索模型(Probabilistic Model) 1980年代出现商用数据库检索系统:Dialog,ORBIT, MEDLINE 1990’s第一个网络搜索工具:1990年加拿大蒙特利尔大学开发的FTP搜索工具Archie 课程总结5 研究历史和现状 第一个WEB搜索引擎: 1994年美国CMU开发的Lycos 1995斯坦福大学博士生开发Yahoo 1998斯坦福大学博士生开发的Google,提出PageRank计算公式 1998年基于语言模型的IR模型提出 1990年代推荐系统的出现:Ringo,Amazon,NetPerceptions 文本分类和聚类的使用、信息抽取:Whizbang 课程总结6 研究历史和现状 2000’s的重要事件 文本检索会议TREC(Text Retrieval Conference )的发展 问答系统评测专项Q/A track(Question Answering Track) 2001年,百度成立 2000’s以来的其他重要事件 多媒体IR,Image,Video,Audio and music 跨语言IR,DARPA Tides,文本摘要,DUC评测 国际著名研究机构和代表人物 美国康奈尔大学Salton(1927-1995) 现代信息检索的奠基人 SMART的完成人 第一任Salton奖得主,ACM Fellow 英国剑桥大学SparckJones (1935-2007) 概率检索模型的提出者之一 NLP和IR中的先辈 曾获ACL终身成就奖和Salton奖 国际著名研究机构和代表人物 美国UMassCIIR W. B. Croft,ACM Fellow 基于统计语言建模IR模型的提出者和倡导者 和CMU共同开发了Lemur工具 Salton奖得主 英国Glasgow大学Rijsbergen,ACM Fellow 信息检索逻辑推理学派的提出者和倡导者 现在试图用量子物理的方法解决IR问题 Salton奖得主 英国微软剑桥研究院、伦敦城市大学Robertson 概率检索模型的倡导者 开发了OKAPI Salton奖得主 国际著名研究机构和代表人物 美国CMU 美国UIUC 微软研究院 IBM研究院 Google研究院 一些活跃的华裔学者 加拿大蒙特利尔大学聂建云教授 跨语言检索 IR模型 美国UIUC ChengxiangZhai博士 IR模型 美国CMU YimingYang教授 文本分类 台湾中研院简立峰 号称“中文搜索”第一人 加入Google研究院 国内活跃的研究机构 软件端 北京大学,复旦大学,清华大学,哈尔滨工业大学,中科院计算所,中科院软件所,中科院自动化所 应用端 武汉大学,南京大学,北京大学 武汉大学信息管理学院 网络信息检索、情报检索模型理论、信息过滤、 文本知识的自动分类 中山大学信息管理系 网络信息过滤 南京大学信息管理系 文本信息检索 清华大学计算机科学与技术系 文本自动分类,自动文摘 复旦大学计算机系 文本过滤、音频视频检索 中国科学院计算技术研究所 文本自动分类、文本检索、知识网格 北京大学信息管理系 图像检索、文本检索 南京农业大学信息管理系 中文信息自动分类 一些重要的会议 国际会议: SIGIR、ACL、WWW、SIGKDD CIKM、ICML TREC AIRS 国内会议: 全国信息检索及内容安全学术会议(2年一届) 全国计算语言学联合会议(2年一届) 检索模型 布尔模型 基于集合论和布尔代数,适用于普通用户,核心是二值相关,不能进行相关性排序 向量空间模型 以向量表示提问和文档,向量计算在后台进行,与用户无关,优点是可以进行相关性排序,也可产生文档文摘 概率模型

文档评论(0)

beoes + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档