信息检索导论要点解析.pptVIP

  1. 1、本文档共97页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * 电子政务 首长办公系统 自动汇总来自各下属部门的文件,并提取重要内容提供给领导阅读 政务自动咨询系统 市民通过互联网,以问答的方式咨询政府的政策和办事流程等 投诉自动汇总分析系统 将市民的投诉自动分类汇总,以资政府决策 行政简报自动编写系统 定期自动编写简报,在政府部门内交流 * 远程教育 自动答疑系统 用户远程提问,系统根据用户的问题收集教材中的相关内容,汇总后提供给用户 学生情况调查分析 根据学生的提问情况,自动分析学生的主要问题所在,以便对症下药地改进教学内容 * 移动计算 短信定制服务 包括新闻、股市资讯等 短信汇总服务 电视台或广播电台常常提供在线的短信参与活动,大量短信发送到电视台需要及时地分类汇总,以便主持人作出反应,比如概括出大多数用户最关心的问题等。 * 军事情报 国外军事情报的跟踪汇总 重点针对国外互联网进行过滤跟踪,对重要资料进行分析汇总,辅助军事决策 国内军事情报的反泄露 发现和拦截泄露军事情报的邮件 隐藏于普通文本中的军事情报的过滤技术 文本水印 * 小结 介绍了信息检索的定义以及与相关领域的区别与联系 介绍了信息检索的体系结构 介绍了信息检索的难点与发展趋势 * 谢谢大家! * * * * * * * * * * * * * * * * * * * * * * * * * 社交网络实时搜索 * 社交网络实时搜索 即时通讯,是微博客的典型应用 它允许用户将自己的最新动态和想法以短信息的形式发送给手机和个性化网站群,而不仅仅是发送给个人 2006年,博客技术先驱创始人埃文·威廉姆斯(Evan Williams)创建的新兴公司Obvious推出了Twitter服务 国外:Facebook, Twitter 国内:人人网,新浪、腾讯、网易微博等 * 垂直搜索 垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。 垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索…… 几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎 * 垂直搜索 垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了一系席之地,比如象股票、天气、新闻等类的搜索引擎,具有很高的针对性,用户对查询结果的满意度较高 Google宗旨是尽快让用户离开google,垂直搜索应该是粘住用户 方式的变化,检索方法没有质的变化 * 服务模式 由单一向综合过渡 Google的gtalk,gmail MSN的搜索等 由通用到专业 垂直搜索 由竞价排名到封口费 一定程度上影响搜索引擎的公正性 * IR面临的挑战 * Web 搜索的事实是怎样的? 短的query 英文: 2.35 words (Altavista, 1998) 中文: 3.55 chars (1999) 偏精确率的检索 用户常常浏览第一页的结果 * 每个用户的查询次数: 数据来源:网络指南针,10,2439个用户,81,0386个查询 * 每个用户查询的网页: * 每个查询的词数: * 可以看到: Query Document Similarity A huge number of pages with matched query terms on the Web Query = “information retrieval” 经过文本相似度计算获得的排序对于短Query有些力不从心,导致检索结果不尽人意 * 短 Query 检索 Query Document Query Space Doc Space Similarity Query = “information retrieval” * 用户需求 文档的权威性 Query Document Query Space Doc Space Similarity Concept: “IR book “ “IR systems”, “SIGIR Web sites” Authority: Query = “information retrieval” Representative IR book * 解决方案:智能信息检索 考虑词汇的意义(meaning) 考虑词汇的顺序(order) 根据直接或间接的反馈适应用户的需求 考虑信息来源的权威性(authority) * 检索结果的呈现 检索结果的表现 Web 检索结果是很长的列表,用户很难在概念层浏览结果 检索结果分门别类 信息进一步优化 间接消歧 * 检索结果

文档评论(0)

奇缘之旅 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档