为什么要学习信息检索课程情况-苏州大学人类语言技术研究所.PPT

为什么要学习信息检索课程情况-苏州大学人类语言技术研究所.PPT

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
为什么要学习信息检索课程情况-苏州大学人类语言技术研究所

中科院研究生院2011年度秋季课程 * 介绍一本有趣的书! 中科院研究生院2011年度秋季课程 * 核心层次:搜索是未来操作系统的重要组成部分! 提纲 * 什么是信息检索? 为什么要学习信息检索? 课程情况 课程的宗旨 了解信息检索的基础知识 实现信息检索相关一些小系统 加强学生动手能力 * 课程基础 计算机基础 算法和数据结构 编程 * QA 有什么问题? * * * 这是完整系统示意图。我们这门课以实验为主,只会涉及到其中一部分。最终目的是构建一个支持简单查询的搜索系统。 * 那么,在实际上,IR可以用于哪些应用呢?从国家层面的需求来说,IR广泛地用于。。。。。从企业层面的需求来看,IR广泛地用于搜索、推荐、挖掘类应用。 * 不同规模检索关注的问题。个人:不同文档的分析,CPU资源共享。企业级:权限。Web:分布式。 * 技术、冷静 * 信息检索综合课程设计 第0讲:课程介绍 主讲人:陈文亮 苏州大学计算机学院 2016年2-6月 自我介绍 姓名:陈文亮 电子邮件:wlchen@ 个人主页:/wlchen/ 课程主页: /wlchen/ir2016/ 隶属单位:苏州大学计算机学院 学生情况调查 修过的计算机程序设计课程? C/C++语言? Java? 会写程序? 写过多大规模的程序? 联系人信息:班长或学习委员 全班同学学号、姓名、邮件地址 学习目的 学习信息检索基础知识 动手构建一些小系统 拿到本门课学分 计分方式 * 实验作业:70分(可能会酌情调整) 小作业3个*10分=30分 大作业2个*20分=40分 平时出勤、回答问题等:10分 不能迟到、早退,特殊情况必须请假,并带辅导员签字的假条; 点名时,如果发现名单上没有你的名字,及时提出;(选修课的名单有时候会变) 作业完成非常好的同学可以告诉我,特殊对待。 期末小测验:20分 考察课程相关的基础知识 提纲 * 什么是信息检索? 为什么要学习信息检索? 课程情况 提纲 * 什么是信息检索? 为什么要学习信息检索? 课程情况 什么是信息检索 现场问答 来几个互联网应用例子…… * 你们来之前 什么是信息检索? 我得先调查一下,免得被蒙了。 接着 信息检索挺有趣的哈! 先整件衣服吧,有点冷! 接着 其实我还缺个女朋友! 中科院研究生院2011年度秋季课程 * 三个应用例子的共同特征 给定需求(或者是对象),从信息库中找出与之最匹配的信息(或对象) Google/百度的例子:需求 “信息检索” 淘宝的例子:对象 “男士西服” 世纪佳缘网的例子: 对象 “女朋友”! * 信息检索 给定用户需求返回满足该需求信息的一门学科。通常涉及信息的获取、存储、组织和访问。 从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。 “找对象”的学科,即定义并计算某种匹配“相似度”的学科。 * * 完整的搜索系统示意图 * 信息检索技术的应用 * 搜索 推荐 挖掘 IR技术 情报处理 内容安全 舆情分析 信息检索应用系统 搜索系统 Web搜索引擎 IBM Waston问答系统 …… 推荐系统 淘宝网 豆瓣网 当当网 * 从信息规模上分类 个人信息检索:个人相关信息的组织、整理、搜索等。桌面搜索(Desktop Search)、个人信息管理(PIM = Personal Information Management)、个人数字记忆(Personal Digital Memory) 企业级信息检索:在企业内容文档的组织、管理、搜索等。内容管理(Content Management) Web信息检索:在超大规模数据集上的检索。 * 提纲 中科院研究生院2011年度秋季课程 * 什么是信息检索? 为什么要学习信息检索? 课程情况 直接经济效益-能赚钱啊! 世界级牛公司 很多互联网的公司:Google, baidu, … 高市值公司 软件工程师 年薪高 市场发展的需求 用户需要信息检索技术:互联网的信息量太大、噪音太多,寻找所需要的信息非常不容易 公司需要信息检索技术:搜索引擎改变了很多传统的生活方式,Yahoo、Google、Baidu,还有一些公司如Microsoft、Sina、Sohu、Tecent、Netease都加入到这个搜索技术的竞争。不只是搜索引擎才需要信息检索技术,电子商务(如亚马逊网站、阿里巴巴)、社交网(微博、Facebook、twitter、校内网)、数字图书馆、大规模数据分析等都需要信息检索技术 人才的竞争:搜索相关人才人数出现缺口,他们非常抢手,待遇如日中天 是不是泡沫:2000年左右出现的网络泡沫和现在的互联网有什么不同,搜索引擎在其中占什么位置? * 几

文档评论(0)

zhuwo + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档