- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
为什么要学习信息检索课程情况
中科院研究生院2011年度秋季课程 * 介绍一本有趣的书! 中科院研究生院2011年度秋季课程 * 核心层次:搜索是未来操作系统的重要组成部分! 提纲 * 什么是信息检索? 为什么要学习信息检索? 课程情况 课程的宗旨 了解信息检索的基础知识 实现信息检索相关一些小系统 加强学生动手能力 * 课程基础 计算机基础 算法和数据结构 编程 * QA 有什么问题? * * * 这是完整系统示意图。我们这门课以实验为主,只会涉及到其中一部分。最终目的是构建一个支持简单查询的搜索系统。 * 那么,在实际上,IR可以用于哪些应用呢?从国家层面的需求来说,IR广泛地用于。。。。。从企业层面的需求来看,IR广泛地用于搜索、推荐、挖掘类应用。 * 不同规模检索关注的问题。个人:不同文档的分析,CPU资源共享。企业级:权限。Web:分布式。 * 技术、冷静 * 信息检索综合课程设计第0讲:课程介绍 主讲人:陈文亮 苏州大学计算机学院 2016年2-6月 自我介绍 姓名:陈文亮 电子邮件:wlchen@ 个人主页:/wlchen/ 课程主页: /wlchen/ir2016/ 隶属单位:苏州大学计算机学院 学生情况调查 修过的计算机程序设计课程? C/C++语言? Java? 会写程序? 写过多大规模的程序? 联系人信息:班长或学习委员 全班同学学号、姓名、邮件地址 学习目的 学习信息检索基础知识 动手构建一些小系统 拿到本门课学分 计分方式 * 实验作业:70分(可能会酌情调整) 小作业3个*10分=30分 大作业2个*20分=40分 平时出勤、回答问题等:10分 不能迟到、早退,特殊情况必须请假,并带辅导员签字的假条; 点名时,如果发现名单上没有你的名字,及时提出;(选修课的名单有时候会变) 作业完成非常好的同学可以告诉我,特殊对待。 期末小测验:20分 考察课程相关的基础知识 提纲 * 什么是信息检索? 为什么要学习信息检索? 课程情况 提纲 * 什么是信息检索? 为什么要学习信息检索? 课程情况 什么是信息检索 现场问答 来几个互联网应用例子…… * 你们来之前 什么是信息检索? 我得先调查一下,免得被蒙了。 接着 信息检索挺有趣的哈! 先整件衣服吧,有点冷! 接着 其实我还缺个女朋友! 中科院研究生院2011年度秋季课程 * 三个应用例子的共同特征 给定需求(或者是对象),从信息库中找出与之最匹配的信息(或对象) Google/百度的例子:需求 “信息检索” 淘宝的例子:对象 “男士西服” 世纪佳缘网的例子: 对象 “女朋友”! * 信息检索 给定用户需求返回满足该需求信息的一门学科。通常涉及信息的获取、存储、组织和访问。 从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用户信息需求的资料(通常是文档)的过程。 “找对象”的学科,即定义并计算某种匹配“相似度”的学科。 * * 完整的搜索系统示意图 * 信息检索技术的应用 * 搜索 推荐 挖掘 IR技术 情报处理 内容安全 舆情分析 信息检索应用系统 搜索系统 Web搜索引擎 IBM Waston问答系统 …… 推荐系统 淘宝网 豆瓣网 当当网 * 从信息规模上分类 个人信息检索:个人相关信息的组织、整理、搜索等。桌面搜索(Desktop Search)、个人信息管理(PIM = Personal Information Management)、个人数字记忆(Personal Digital Memory) 企业级信息检索:在企业内容文档的组织、管理、搜索等。内容管理(Content Management) Web信息检索:在超大规模数据集上的检索。 * 提纲 中科院研究生院2011年度秋季课程 * 什么是信息检索? 为什么要学习信息检索? 课程情况 直接经济效益-能赚钱啊! 世界级牛公司 很多互联网的公司:Google, baidu, … 高市值公司 软件工程师 年薪高 市场发展的需求 用户需要信息检索技术:互联网的信息量太大、噪音太多,寻找所需要的信息非常不容易 公司需要信息检索技术:搜索引擎改变了很多传统的生活方式,Yahoo、Google、Baidu,还有一些公司如Microsoft、Sina、Sohu、Tecent、Netease都加入到这个搜索技术的竞争。不只是搜索引擎才需要信息检索技术,电子商务(如亚马逊网站、阿里巴巴)、社交网(微博、Facebook、twitter、校内网)、数字图书馆、大规模数据分析等都需要信息检索技术 人才的竞争:搜索相关人才人数出现缺口,他们非常抢手,待遇如日中天 是不是泡沫:2000年左右出现的网络泡沫和现在的互联网有什么不同,搜索引擎在其中占什么位置? * 几
您可能关注的文档
- 一般而言我们可以利用以下的复利公式来计算终值.ppt
- 一起来学常用短语 大学英语教学部.doc
- 万法全书.doc
- 万有引力理论的成就 人人通空间.ppt
- 万环境地质调查空间数据库建设.doc
- 三亚东部供水工程.doc
- 三上综合教材总.doc
- 三北地区旱作节水农业的现状与发展对策.doc
- 三台风和地震.ppt
- 三峡大学统一模板 教务管理系统.ppt
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
文档评论(0)