- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文献信息检索与科技论文写作幻灯片
* * 应用篇 原理篇 学科领域 信息检索同时被情报科学领域和计算机科学领域所使用。 情报科学 计算机科学 信息检索 使用文献检索 工具查找资料, 如查询科学引 文数据库等 研究和开发信息检索 算法和软件系统等, 如建立索引方法、 检索结果排序算法等 * * 与信息检索相关的学科(1/3) 信息检索是一门多学科交叉的应用技术学科。 自然语言处理:自然语言处理是利用计算机技术处理语言信息的科学,其目标是让计算机能够“理解”人类的语言——自然语言。对于信息检索来说,仅仅停留在处理表层文本信息是远远不够的,字符层面的匹配与相似度计算并不能帮助计算机理解待检索文本的“含义”,也不能深入理解用户的检索意图,检索出的结果非常有可能偏离用户的需求。要提高检索系统自身的智能化水平,以及检索系统人机交互界面的自然度,就需要不断地将自然语言处理结合到文本信息检索中来。 分布式计算:面对巨大的文本数据、大量的检索请求和用户对于检索时间的苛刻要求,信息检索的效率成为一个亟待解决的问题,依靠单台计算机不可能完成这样的任务,必须依靠分布式信息检索技术才能解决。事实上,几乎所有实用的大型搜索系统都采用了分布式的体系结构来解决信息检索中的效率问题。 * * 与信息检索相关的学科(2/3) 数据库:数据库和信息检索俨然一对姐妹。与信息检索不同,数据库的处理对象是结构化信息。数据库技术已经有比较完备的理论基础,而信息检索技术的经验性比较强,理论基础相对薄弱,需要进一步借鉴数据库中的一些成熟理论。信息检索中的信息抽取技术旨在把非结构化数据转化为结构化数据,以数据库形式存放,这样,一些信息检索问题就可以转化为数据库查询问题了。 数据挖掘:数据挖掘一般是针对数据库进行的,借鉴到信息检索中就成为文本挖掘。面向非结构化数据的文本挖掘,将帮助用户对Internet上庞杂的信息进行综合分析,找出这些信息背后所蕴含的规律和趋势,找出事情的本质,提升搜索技术的内涵。此外,对用户日志进行数据挖掘能够从总体上观察分析用户的行为,也能够针对每个个体用户的需求提供个性化服务。 * * 与信息检索相关的学科(3/3) 情报学:情报学是研究情报的产生、传递、利用规律和用现代化信息技术与手段,使情报流通过程、情报系统保持最佳效能状态的一门科学。它帮助人们充分利用信息技术和手段,提高情报产生、加工、存储、流通、利用的效率。信息检索和情报学有紧密的历史渊源,情报学的理论对信息检索系统的设计仍有指导意义。 社会学:社会学研究社会发展中的现象和规律。随着搜索引擎技术的使用越来越广泛,社会学家通过对众多用户使用搜索引擎的行为(比如浏览了哪些网页,输入了哪些查询词等)进行分析和统计来研究社会心理和行为的状态和趋势,比如时尚流行、语言变化、使用习惯等。 * * * 内 容 提 要 第一讲 信息检索概述 学科领域 信息检索的概念 信息检索的意义 信息检索的基本流程 信息检索的基本方法 信息检索的关键技术 信息检索的应用领域 原理篇 * * 普遍认同的一个定义 信息普遍存在于自然界、人类社会和思维领域中,它是客观世界中各种事物变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。 信息的特性 可识别性。信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。不同的信息源有不同的识别方法。 可存储性。信息是可以通过各种方法存储的。 可扩充性。信息随着时间的变化,将不断扩充。 可压缩性。人们对信息进行加工、整理、概括、归纳就可使之精练,从而浓缩。 可传递性。信息的可传递性是信息的本质特征。 可转换性。信息可以由一种形态转换成另一种形态。 特定范围有效性。信息在特定的范围内是有效的,否则是无效的。 什么是信息 * * 信息资源的类型(1/2) 狭义的信息资源可以被看作是信息本身,所以对信息资源的分类应该与信息的分类基本一致。 按信息的表现形式划分 文献型信息源。是存储语言文字形式信息的各种载体的集合。文献型信息源是目前信息内容最丰富、最可靠的信息, 是人们使用最多的信息源。 非文献型信息源。包括电子信息源(数值型信息源、声像型信息源、多媒体信息源和实物信息源)及口头信息源。 按信息内容的加工程度划分 可分为零次信息源、一次信息源、二次信息源和三次信息源。 * * 信息资源的类型(2/2) 按信息内容的保密程度划分 有公开信息源、半公开信息源和非公开信息源。 按信息内容的应用范围划分 分为科技信息源、经济信息源、管理信息源及生活信息源。 按载体形式划分 印刷型(以纸张为介质, 以铅印、油印、胶印、复印等手段记录信息的载体)、缩微型(以感光材料为介质,以缩微照相为手段记录信息的载体)、机读型(以磁性材料为载体,通过编码和程序设
您可能关注的文档
最近下载
- 附件视频监控存储升级项目要求及参数.doc VIP
- 【高中地理】区域地理:天气与气候,气温及分布规律课时2课件 2023-2024学年高二人教版(2019)地理选择性必修1.pptx VIP
- 2025年安全金融知识题库及答案.docx VIP
- 施工方案管理培训课件.docx VIP
- 【高中地理】区域地理:天气与气候,气温及分布规律课时1课件2023-2024学年高二人教版(2019)地理选择性必修1.pptx VIP
- 全新IMPA船舶物料指南(第7版)电子版.xls VIP
- 东方财富杯金融安全知识题库.docx VIP
- 2025年最新详版征信报告个人信用报告样板模板word格式新版可编辑.docx
- 孙氏太极拳(孙禄堂原著孙剑云整理).pdf VIP
- 车辆抵押借款合同范本协议(2025版).docx VIP
文档评论(0)