- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息组织复习材料-北大未名bbs
第一章 导言
1、什么是信息组织,信息组织与信息检索的关系
1)信息组织:指根据使用的需要,依据主题内容或特征,对信息资源进行选择、标引、处理、序化,并以适用的方式加以提供的活动。
2)信息组织与信息检索关系:信息组织是信息检索的基础和前提;信息检索是信息组织的目的,是信息组织的反向过程。
2、信息组织的类型;根据对象与特点划分的检索工具类型;两种基本检索途径及其特点。
1)信息组织的类型:
按组织对象分:信息资源、检索工具;
按检索工具处理对象与特点划分:目录、索引、数据库、网络搜索引擎;
按照标识特征和提供的检索途径分:A、文献的外部特征:责任者名、文献名、机构名、出版地、出版社、标准书号、专利号、档案号、文献登录号等,及引文索引法。可以据以查找一种或数种文献;B、主题内容途径:包括:分类法和主题法。使用这类途径检索,不必预先了解文献特征,可直接从主题内容入手进行查找;
按照标识记录方式分:A、资源单元方式:通常以资源的描述记录代表资源进行组织,作为排检依据的检索标识记录被在该资源的描述数据之中(先组);B、标识单元方式:以标识为中心记录资源,一般将一资源的号码记录在在相应标识下,所有的标识排列成为一个系统(后组)。
2)根据对象与特点划分的检索工具类型:
文献目录:以各种类型的文献单元为对象,对其进行揭示、报道的工具。包括:(1)文献收藏目录——以一个或多个文献单位收藏的文献为对象加以揭示;(2)书目——通常以某一领域、地域、或时限内出版的文献为对象进行组织和揭示,也可以根据应用需要编制,为用户提供较为全面的文献信息。
索引:是以文献或文献集合中包括的信息内容为其揭示单元的工具,包括期刊索引、书后索引等;
机读数据库:是由文献资源为对象的机读记录的有组织的集合,是一种依托现代计算机技术、以机读形式建立的检索系统。包括:(1)文献数据库——书目数据库收录文献目录或索引数据;全文库收入文献全文,可进行文本检索;(2)非文献库——包括事实数据、数值数据、图象数据等类型。
网络搜索引擎:是一种以网络信息资源为对象的检索系统,实际上是数据库的一种特殊形式。搜索引擎组织的资源对象:不仅涉及传统的资源类型,还包括各种类型网站、个人主页等网上资源,并可以连接包括聊天室、BBS等各种实时信息资源形式,是对前几种形式的又一次综合和拓展,包括的资源对象种类更多。
3)信息检索的两种基本检索途径及其特点:
以信息资源的外部特征为检索依据,提供从资源形式出发进行检索的途径,常见的这类标识包括:责任者名,题名,机构名等。还有根据引证关系建立的检索途径;
以表达信息资源主题内容的标识为依据,提供从内容角度进行检索的途径。主要有分类法和主题法两种。
3、传统检索系统中对信息资源处理的基本方式。
对信息资源特征进行描述:著录或编写题录。作用是记录信息资源外部特征,确认该资源。
对信息资源的内容进行浓缩:编写内容提要或文摘。作用是使用户能迅速了解其内容,供选择使用。
提供检索点:著者名、标题名称、出版机构名等,分类号和主题词;机械检索系统中,文摘和提要中的语词。作用是确定可检信息,供有序化组织。
4、什么是信息组织的控制语言?
控制语言,是根据信息资源组织和检索的需要制订的信息标识选择和组织的规范。包括:资源描述语言和检索语言。
资源描述语言:以统一、有效的方式记录资源信息、特征。如图书馆的编目规则,元数据规范等。
检索语言:是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,亦称情报检索语言。检索语言由词汇和语法两部分组成。词汇是检索语言的主体,是各种词表,包括分类表或标题表、叙词表等;语法,则是分类标引和主题标引的规则系统,它们规定词汇集的使用方法。
第二章 信息组织原理
1、评价一个信息组织系统应考虑的基本因素
检全率(recall ratio):指通过检索系统检出的与某一检索提问相关的文献数与检索系统中与该提问相关的实有文献总数之比。即检全率=(检出相关文献量/系统相关文献总量)*100%。
检准率(precision ratio):指通过检索系统检出的与某一检索提问相关的文献数与检出文献总数之比,即检准率=(检出相关文献数/检出文献总数)*100%。
系统的及时性:指检索工具能否在较短时间内将信息资源纳入系统。标引处理时间会影响系统的时效。
检索速度:指用户实施检索时获得检索结果所花费的时间。这一指标与系统响应检索提问的速度有关,同时也与信息资源组织是否合理直接有关。
检索的易用性:考察操作是否复杂、检索界面是否友好,以及资源的可获得性。
检索的成本效益:成本效益是指检索系统的成本和效益之比。成本包括,设备费用、标引处理费用、检索运行费用。效益包括,查全、准、信息资源质量、节省时间等。
检全率与检准率之间关系:反向关系。
您可能关注的文档
最近下载
- 思想政治学科教学新论七章 思想政治学科评价论.ppt VIP
- 2025江西南昌青山湖区城市管理和综合执法局招聘工作人员10人笔试参考题库附答案解析.docx VIP
- 04S519:小型排水构筑物.pdf VIP
- GB50017钢结构设计规范.pdf VIP
- 武汉文化投资发展集团有限公司招聘5名工作人员笔试备考试题及答案解析.docx VIP
- 2023全钒液流电池可靠性评价方法.pdf VIP
- [乐高LEGO 9686动力机械]第14课 摩天轮.pdf VIP
- 英语视听说4英语视听说IV教学大纲.pdf VIP
- 基根-《全球营销(第8版)》英文教辅-第4章.pptx VIP
- 基根-《全球营销(第8版)》英文教辅-第3章.pptx VIP
文档评论(0)