- 1、本文档共36页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究生中文数据库信息检索实例的教程
中文数据库信息检索 主讲:许忠锡 xuzhongxi28@ 信息检索系统基础知识 信息检索系统的核心和概括,主要由文献信息资源库和资源索引构成。 文献信息资源库:即文献信息资源描述体序列,由文献信息资源描述体按照一定的描述规则描述信息资源以及一定的顺序对信息资源排列组成文献信息资源集合。 文献信息资源索引:即文献信息资源标识序列,由文献信息资源的标引标识按一定顺序排列而组成的集合。检索的实现就依赖于此。 构成信息检索系统的条件 为能实施信息检索,信息检索系统必须具备如下条件:(1) 详细描述与著录文献信息资源的外部与内容特征;(2) 具有既定的检索标识,可以是检索点中任何内容,作为检索标识;(3) 依据已经描述出的信息资源的标识,对信息资源进行科学合理的排列,形成文献信息资源库;(4) 依据信息资源的描述结果与检索点,提供各种检索途径。 检索语言的种类 检索语言主要有外表特征语言、内容特征语言两大种类。 1.外表特征检索语言从信息表现出的外在特点对信息资源进行描述,从外表途径对信息资源进行组织。用户从所能感知到的信息资源外在特征,进行信息的检索。 2.内容特征检索语言主要从信息的内容着手,对信息资源、文献信息内在的内容特征进行描述,对信息资源、文献信息从内容角度上进行组织。用户从所需信息的内容入手,用内容特征检索语言表达信息内容特征概念,形成内容特征的检索策略,并实施从信息内容特征为途径的信息检索。 1. 分类语言 其中最为常见的是等级体系型分类语言。就其对信息组织的功能而言,体系分类语言被应用对信息所含学科内容特征的组织。体系分类语言在计算机检索系统里,形成数据库中的分类检索途径的倒排文档。2. 主题语言 其中常用的有标题词语言、叙词语言、关键词语言。主题语言可以用来进行信息主题内容的组织,形成信息主题索引等。在计算机检索系统里,形成数据库中主题检索途径的倒排文档。 主题语言的种类1. 标题词: 所谓标题词,是指经过词汇控制、经过规范化处理的名词术语等自然语言,用来标引与检索文献信息的词或词组。标题词语言是一种先组配式语言。 2. 叙词: 叙词是指经过规范化处理的,以基本概念为基础的自然语言,用来标引与检索文献信息的词或部分词组。叙词语言是一种后组式语言。3. 关键词: 关键词,是指那些出现在文献信息的标题、摘要、正文中,对描述文献信息主题内容具有实质意义的词语,亦即对提示和描述信息主题内容是重要的、带关键性的词语。关键词基本上不作规范化处理,或者仅是极少量的规范化处理。 信息检索过程1.确定信息检索的途径 检索途径是用户与检索系统建立联系的中介,检索途径也称为检索点、检索入口。检索途径一般分为反映信息内容特征的途径与反映信息资源外表特征的途径。内容特征检索途径分类途径 信息组织原理中,给信息资源标引上分类标识,产生信息资源的特征点。利用这样的特征点进行信息检索,就是分类途径检索。利用分类途径检索时,能够检索到的信息都是属于这个学科,所以是学科族性检索。主题途径 信息组织原理中,给信息资源标引上主题标识,产生信息资源的特征点与检索入口点。利用这样的特征点与入口点进行信息检索,就是主题途径检索。在利用主题途径检索时,能够检索到的信息都是属于这个主题内容的,所以主题途径检索是特性性检索。 外表特征检索途径1. 著者途径2. 题名途径3. 序号途径4. 引文途径5. 其他途径各类检索途径的组合选择 但在实施信息检索时,特别是在计算机检索系统中,往往将两种检索途径结合使用,其检索效果表现更加良好。1. 内容特征结合外表特征的扩大检索2. 外表特征结合内容特征的扩大检索 2.确定检索的限制条件目的是优化检索结果。检索条件一般有:(1)受检信息的时间限制。(2)检索词匹配方式限制。一般在中文计算机检索系统中常有对检索提问标识词匹配上的限制条件,即所谓检索词的精确匹配与模糊匹配。 外文检索系统中还有“”、{}、(W)、(N)、?等检索词匹配算符的应用,其主要目的也都是为了扩大、缩小检索范围,提高检索的效率。(3)受检信息查询范围限制。(4)受检信息语种与地区限制。(5)输出信息排序限制。 3. 制定检索策略 所谓检索策略就是检索前制定的检索概念组配和执行顺序的方案,检索策略更是表达用户具体的检索思想与检索要求。4. 实施具体的检索 完成以上各步之后,就可以使用检索系统或工具进
您可能关注的文档
- 的自然和人文环境特征3联系我国的国土整治实际,考查.ppt
- 的管理者素养模型20101013.ppt
- 百度云盘的使用的教程.ppt
- 的设计性实验-药用醋酸总酸度的测定.ppt
- 的设计性试验—半数致死量的测定.ppt
- 的设计的可持续进展.ppt
- 的说明文复习的说明文的语言.ppt
- 的设计性试验—音频测量演示课件.ppt
- 的说明方法在写作中的运用.ppt
- 的说明文的语言表达.ppt
- 年三年级数学下册第三四单元过关检测卷新人教版.docx
- 第十三章轴对称(复习课)1.ppt
- 15.1.2分式基本性质(2).ppt
- 期末冲刺(补全对话30道).docx
- 【华创证券-2025研报】2025年二季报公募基金十大重仓股持仓分析.pdf
- 【港交所-2025研报】景福集团 截至2025年3月31日止年度年报.pdf
- 【天风证券-2025研报】2025中报前瞻:关注预告日至财报日的景气超额.pdf
- 【国金证券-2025研报】连连数字(02598):跨境支付先行者,前瞻布局虚拟资产.pdf
- 【第一上海证券-2025研报】云工场(02512):云工(02512):IDC方案服务商,边缘云业务打造第二成长曲线.pdf
- 【东方证券-2025研报】主动权益基金2025年二季报全解析:重点关注科技医药双主线和中小盘高成长主题基金.pdf
文档评论(0)