- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主题语言 主题语言就是对表达信息主题内容特征的主题词汇概念经过规范化处理所形成的检索语言。 由于主题词汇表达概念准确,所以主题途径是检索信息的主要途径。主题词汇按一定规则有机构成主题词表,词表通过参照系统灵活揭示词汇之间的关系,所以主题词表又是检索系统标识和用户检索时的重要参考工具。主题词语按照主题性质的不同,又分为标题词语言、单元词语言、关键词语言和引文语言。 《汉语主题词表》 《汉语主题词表》是我国一部具有多学科检索语言的一部综合性大型叙词表,1979年作为“汉字信息处理系统”的配套项目而编制。这是一种将自然语言转换为检索语言的叙词工具。收词范围包括社会科学和自然科学有关各专业词汇 108,568个(其中主题词91158个、非正式主题词7410个族词3707个);共3卷、10分册。第一卷社会科学;第二卷自然科学; 第三卷索引。社会科学卷第一分册·主表; 第二分册·索引。共收社会科学方面的主题?30455个,分成886个词族。各卷内容均包括字顺表、词族表、范畴表、附表和索引等5部分。 当当图书、搜索引擎 1.4 信息检索技术 布尔检索 加权检索 全文检索 多媒体检索 智能检索 跨语言检索平台 布尔检索 检索实例一 Google高级检索 加权检索 加权检索是某些检索系统中提供的一种定量检索技术。 加权检索的基本方法是:在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和。权值之和达到或超过预先给定的阈值,该记录即为命中记录。 w=知识管理(4)竞争情报(2)企业文化(1) 文档号 包含的提问词 权和 知识管理 竞争情报 企业文化 1 √ √ √ 7 2 √ √ 6 3 √ 4 4 √ √ 5 5 √ 2 6 √ 1 当检索时的阀值确定为4时,则1、2、3、4为命中文献。 全文检索 一种将文件中所有文本与检索项匹配的文字资料检索方法。 全文检索是计算机程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置。当用户查询时根据建立的索引查找,类似于通过字典的检索字表查字的过程。全文检索系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。 实现全文检索的实例 Word的查找功能;CAJ7.0的查找功能都实现了全文检索;知网也提供全文检索功能 超文本检索 超文本检索不仅仅是一种信息检索技术,更是一种信息的组织结构。它把相关信息通过链接方式关联在一起,确定浏览和阅读信息时,可以顺着超链“跳跃”阅读信息。 超文本检索实例 多媒体检索 基于内容的图像检索:它是根据分析图像的内容,提取其颜色、形状、纹理,以及对象空间关系等信息,建立图像的特征索引。目前有的图像检索系统有IBM Almaden研究中心开发的、由MIT的媒体实验室开发研制的Photobook等。 基于内容的视频信息检索是当前多媒体数据库发展的一个重要研究领域,它通过对非结构化的视频数据进行结构化分析和处理,采用视频分割技术,将连续的视频流划分为具有特定语义的视频片段——镜头,作为检索的基本单元。如卡内基·梅隆大学的informedia数字视频图书馆系统。 基于内容的音频检索,必须从音频数据中提取听觉特征信息。IBM的Via Voice、剑桥大学的VMR系统。 如百度的mp3,视频、图片检索等 智能检索 计算型知识引擎 这一名为WOLEFRAM ALPHA简称WA)的搜索引擎由英国科学家斯蒂芬·沃尔弗拉姆和他的团队开发。与常见搜索引擎不同的是,WA系统自带10万亿条信息的数据库,还存有5万种多算法和模型,能对需要搜索的内容进行计算,给出具体答案而不是提供相关链接。普通搜索引擎只提供网络上存在的内容,而这种新引擎能通过计算,给出以前没有出现过的答案。 例如,如果使用者在搜索框中输入:委内瑞拉的首都是哪儿?得到的答案不仅仅是加拉加斯,还包括地图、城市人口、现在的当地时间、天气实况等一系列数据。如果在谷歌输入同样内容,返回的结果是超过3000万个网页链接。 又比如,如果输入:巴黎哪一天能看到下一次日全食?网站会给出答案:2090年9月23日。 要是敲入:2001年9月11日那天布兰妮·斯皮尔斯多大年龄?WA会显示:19岁9个月9天。 跨语言检索 跨语言信息检索(cross language information retrieval, CLIR)是指用某一种语言提出检索要求,计算机在其他不同语种的文本中进行自动搜索,得到的检索结果甚至可以翻译成用户指定的特定语种。 跨语言信息检索结合了传统文本信息检索技术和机器翻译(machine translation, MT)技术。在当今信息社会中,跨语言信息检索已成为世界范围
您可能关注的文档
最近下载
- 《射频识别技术原理与应用实战》全套教学课件.pptx
- 羊的同期发情技术.pptx VIP
- T-CAGHP 035—2018地质灾害排水治理工程设计规范(试行).docx VIP
- 第二批重点监管危险化学品名录.doc VIP
- 劳技课件教学课件.pptx VIP
- Unit 1 I love sports Part 1 (课件)2025-2026学年度外研版(三起)英语四年级上册.pptx VIP
- DBJ43_T393-2022:湖南省房屋建筑和市政工程消防质量控制技术标准.pdf VIP
- 2024年-2025年政工师(初级)理论考试题库及答案(综合题型).pdf VIP
- T∕ZZB 0900-2018 液晶调光玻璃团体标准.pdf VIP
- 朗朗阅读周周练四年级上册(1).pdf VIP
文档评论(0)