基于词词关联矩阵改进的模糊检索研究-图书情报工作.PDF

基于词词关联矩阵改进的模糊检索研究-图书情报工作.PDF

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于词词关联矩阵改进的模糊检索研究-图书情报工作.PDF

第57卷 第21期 2013年11月 基于词词关联矩阵改进的模糊检索研究   ———模糊语词转模糊概念检索方法探究 ■ 李纲 叶光辉 [摘 要]语义网的发展为模糊语词转模糊概念检索提供了可能,鉴于词表在模糊检索系统中的主导地 位,实现模糊概念检索必须先完成词表向本体的转换。在综合分析和评价已有转换方法的基础之上,提出综合 转换法。该方法继承间接转换法规范的概念抽取及关联设计规则,又通过综合评议和词信息量、词间关联度、 文档频率等参数的算法设计改变了直接转换法过于程式化的处理方式。最终将词词关联矩阵转换为概念矩 阵,叙词表升级为本体库,并在现有检索算法的基础上设置了检索原子与概念的映射关系,以实现概念检索。 [关键词]概念检索 本体 词间关联度 词信息量 [分类号]G350 1 引 言 是语义搜索实现的基础。模糊语词检索的实现很大程 度上依赖于词表系统,包括自构造词表和叙词表。在   2000年 12月 18日,WWW的创始人 T.Berners? 《基于词词关联矩阵改进的模糊检索研究(一)———模 Lee在XML2000的会议上提出语义网概念,并预言 糊集合检索系统中词词关联矩阵构造的策略和时机选 WWW未来将朝着语义网方向发展。紧接着在2001 择》(以下简称文章(一))中,笔者叙述了自构造词表 [1] 年,T.BernersLee等 阐述了语义网的体系结构,从理 ? [3] 构造的策略和时机选择 ;在文章(二)中,笔者引入 论上论证了实现语义网的可行性。语义网作为一个全 外部对象———叙词表,对模糊检索现有算法进行了改 新的事物,自诞生之初就获得了广泛关注,相关实践工 [2] 进 。综合图1也可知,词表的作用范围贯穿整个检 作率先在信息检索领域展开,目前已经有多款语义搜 索过程,既(自构造词表)构造了算法处理环境,又(叙 索引擎上线运行,例如 iGule.com、Yebol.com、hakia. 词表)控制了算法处理程式。 com、sensebot.com等。   对比语义本体和模糊系统词表(本文认定自构造   在《基于词词关联矩阵改进的模糊检索研究 词表是仅具有相关关系的特殊叙词表[4]),二者在各自 (二)———叙词表控制下词间关联度的改进算法》(以下 简称文章(二))一文结尾,夏立新等陈述了改进算法的 检索系统中扮演着相似的角色。组织信息时,它们起 不足,并指出未来研究将更多地关注模糊语词转模糊概 着揭示、描述资源以及资源间联系的作用。检索信息 [2] 时,作为工具,二者又都有着提升系统检索效率的功 念检索的方法 ,从而完成词表进阶三部曲(见图1)。 上述语义网理论及实践成果为本文的研究提供了思路。 用。长久以来,检索平台大都使用叙词表来辅助检索, 原因在于叙词表汲取并集中展现了过往主题法和分类 法的优点:选词规范准确、词间关系控制得当、科学性

文档评论(0)

尐丶丑 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档