用同义表达形式来扩充信息检索的查询语句例证研究——对于一种基于语义的搜索方式的若干设想.pdfVIP

用同义表达形式来扩充信息检索的查询语句例证研究——对于一种基于语义的搜索方式的若干设想.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用同义表达形式来扩充信息检索的查询语句例证研究——对于一种基于语义的搜索方式的若干设想.pdf

2∞8 年 5 月 第 2 期 语言文字应用 Applied Linguistics 用同义表达形式来扩充 May ,2∞S No.2 信息检索的查询语旬例证研究祷 一一对于一种基于语义的搜索方式的若干设想 袁毓林 (北京大学中文系/汉语语言学研究中心 北京 1∞871) [摘要]本文首先分析基于关键词的搜索的困难(查询串的表达不忠和表达差异 等) ,说明基于语义的搜索的必要性。接着,尝试通过对意义和意义相同的某种 可操作的限制,来发展一种基于语义的扩充式关键词搜索方式:通过同义表达形式来 抓住查询串的意义,并生成更多的检索串进行并发搜索。最后,规划怎样对汉语有 关的同义表达进行全面深入的研究,并总结出若干识别查询串的同义形式的启发式 规则。 [关键词]基于关键词/语义的搜索;查询串;同义表达形式:启发式规则 [中固分类号 ]H08[文献标识码]A[文章编号 ]1∞3-5397(2∞8 )02-0123-09 An Example-based Study of Expanding Retrieval Query Using Synonymous Expressions: Some Assumptions about Meaning-based Search YUAN Yulin Abstracl:ηlís paper firstly shows the necessity of meaning-based search by analyzing the constraints of keyword-bωed search , i. e. , que巧 strings are unfaithful to 甲ery intention and multiply dive鸣ent expressions are used to express a qu町 intention. Then 出rough setting some technical restrictions on meaning and same meaning , it proposes a meaning-driven and generalized keyword-bωedse缸ch approach : constructing synonymous 回.pressions to capture the meaning of a given 甲町 string and generate multiply qu町 strings for simultaneous search. Finally , it i1lustrates how ωinvestigate the Chinese synon严nous expressions comprehensively , and extract 切me heuristic rules for reco伊izing the s严lonymous forms of a [收稿日期]筑J07 - 11- 19 [作者简介]袁毓林,北京大学中文系教授,主要从事汉语语言学及其应用的研究。 铃本课题的研究得到教育部人文社会科学重大研究项目(批准号 :05110740176)和国家社会科学基金项目 (批准号 :07AYY侃)4)的资助,文中吸收了孙茂松教授的一些想法和例子,谨此一并致以诚挚的谢意。 124 ? 语言文字应用 2∞8 年第 2 期 glVen 甲le町 stnng. Keywords: keyword/ meaning-based search; que巧 strings ; synonymous expressions ; heuristic rules 工作的定位:起越检索串的词汇形式 搜索指在网络环境下,用户在计算机终端上输入一个检索串,来向网络查询自己关心的某 项内容,以获取相关的信息。而搜索引擎系统则通过一定的信息搜集方式(比如,关键词匹配 等) ,采集一批相关的网页或文档返回给用户。其中,检索串主要是自然语言的短语形式,用以 表达用户的查询意图和要求:也可以称之为查询串,或查询短语。对于基于关键词检索的搜索 方式来说,搜索(引擎)系统不必理解用户给出的查询串所表示的意义;径直通过一定的算 法,把包含查询串的有关网页或文档返回给用户。比如,用户输入查询串景德镇御器厂,搜 索引擎 Baidu{百度)返回: a.题为《明代后期景德镇御器厂匠役制度的变化H浅谈明代后期景德镇御器厂的龙缸制 作》等文章,因为这些文章的标题中就有跟查询串完全一样的短语: b.{景德镇陶瓷H瓷都风情H杂碎新闻联播Hlanyanqi 的博客》等文章或网页,因为这些文 章(或网页中的文章)中有跟查询串完全

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档