- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用同义表达形式来扩充信息检索的查询语句例证研究——对于一种基于语义的搜索方式的若干设想.pdf
2∞8 年 5 月
第 2 期
语言文字应用
Applied Linguistics
用同义表达形式来扩充
May ,2∞S
No.2
信息检索的查询语旬例证研究祷
一一对于一种基于语义的搜索方式的若干设想
袁毓林
(北京大学中文系/汉语语言学研究中心 北京 1∞871)
[摘要]本文首先分析基于关键词的搜索的困难(查询串的表达不忠和表达差异
等) ,说明基于语义的搜索的必要性。接着,尝试通过对意义和意义相同的某种
可操作的限制,来发展一种基于语义的扩充式关键词搜索方式:通过同义表达形式来
抓住查询串的意义,并生成更多的检索串进行并发搜索。最后,规划怎样对汉语有
关的同义表达进行全面深入的研究,并总结出若干识别查询串的同义形式的启发式
规则。
[关键词]基于关键词/语义的搜索;查询串;同义表达形式:启发式规则
[中固分类号 ]H08[文献标识码]A[文章编号 ]1∞3-5397(2∞8 )02-0123-09
An Example-based Study of Expanding Retrieval Query
Using Synonymous Expressions:
Some Assumptions about Meaning-based Search
YUAN Yulin
Abstracl:ηlís paper firstly shows the necessity of meaning-based search by analyzing
the constraints of keyword-bωed search , i. e. , que巧 strings are unfaithful to 甲ery intention
and multiply dive鸣ent expressions are used to express a qu町 intention. Then 出rough setting
some technical restrictions on meaning and same meaning , it proposes a meaning-driven
and generalized keyword-bωedse缸ch approach : constructing synonymous 回.pressions to
capture the meaning of a given 甲町 string and generate multiply qu町 strings for simultaneous
search. Finally , it i1lustrates how ωinvestigate the Chinese synon严nous expressions
comprehensively , and extract 切me heuristic rules for reco伊izing the s严lonymous forms of a
[收稿日期]筑J07 - 11- 19
[作者简介]袁毓林,北京大学中文系教授,主要从事汉语语言学及其应用的研究。
铃本课题的研究得到教育部人文社会科学重大研究项目(批准号 :05110740176)和国家社会科学基金项目
(批准号 :07AYY侃)4)的资助,文中吸收了孙茂松教授的一些想法和例子,谨此一并致以诚挚的谢意。
124 ? 语言文字应用 2∞8 年第 2 期
glVen 甲le町 stnng.
Keywords: keyword/ meaning-based search; que巧 strings ; synonymous expressions ;
heuristic rules
工作的定位:起越检索串的词汇形式
搜索指在网络环境下,用户在计算机终端上输入一个检索串,来向网络查询自己关心的某
项内容,以获取相关的信息。而搜索引擎系统则通过一定的信息搜集方式(比如,关键词匹配
等) ,采集一批相关的网页或文档返回给用户。其中,检索串主要是自然语言的短语形式,用以
表达用户的查询意图和要求:也可以称之为查询串,或查询短语。对于基于关键词检索的搜索
方式来说,搜索(引擎)系统不必理解用户给出的查询串所表示的意义;径直通过一定的算
法,把包含查询串的有关网页或文档返回给用户。比如,用户输入查询串景德镇御器厂,搜
索引擎 Baidu{百度)返回:
a.题为《明代后期景德镇御器厂匠役制度的变化H浅谈明代后期景德镇御器厂的龙缸制
作》等文章,因为这些文章的标题中就有跟查询串完全一样的短语:
b.{景德镇陶瓷H瓷都风情H杂碎新闻联播Hlanyanqi 的博客》等文章或网页,因为这些文
章(或网页中的文章)中有跟查询串完全
您可能关注的文档
最近下载
- 光伏电站运行常见故障及技术解决方案.pdf VIP
- 军队文职考试《公共科目》试题与参考答案(2024年).docx VIP
- 生成式AI在小学英语课堂中的应用:教师教学决策优化研究教学研究课题报告.docx
- 初二物理导学案-全一册.pdf VIP
- 邮政企业快递企业安全生产重大事故隐患判定标准解读.pdf VIP
- 人民大2023学术规范和论文写作PPT第2章 选:论文选题与研究设计.pptx VIP
- 2025年中国食品级碳酸氢钠数据监测报告.docx
- 能源与动力工程研究教授——程林同志事迹材料— .doc VIP
- 高中物理竞赛-话题5:多质点在动态多边形顶点的相遇问题和多解问题.doc VIP
- 《提升基层干部管理能力》课件.ppt VIP
文档评论(0)