- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向信息检索系统的语义资源规划.pdf
诺言科学
面向信息检索系统的语义资源规划骨
袁毓林
北京大学中文系 北京 100871
北京大学汉语语宫学研究中心 北京 100871
提要 文章通过分析问题回答等信息检索系统对于语义资源的需求,借鉴国外语义资I建设的实践和经瞧,
指出国向处理汉语的信息检索系统的话义资酶,至少应该包括下列三种:1)视语词问(CWN) ,提供J基本的词
汇慨念及Jt关系信息 ;2) 汉语谓词网(CVN) ,提供谓词的论元角色及其句法配置信息;3) 汉语命题库(CPB) ,
提供谓词的论元结构在真实文本中如何实现为命题结构的信息还根据英语 WordNet、 VerbNet 和 Prop唰
Bank 的建设和应用情况,结合作者近年来学习语义学理论、研究和建设语义资源的实践相体会,分别说明这
三种语义资掘的设计目标、内容规模、体系结构和具体的建造策略与步骤等具体问题。
关键调信息检索语义资糠仅语词网仅语调词网汉语命题库
中图分类号 H030 文献栋识码 A 文章编号 1671 …9484(2008)01 一0001-11
l 问答等检索系统需要哪些语义资源
问题回答(question answering) 等信息检索系统如果想要有效地运作,那么就必须具有识别相似概
念(similar concepts) 和进行蕴闹推理(entailing inference) 的能力。例如:(1)
(l)a. Where are the grape arbors located?
(1) b. Every path from back door to yard was covered by a grape-arbor , and every yard
had fruit trees.
(2)a. 颐和困在哪儿?
(2)b. 颐和园坐藩于北京大学的西面。
(3)a. What country does Israel fear for its nuclear ability?
(3)b. Iran scares Israel with its nuclear ability.
(4)a. 国家智能技术与系统实验室提靠在什么单位?
(4)b. 清华大学计算机系设有国家智能技术与系统实验室。
如果系统懂得A 在日与A 坐珞子B同义、1挂靠在 B蕴涵(entail) B 设有 A ,那么就可以从
文本中找到跟问句中的关键词虽然宇丽不同、但是意义相同的答句。
〔收稿日期] 2007 年 8 月 8 日 [R!稿日期] 2007 年 12 月 20 日
·本课题的研究得到国家社会科学基金项目《面向内容计算的汉语语义角色知识库的研究和建设H项目号:
07AYY004) 的资助.其中,树库语料自詹J!东先生提供,语义角色辅助标注软件由常宝宝先生和他的研究生开发,谨
此向他们致以诚挚的谢意.
( 1)例(1)引自 Palmer (2006a) 和 Loper et al. (200的,例(3) 引自 Pazienza et al. (2006) ,
1
语言科学 2008 年 1 月
要使系统具有识别相似概念和进行蕴涵推理的能力,必须为之配备相应的语义资源。在最低程度
上,这种资源应该包括:1)汉语词网(Chinese WordN时,简称 CWN) ,提供基本的词汇概念及其关系信
息;2) 汉语谓词网(Chinese VerbN时,简称 CVN) ,提供谓词的论元角色及其句法配置信息;3) 汉语命题
库(Chinese PropBank ,简称 CPB) ,提供谓词的论元结构在真实文本中如何实现为命题结构的信息。
2 CWN:汉语词义概念关系知识库
CWN 应该在普通语言学和认知,心理学理论的指导下,为汉语的词义及其概念关系建立词汇知识
数据库,它必须用一致的形式来为汉语的词汇知识建立模型。
从功能上讲,CWN 必须对于应用系统的词义消歧(word sense disam
文档评论(0)