汉语感知词语的语义角色标注规则初探.pdfVIP

汉语感知词语的语义角色标注规则初探.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Treebank(汉语)Ⅲ等;语义词典有英语的%rdNetⅢ、 Propbank团(英语)、台湾(fJSinica 在格语法基础上进—步提出的解释词语意义的语义学理论。“框架”(Frame)是跟—些激活性语 context)相一致的一个结构化的范畴系统,是储存在人类认知经验中的图式化 境(motivating 情境。该理论认为,框架是词语理解的背景和动因,因此,可以根据背景框架的不同,xffi司语(主 要是动词、形容词和事件名词)进行分类描述。框架中的各种参与者称为框架元素(frame elements),相当于—般所说的语义角色;但是,传统的格语法的“格角色”是相对于所有词汇 而言的,而框架元素仅适用于具有共同背景框架的一小组词语,其类型大大细化。FrameNet采用 自底向上的方式描述每一组词语的语义角色,摆脱了格清单难以确定的问题,具有个性特征的框 架元素也更适合用来描述自然语言语义。 · 由于词语背后的认知框架具有通用性,许多国家都尝试建立与FrameNet并行的词典,包括希 事实为依据,研究构建汉语框架语义知识库(Chinese CFN的句子标注工作,是对给定句子,手工标注谓词所支配的各个成分的框架元素类型、短 语类型和句法功能三种信息。例如,在CFN中,动词“观察”属于[自主感知]框架,该词语所在 句子“工作人员用法国发射的斯普特遥测卫星观察有关国家的农业生产情况”的标注结果如下: (perc 观察(phen-np-obj有关国家的农业生产情况。 CFN标注了各个框架元素的句法特征,可以方便地观察到句法和语义之间的关联,可以作为 归纳语义角色识别规则的非常理想的资源。本文试图以汉语的部分感知动词(如:看,听,看见, 感觉,等等)为研究实例,利用CFN提供的1000条已标注句子,通过分析真实句子中各个框架 元素的句法特征和词汇语义特征,归纳框架元素识别规则,在语义处理方面探索一条可行的研究 路线。 2感知词语 “看,听,看见,感觉”等感知活动词语,在CFN中属于[自主感知]和【非自主感知]两个框 架,基本情况如下: [自主感知] 定义:感知者有意识地用感觉器官感受某实体或现象,以获取对事物的认识。 . 框架元素:自主感知者,现象,身体部位,方向1;形容,动作时间量,期望事件,背 景,感知者位置,修饰,方法,空间,目的,时间 词元:听,看,尝,闻,嗅,听听,闻闻,看看,尝尝,观看,偷看,窥视,偷窥, 321 欣赏,观赏,偷听,感觉,感受,凝视,一瞥,观察,探察,品尝,侦察,斜视,盯,瞅, 观 [非自主感知] 定义:感知者通过经历某种感知活动,在大脑中形成了对事物的认识。 框架元素:非自主感知者,印象,身体部位;现象2,程度,形容,方向,背景,感知 者位置,空间,修饰,方法,时间 词元:感到,听到,听见,听出,觉得,感觉,看到,看出,看见,闻到,闻见,尝 到,尝出,瞧见,瞅见,望见,瞥见,窥见,见,触目,目睹,目击,目见,亲见,闻(耳 闻),耳闻,传闻,风闻,听说 这里所列的框架元素中,分号(“;胆)之前的框架元素为核,t=c,(core)框架元素,之后为非核 心(non-core)框架元素。核心框架元素是—个框架在概念理解上的必有成分,它们在不同的框 架中类型和数量不同,显示出框架的个性;非核心框架元素是框架理解中的外围成分,它们通常 说明动作所处的时空环境、动作进行的方式等,是多数框架的共有成分,并不显示框架的个性。 与基于格语法的语义分析方法相比,CFN提供的框架元素数量多、类型细化,并突出框架的 个性。CFN对以上两个框架所定义的框架元素都超过10个,其中,传统格语法的受事在[自主感 知]中具体化为现象,在[非自主感知]中则为印象,现象是存在于人的意识之外的客观事物,印 象则是现象在人的大脑中的表征,是认识的结果。例如句子“现在我们到这里看花果山,可以看 见“花果山”三个大字”中,“花果山”和后面的“‘花果山’三个大字”在感知觉活动中充当的 角色显然是不同的,CFN所定义的框架元素明确地区分了这种语义: 印象“花果山”三个大字。 3标注结果分析 在1000条已标注句子中,我们选择500条作为规则分析对象,另外500条作为测试数据。 在标注结果中,短语类型、句法功能和框架元素之间的组合形式多种多样,但是,

您可能关注的文档

文档评论(0)

hnlhfdc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档