- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
谢谢听讲,欢迎提问 * 基于依存语法构建多视图树库 * 由于该树库及其详细规范尚未发布,所以目前还不知道其细节情况。 * 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图树库 基于依存语法构建多视图汉语树库 邱立坤、金澎、王厚峰 1. 鲁东大学文学院 2. 北京大学计算语言学研究所 3. 乐山师范学院智能信息处理实验室 E-mail: {qiulikun, jandp, wanghf}@pku.edu.cn 关于树库 树库(Treebank)属于深加工语料库,是语料库语言学与自然语言处理技术发展到相对成熟阶段的产物。 在树库建设上,中国与美国差距甚大。 美国宾州大学从1989年到1996年,历时八年,建成约700万词的带词性标记语料库和300万词的句法结构标注语料库(树库),200万词的谓词词-论元结构标注语料库(英语)。 中文方面,同样是宾州大学于2010年建成119万词的中文树库。宾州大学正计划将该树库规模再扩大一倍。 中国国内最大规模的中文树库为一百万词。 * * 基于依存语法构建多视图树库 树库的类型1:短语结构树 可以显示的信息 层次 中心语, 短语整体功能 语法结构关系 * * 基于依存语法构建多视图树库 树库的类型2:依存树 可以显示的信息 中心语 语法结构关系(语法角色) 语义结构关系(语义角色) * * 基于依存语法构建多视图树库 树库的类型3:组合范畴语法树及其它 可以显示的信息: 整体功能(组合范畴) 中心语 谓词论元关系(组合范畴语法CCG区别于传统上下文无关文法的一个显著特性) * * 基于依存语法构建多视图树库 各类型树库间的转换 从短语结构语法到依存语法的转换 Yamada等2003;Nivre开发的Penn2Malt工具;党政法、周强,2005;李正华等2008 从依存语法到短语结构语法的转换 Xia等(2009) 从短语结构语法到组合范畴语法 Hockenmaier 和Steedman,2007; Tse 和Curran,2010;宋彦等,2012 * * 基于依存语法构建多视图树库 树库转换中的问题 树库转换中面临着各种歧义问题 从短语结构语法到依存语法 从整体功能信息生成语法角色信息 从依存语法到短语结构语法 从中心语和语法角色生成整体功能和层次信息 从短语结构语法到组合范畴语法 如何生成谓词论元关系 * * 基于依存语法构建多视图树库 多视图树库的提出 本文提出多视图(Multi-view)树库的概念 对同一个句子,基于同一个数据源,提供多种视图,如依存视图、短语结构视图、组合范畴语法视图等。我们称这种树为多视图树。一般意义上的依存树、短语结构树或组合范畴语法树可以视为单视图树。 多视图树的“多”首先体现在构建阶段 在构建多视图树时,可以选一个视图作为中心视图,其它视图与中心视图共享数据、彼此之间可以相互转换。 多视图树的“多”还体现在使用阶段 在使用阶段,多视图树不仅仅为同一个句子提供多种体系的句法分析结果,更重要的是这些不同体系的句法分析结果具有一个相同的来源,不同的视图只是这同一个数据来源的不同表现形式而已。 * 基于依存语法构建多视图树库 * 基于依存语法的多视图树库框架 在本文中,我们主要讨论含有短语结构语法和依存语法两个视图的多视图树 以依存视图为核心 在句法层面上仅仅标注中心语和语法角色两类信息,自动转换出相应的短语结构树 需要解决的关键问题是短语整体功能的推导和层次信息的推导。 * * 基于依存语法构建多视图树库 短语整体功能的可推导性 朱德熙先生(1982:21)提出:“内部构造相同的结构,功能一般相同;功能相同的结构,内部构造不一定相同。” 陈保亚先生(1999)则将之总结为结构功能原则 “如果两个言语片断的直接成分功能相同,结构关系相同,它们的功能也相同。” “这个规律叫做结构功能原则。根据这一原则,只要知道了直接成分的功能和结构关系,结构功能就知道了”。 * 基于依存语法构建多视图树库 * 短语整体功能推导的具体实现 基于规则的推导方式: 父结点词类+子结点词类+语法角色=短语整体功能标记 通过递归的方式,可以依次获得各短语的直接成分的整体功能标记,以取代上述规则中的词类 通过设计不同的规则体系,可以从同样的依存树库生成不同体系的短语结构树库。目前,我们已经设计出针对北大中文树库和宾州中文树库两套体系的推导规则。 * 基于依存语法构建多视图树库 * 层次信息的可推导性 层次的可推导性,目前却很少
您可能关注的文档
最近下载
- 第7课++定期体检+++预防常见病++课件++2024—2025学年人教版(2024))初中体育与健康七年级全一册.pptx VIP
- 2024-2025学年中职语文基础模块 下册高教版(2023)教学设计合集.docx
- 矫治器及其制作技术.pptx VIP
- 2024-2025学年小学信息技术(信息科技)第二册电子工业版(2022)教学设计合集.docx
- (完整版)小学一年级凑十法-破十法-借十法-练习题.doc VIP
- 《电气装置安装工程接地装置施工及验收规范+GB+50169-2016》详细解读.pdf
- 少先队主题班会PPT课件.pptx VIP
- 气悬浮离心压缩机IPLV测试与研究_郑明宇.pdf VIP
- 《圆的魅力》精品数学获奖课件.pptx VIP
- 青岛版一年级数学上册随堂练习一课一练同步练习课后作业.pdf VIP
文档评论(0)