- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
句法歧义消解 上海交通大学 陈玉泉 内容提要 基于特征的消歧 PCFG ME Reranking 评测体系 基于特征的消歧 基本框架 基本规则: 校验 传递 组成部分 文法 上下文无关文法 特征操作(合一也可以是其他) 校验,传递 词典 特征的来源 例子 文法及其特征操作 NP ? n T: NP.head = n NP ? NP1 NP2 T: NP.head = NP2.head NP ? MP NP1 V: MP.quan in NP1.head.Qset T: NP. MP ? m q T: MP.quan = q 词典 火车.Qset = {列、种、节…} 票.Qset = {张、种、沓、堆…} 例子(cont) MP(一张) + NP(火车) “V: MP.quan in NP1.head.Qset” will fail, since “张” is not in {列、种、节…} MP(一张) + NP(火车票) is successful. 例子(cont) PCFG Probabilistic Context Free Grammar 一般统计模型的原型 P(x | w, G) = P( w | x, G) * P( x | G) / P(w | G) 这里x是我们的分析树,w是句子,G是文法 Xres = argmaxx P(x|w,G) 由于P(w | x, G) = 1, P(w | G) 对所有输入都一样 所以, Xres = argmaxx P(x | G) PCFG基本概念 每一条产生式都有一个概率P(r) 句法树中每个节点都有一个概率 可以把叶结点的概率定为1 树的概率P(x|G)等于根节点的概率 概率从叶节点开始往上计算,可以用递归表示。 计算方法 For leaf nodes, assign the probability as 1. For non-leaf nodes, For a subtree generated by production: r:A?u1u2…un , the Probability is: Where S(A), S(ui) is the probability of A and ui, P(r) is the probability of production r. 图示 统计 计数 + 正则化 Eg. 1. 每个产生式出现的次数(子树) (20) NP ? NP NP (18) NP ? n (18) VP ? VP NP (14) VP ? v 2. 对左部进行正则化. P(NP ? NP NP) = 20 / (20 + 18) = 0.526 P(NP ? n) = 18 / (20 +18) = 0.474 P(VP ? VP NP) = 18 / (18 + 14) = 0.562 P(VP ? v) = 14 / (18 + 14) = 0.438 Best-first的实现 把概率结合进图算法: 活动弧(规则概率*识别节点的概率), 弧扩展时,两弧概率相称, 弧触发时,规则概率*原弧概率 改变图算法中agenda的排序策略:概率最高的弧最先处理,这样可以保证所有弧的概率递减。 这样保证了最先出来的结果是概率最大的结果 PCFG的特点 PCFG合理的解释了一个句子可以对应多个分析树 但解释地并不理想 健壮性,对于不符合语法规范的句子,仍然可以给出它的分析树,只是概率小 从实验结果来看,PCFG是比较差的语言模型 如果加入上下文信息,词汇信息,父节点子节点信息,效果可以更好 PCFG的概率大小并不代表该分析树在实际情况下出现的次数。(概率和长度有关) 扩展—加入简单上下文信息 共现概率 Co-occurrence Probability (COP) Preceding COP PA(v,C), prob that C is ahead of v. ( C在V后面) Succeeding COP PF(v,C), prob that C follows v. ( C在V前面) 这里v必须是词汇范畴,即叶结点 PA(v, C) = P(Cv | v);PF(v, C) = P(vC | v) COP(C) = PA * PF 图示 统计 计数 + 正则化 1. 计数 (v, C). 如果C出现在句首,应该算到NF(e, C). 如果在句尾,NF(v, e) +1 2. 同理计算(C, v), 即NA(v, C) 3. PF(v, C) = NF(v, C) / N(v); PA(v, C) = NA(v, C) / N(v); 与PCFG结合 For a Parsing Tree S; PCFG
您可能关注的文档
- 露天开采第二章 露天开采工艺讲解.ppt
- 自行车中的物理知识讲解.ppt
- 长安大学抚通高速公路第三方质量检测报告(第16期)0419最终版讲解.doc
- HSE体系和作业许可管理forYoujian2015-10-22重点.ppt
- 麻醉手术期间液体治疗专家共识讲解.ppt
- I-6环己烯制备重点.ppt
- 长度与时间的测量 1 可用讲解.ppt
- 马克笔绘图技法讲解.ppt
- 长方形、正方形的周长讲解.ppt
- 自己做的关于消防安全的班会讲解.ppt
- 2025江西省交院路桥工程有限公司招聘1人笔试参考题库附带答案详解.docx
- 2025江苏苏州高新现代服务业招商中心有限公司招聘10人笔试参考题库附带答案详解.docx
- 2025年度云南红塔蓝鹰纸业有限公司招聘28人笔试参考题库附带答案详解.docx
- 2025年山西国际能源集团有限公司所属企业社会招聘218人笔试参考题库附带答案详解.docx
- 2025年山西南海石化能源有限公司招聘笔试参考题库附带答案详解.docx
- 2025年秦皇岛新材料生产加工项目投资分析报告_图文.docx
- 2025年青岛环氧树脂项目投资分析报告.docx
- 2025年钦州密封胶项目可行性研究报告.docx
- 2025年衢州锂电池材料项目可行性报告.docx
- 2025年衢州锂电池材料项目园区入驻申请报告.docx
最近下载
- T_ZAEPI 042-2025 秸秆炭标准规范.docx VIP
- 跌倒坠床的试题(+答案).docx VIP
- 第一组读书分享:教育人类学.pptx VIP
- 质量管理部岗位绩效考核与实施细则(新).doc
- 电梯安装安全知识培训课件.docx VIP
- 四年级数学下册人教版(拔高卷)(含解析).docx VIP
- 2025-2026学年度秋季第一学期教学工作安排表(可编辑)+2025-2026年秋季学期学校工作计划(9月-1月工作安排).docx VIP
- 小学科学(2024版)新课程标准解读 课件.pptx
- 2024年仓储管理人员题库试题带答案详解(名师推荐).docx VIP
- 标准图集-华北-16BJ7-1楼梯平台栏杆及扶手.pdf VIP
文档评论(0)