《统计自然语言处理与信息检索》第7讲概率上下文无关文法2.pptVIP

《统计自然语言处理与信息检索》第7讲概率上下文无关文法2.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
其他句法分析方法(2) 依存语法和短语结构语法的关系 与短语结构语法比较起来,依存语法没有词组这个层次,每一个结点都与句子中的单词相对应,它能直接处理句子中词与词之间的关系,而结点数目大大减少了。 其他句法分析方法(3) “大学学生学习英语语法”这个句子,如果用短语结构语法来表示,其结构是一个短语结构树: S ? NP VP N N V NP 大学 学生 学习 N N 英语 语法 其他句法分析方法(4) 用依存语法来表示,其结构是一个依存树: ? 学习 学生 语法 大学 英语 显而易见,依存树的结构比短语结构树简洁得多,层次和结点数都减少了。因此,依存语法受到了自然语言处理研究者的欢迎。 其他句法分析方法(5) (2)两种语法本质上是一致(或等价)的。 以名词短语消歧为例: “phrase structure model” 短语结构语法: a. b. phrase structure Ny model Nx model phrase structure Nv Nu 其他句法分析方法(6) 依存语法: a. phrase structure model b. phrase structure model 结论:依存语法等价于词汇化的短语结构语法 其他句法分析方法(7) 相对短语结构语法,依存语法具有两个优势: 依存语法是天然词汇化的,直接按照词语之间的依存关系工作,而词之间的依存关系又是歧义决策的依据。 依存关系给出了分解短语结构规则的方法,而且能够估计它们的概率。 VP V NP PP V(P) N(P) P(P) VP V NP VP V PP 其他句法分析方法(8) 非词汇化树库语法(Charniak,1996) 输入时一系列词类标记(word categories),没有使词汇信息 参数少,不必考虑数据稀疏 基于历史的语法 (HBGs) (Black,1992) 应用语法派生过程的历史信息 用决策树学习历史信息的特征 (Magerman, 1994) SPATTER(Jelinek,1994) 一些可免费使用的句法分析器 Michael Collins ‘s Parser /mcollins/code.html English Dan Bikel ‘s Parser /~dbikel/software.html#stat-parser English / Chinese / Arabic Stanford Parser /software/lex-parser.shtml English / Chinese / German David Chiang’s Parser /~chiang/ English / Chinese 国内的有中科院的ictclasictprop,哈工大的基于依存关系的句法分析器 * * * * * 利用外部概率计算句子概率(4) N1 利用外部概率计算句子概率(5) 例子: S1.0 NP0.1 astronomers VP0.7 V1.0 NP0.4 saw NP0.18 PP1.0 stars P1.0 NP0.18 with ears S1.0 NP0.1 astronomers VP0.3 VP0.7 saw NP0.18 stars PP1.0 P1.0 NP0.18 with ears V1.0 计算步骤: 问题2:确定句子的最佳分析树(1) Viterbi变量 HMM中,用 记录时刻 t 通过状态 i 的路径的最大概率值 PCFG中,用 记录子树 的最大概率, 记录当前的最佳路径 根据文法G,从非终结符 推导出词串 ,每个推导(对应一个子树)都有相应的概率值,其中概率最大的记做 。

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档