- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北京大学博士论玟开习题的报告ppt模板
目录 引言 综述 研究思路 实验方案 总结 总结 已经完成的工作 总体理论框架 实验的准备 部分算法模块 语言资源 将要进行的工作 完善理论细节:主要是翻译模型的参数训练和对齐算法 完成所有算法模块,进行实验验证综合已有的工作进行联调,通过训练选择好的算法和参数 ?谢谢? 基于模板的转换(3) (c) ap(np:1 u:2) ? pp(p:2 np:1) p b n u np pp:ap np of 其它 工厂 的 n light p in t the t the n experiences pp np np pp np 基于模板的转换(4) p np of n light p in t the t the n experiences pp np np pp np b n np:np ap 其它 工厂 p:u 的 (d) u(的) ? p(of) (e) np(b:1 n:2) ? np(t:1 n:2) 基于模板的转换(5) (f) b(其他) ? t(other) (g) n(工厂) ? n(factories) t:b n:n np 其它 工厂 p of p np of n light p in t the t the n experiences pp np np pp np ap 基于模板的转换(6) t n other factories np p of p np of n light p in t the t the n experiences pp np np pp np ap 结 果 建立基于模板的翻译模型 将翻译概率转化为对齐概率: 将对齐概率理解为标注概率: 将句法树的翻译过程理解为对源语言句法树结点的一个标注过程 为句法树的标记建立概率模型 转换模板的标注-图示 为源语言句法树的每一个结点进行转换模板标注: v b n u n np ap np vp 比照 其它 工厂 的 做法 (a) (b) (c) (d) (e) (f) (g) (a) (b) 转换模板的标注-问题 问题: 一个转换模板作用于多个源语言结点时,对于不同源语言结点的标记无法区分 举例说明: 上例中模板(a)同时作用于vp和v两个结点,在计算标注的概率时,对于这两个结点显然要作不同的考虑,仅采用模板标记容易造成混淆。 模板角色的定义 模板角色: 转换模板中源语言句法子树的每一个非叶结点被称为一个模板角色 例子 模板: (a) vp(v(比照) np:1) ? …… 模板角色: (a) vp[a0](v[a1](比照) np:1) vp vp np v (a1) (a0) 模板角色的标注-图示 v b n u n np ap np vp 比照 其它 工厂 的 做法 (a0) (b0) (c0) (d0) (e0) (f0) (g0) (a1) (b1) 为源语言句法树的每一个结点进行模板角色标注: 模板角色标注-概率模型1 假设每一个源语言结点的模板角色标记只与该结点的句法标记有关,与其他源语言结点的句法标记和模板角色标记都无关。于是: 这里,N是源语言句法树上任何一个结点,Syn(N)是该结点对应的句法标记,Role(N)是该结点对应的模板角色标记。 对应的参数归一化条件为: 这里Syn是任何一个句法标记,Role是任何一个模板角色。 模板角色标注-概率模型2 假设每一个源语言结点的模板角色标记只与该结点及其子结点的句法标记有关,与其他源语言结点的句法标记和模板角色标记都无关。也就是说,一个源语言结点的模板角色标记只与产生该结点的源语言上下文无关规则有关。于是: 这里,N是源语言句法树上任何一个结点,Syn(N)是该结点对应的句法标记,Rule(N)是产生该结点的上下文无关规则。 对应的参数归一化条件为: 模板角色标注-概率模型3 假设每一个源语言结点的模板角色标记除了与该结点及其子结点的句法标记有关外,而且与其父结点的模板角色标记有关,与其他源语言结点的句法标记和模板角色标记都无关。于是: 这里,N是源语言句法树上任何一个结点,Syn(N)是该结点对应的句法标记,Rule(N)是产生该结点的上下文无关规则,Parent(N)是该结点的父结点。 对应的参数归一化条件为: 训练方法 算法 Viterbi算法:每次只考虑最大可能的对齐 EM算法:考虑所有可能的对齐 基本过程:迭代,直到收敛 短语对齐 模板抽取 参数估计 参数训练算法目前有了初步的设想,但考虑得还不成熟,需要尝试多种办法并通过实验验证,下面通过一个例子简单说明 短语对齐的基础-词语对齐 词语对齐是短语对齐的基础 基于(语义)类的方法 义类词典: 汉语:同义词词林 英语:WordNet 参考文献:[Ker,1997] 短语对齐的两个约束
您可能关注的文档
最近下载
- 第四届全国工业设计职业技能大赛(无损检测员赛项)选拔赛考试题库(含答案).docx VIP
- 结缔组织病相关的间质性肺疾病诊断和治疗.pptx VIP
- 部编语文六年级上册第八单元整体教学设计教案.docx VIP
- 2024届高考作文素材- 敦煌.docx VIP
- 学年山东省济南市天桥区数学五年级上册第一学期期末考试真题(人教版,含答案).docx VIP
- 05G511 梯形钢屋架图集标准.docx
- ARM Cortex-M 系列:ARM Cortex-M7 系列_(4).Cortex-M7的指令集.docx
- 全驱动灵巧手的电气系统设计及控制方法研究.pdf
- 眼肿瘤 ppt课件(最新文档).ppt VIP
- 天然气企业LNG储配站交接班记录式样.pdf VIP
文档评论(0)