机器翻译历史-自然语言处理.ppt

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器翻译原理与方法 第一讲 概论 中国科学院计算技术研究所2009年秋季课程 内容提要 机器翻译定义 课程目的与特点 课程概况 机器翻译历史 机器翻译现状 机器翻译应用系统类型 什么是机器翻译 什么是机器翻译 机器翻译(machine translation)是使用电子计算机把一种自然语言(源语言,source language)翻译成另外一种自然语言(目标语言,target language)的一门学科 这门新学科同时也是一种新技术.它涉及到语言学、计算机科学、数学等许多部门,是非常典型的多边缘的交叉学科 在语言学中,机器翻译是计算语言学的一个研究领域 在计算机科学中,机器翻译是人工智能的一个研究领域 在数学中,机器翻译是数理逻辑和形式化方法的一个研究领域. 以上定义引自冯志伟《澄清对机器翻译的一些误解(论文提要)》,现代语文(语言研究),2005.1,更改了个别子句 内容提要 机器翻译定义 课程目的与特点 课程概况 机器翻译历史 机器翻译现状 机器翻译应用系统类型 课程目的 了解机器翻译基本原理 掌握机器翻译实践技能: 能够编写一个简单的机器翻译系统 课程特点 目标驱动 注重实践 内容提要 机器翻译定义 课程目的与特点 课程概况 机器翻译历史 机器翻译现状 机器翻译应用系统类型 课程概况 教师介绍 学生情况 时间安排 课程内容 作业安排 网络资源 学术会议 学术刊物 参考文献 教师介绍 主讲教师:刘群 中国科学院计算技术研究所 研究员 办公电话:010办公地点:计算所642室 电子邮件:liuqun at 个人主页:/~liuqun 课件可在个人主页下载(教学工作?机器翻译) 课代表:于惠 手机课程邮件列表 邮件列表地址: mt-course-at-ict-2009@ 邮件列表网址: /group/mt-course-at-ict-2009 选课或旁听的同学同学都可以访问邮件列表网站并申请加入邮件列表,申请时请注明你的姓名和单位 申请邮件列表需要先注册一个Google Account,最好是用Gmail信箱注册,也可以用非Gmail信箱注册,但有可能会丢失邮件 所有课程通知、作业相关资料都通过邮件列表发放 时间安排 (1) 时间安排 (2) 上课时间(12次共48学时): 每周三晚上:18:30-21:30 课堂讲授7次(含2次讲座) 项目报告4次 考试时间(1次2小时): 12月24日晚上:18:30-20:30 课程内容 讲课28学时(每一次课4学时) 第一讲:机器翻译概述 第二讲:机器翻译方法综述 第三讲:基于词的统计机器翻译方法 第四讲:基于短语的统计机器翻译方法 第五讲:基于句法的统计机器翻译方法 第六讲:语音机器翻译技术(宗成庆) 第七讲:跨语言检索技术(孙乐) 课堂讨论16学时。 答疑2学时,考试2学时。 作业安排——项目(1) 目标: 利用开源的统计机器翻译工具SilkRoad(丝路)和Moses(摩西),实现两个英汉机器翻译系统 自己实现一个统计机器翻译解码器 资源: 开源的统计机器翻译系统SilkRoad(丝路) 开源的统计机器翻译系统Moses(摩西) 开源的汉语词法分析系统ICTCLAS 开源的语言模型工具SRILM 英汉双语语料库 作业安排——项目(2) 第一阶段: 能够掌握SilkRoad和Moses,并在给定的数据上跑完完整的统计机器翻译训练和解码流程 第二阶段: 在SilkRoad的基础上,自己实现一个解码器 完成方式:每人独立完成 考核: 第4、第6、第8次为课堂报告,每位选课学生都要做一个报告,介绍项目作业的进展 最终要在给定的测试数据上测试并考察结果BLEU值 作业安排——翻译 目标: 自选ACL2008-2009、EMNLP2008-2009的任意一篇机器翻译论文,阅读并翻译 完成方式:每人独立完成 考核: 提交翻译的论文 在第9次课上,每个人分别介绍做翻译论文的内容 开源统计机器翻译系统“丝路”简介 /project/project.php?proj_id=14 开发单位: 中科院计算所 中科院自动化所 厦门大学 哈尔滨工业大学 中科院软件所 基于短语的模型 多个不同单位开发的解码器 详细的中文文档 适于入门学习 开源统计机器翻译系统“摩西”简介 /moses 目前最有影响的开源统计机器翻译系统 代码经过大量优化,性能很高,已成为这一领域研究最主要的Baseline系统 开发单位:英国爱丁堡大学、德国亚琛工业大学、意大利ITC-IRST研究所、美国卡内基梅隆大学、美国麻省理工学院、捷克查尔斯大学在美国和欧盟的一些资助下完成 基本特点: 基于短语的统计机器翻译方法(Phrase-based Approach) 基于混合网络的解码

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档