- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器翻译历史-自然语言处理
机器翻译原理与方法第一讲 概论 中国科学院计算技术研究所2009年秋季课程 内容提要 机器翻译定义 课程目的与特点 课程概况 机器翻译历史 机器翻译现状 机器翻译应用系统类型 什么是机器翻译 什么是机器翻译 机器翻译(machine translation)是使用电子计算机把一种自然语言(源语言,source language)翻译成另外一种自然语言(目标语言,target language)的一门学科 这门新学科同时也是一种新技术.它涉及到语言学、计算机科学、数学等许多部门,是非常典型的多边缘的交叉学科 在语言学中,机器翻译是计算语言学的一个研究领域 在计算机科学中,机器翻译是人工智能的一个研究领域 在数学中,机器翻译是数理逻辑和形式化方法的一个研究领域. 以上定义引自冯志伟《澄清对机器翻译的一些误解(论文提要)》,现代语文(语言研究),2005.1,更改了个别子句 内容提要 机器翻译定义 课程目的与特点 课程概况 机器翻译历史 机器翻译现状 机器翻译应用系统类型 课程目的 了解机器翻译基本原理 掌握机器翻译实践技能:能够编写一个简单的机器翻译系统 课程特点 目标驱动 注重实践 内容提要 机器翻译定义 课程目的与特点 课程概况 机器翻译历史 机器翻译现状 机器翻译应用系统类型 课程概况 教师介绍 学生情况 时间安排 课程内容 作业安排 网络资源 学术会议 学术刊物 参考文献 教师介绍 主讲教师:刘群 中国科学院计算技术研究所 研究员 办公电话:010办公地点:计算所642室 电子邮件:liuqun at 个人主页:/~liuqun 课件可在个人主页下载(教学工作?机器翻译) 课代表:于惠 手机课程邮件列表 邮件列表地址: mt-course-at-ict-2009@ 邮件列表网址: /group/mt-course-at-ict-2009 选课或旁听的同学同学都可以访问邮件列表网站并申请加入邮件列表,申请时请注明你的姓名和单位 申请邮件列表需要先注册一个Google Account,最好是用Gmail信箱注册,也可以用非Gmail信箱注册,但有可能会丢失邮件 所有课程通知、作业相关资料都通过邮件列表发放 时间安排 (1) 时间安排 (2) 上课时间(12次共48学时): 每周三晚上:18:30-21:30 课堂讲授7次(含2次讲座) 项目报告4次 考试时间(1次2小时): 12月24日晚上:18:30-20:30 课程内容 讲课28学时(每一次课4学时) 第一讲:机器翻译概述 第二讲:机器翻译方法综述 第三讲:基于词的统计机器翻译方法 第四讲:基于短语的统计机器翻译方法 第五讲:基于句法的统计机器翻译方法 第六讲:语音机器翻译技术(宗成庆) 第七讲:跨语言检索技术(孙乐) 课堂讨论16学时。 答疑2学时,考试2学时。 作业安排——项目(1) 目标: 利用开源的统计机器翻译工具SilkRoad(丝路)和Moses(摩西),实现两个英汉机器翻译系统 自己实现一个统计机器翻译解码器 资源: 开源的统计机器翻译系统SilkRoad(丝路) 开源的统计机器翻译系统Moses(摩西) 开源的汉语词法分析系统ICTCLAS 开源的语言模型工具SRILM 英汉双语语料库 作业安排——项目(2) 第一阶段: 能够掌握SilkRoad和Moses,并在给定的数据上跑完完整的统计机器翻译训练和解码流程 第二阶段: 在SilkRoad的基础上,自己实现一个解码器 完成方式:每人独立完成 考核: 第4、第6、第8次为课堂报告,每位选课学生都要做一个报告,介绍项目作业的进展 最终要在给定的测试数据上测试并考察结果BLEU值 作业安排——翻译 目标: 自选ACL2008-2009、EMNLP2008-2009的任意一篇机器翻译论文,阅读并翻译 完成方式:每人独立完成 考核: 提交翻译的论文 在第9次课上,每个人分别介绍做翻译论文的内容 开源统计机器翻译系统“丝路”简介 /project/project.php?proj_id=14 开发单位: 中科院计算所 中科院自动化所 厦门大学 哈尔滨工业大学 中科院软件所 基于短语的模型 多个不同单位开发的解码器 详细的中文文档 适于入门学习 开源统计机器翻译系统“摩西”简介 /moses 目前最有影响的开源统计机器翻译系统 代码经过大量优化,性能很高,已成为这一领域研究最主要的Baseline系统 开发单位:英国爱丁堡大学、德国亚琛工业大学、意大利ITC-IRST研究所、美国卡内基梅隆大学、美国麻省理工学院、捷克查尔斯大学在美国和欧盟的一些资助下完成 基本特点: 基于短语的统计机器翻译方法(Phrase-based Approach) 基于混合网络的解码
您可能关注的文档
- 护理学的发展及基本概念-基础护理学教研室.ppt
- 华东理工大学2006年硕士研究生入学考试复试内容.doc
- 华东师范大学第四附属中学-虹口区教育学院附属中学.doc
- 华梵大学97学第一学期系所课程开课情况检讨报告表范例.doc
- 华侨大学专业实践计划表-华侨大学研究生院.doc
- 华南理工大学2016医保学生参保工作培训.ppt
- 华中师范大学2013年本科教学工作审核-燕山大学外国语学院.doc
- 化学系质量工程2007报告-郑州大学.doc
- 化学学科能力建构的基本问题探讨*.pdf
- 淮阴师范学院课程教学大纲-淮阴师范学院文学院.doc
- [54101121]1.2地球运动的地理意义——太阳视运动+课件+2025-2026学年高二上学期+地理+人教版+选择性必修一.pptx
- 宏观|8月数据是否继续承压?.docx
- 江苏省盐城市七校联盟2026届高三上学期9月第一次学情检测语文+答案.pdf
- 江苏省盐城市七校联盟2026届高三上学期9月第一次学情检测生物+答案.pdf
- 1 白鹭 教学设计 2025-2026学年统编版语文五年级上册.docx
- 航海装备Ⅱ行业深海科技系列报告:无人协同,以深制海.docx
- [54084823]Unit+2+My+friends++Part++A++Let+'s+talk+&+learn+(课件)-2025-2026学年人教PEP版(2024)英语四年级上册.pptx
- [54088339]3.2用频率估计概率(教学课件)数学北师大版九年级上册.pptx
- [54087024]4.6人体生命活动的调节复习课件2025-2026学年人教版生物八年级上册.pptx
- 2025年博格华纳:涡轮增压龙头 研发并购、战略转型.pdf
最近下载
- F-DZW智能型电动执行机构说明书.pdf
- 江苏省南京市2026届高三上学期9月学情调研试题 地理试卷含答案.docx VIP
- 信息技术-脑机接口行业深度报告:脑机接口,未来正在到来.docx VIP
- 成立婚介公司商业可行性研究报告.docx VIP
- 最新重庆中考英语答题卡模板.docx VIP
- 2025至2030中国婚介网站行业发展趋势与产业运行态势及投资规划深度研究报告.docx VIP
- 重庆中考英语答题卡模板.docx VIP
- 战舰与海战(中国人民解放军海军指挥学院)网课期末考试答案.pdf
- 浙教版九年级上册科学 第1章 物质及其变化 单元测试卷(含解析).pdf VIP
- 2023年国考副省级《行测》考试真题及解析.pdf VIP
文档评论(0)