戏剧译本的平行语料库制作孟 留 军淮 北师范大学2011-8-4课件.pptVIP

戏剧译本的平行语料库制作孟 留 军淮 北师范大学2011-8-4课件.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
戏剧译本的平行语料库制作 孟 留 军 淮 北 师 范 大 学 2011-8-4 选用剧本: 剧本Long Day’s Journey Into Night Eugene O’Neil 译文: 人民出版社和三联书店出版的译文 1 清洁文本 把空格、空行、怪异的字符都去掉。 2 用Editpad pro 来检查文本文件的代码属性 表面上看还是TXT文件,但其代码已经变了。注意保存。 3 TMT tools把TXT文件转成TMX文件。(自动对齐) 所用软件:text2tmx Text to TMX的选项设置 底部: 在Text to TMX 选项卡上。 顶部: source text file: ZH-Chinese→→ EN-English; 戏剧原文是英文。 Target Text File: EN-English→→ ZH-Chinese;译文是中文的两个版本。 设置好后,分别打开各自源文件和译文文件,单击go,一次对齐生成一个文件,共生成两个文件。 注意:text2tmx.exe文件需要和生成的*.tmx文件需要在同一目录下。而且其所在路径中或子目录名中不能出现中文。否则生成文件中出现的中文可能是乱码。 可用editpad pro软件,打开对齐文件,看其是否正确。一般来说,对于戏剧文件本来讲,对齐的正确度不高,需要人工调整。 4 机助人工校准 CTexT? Alignment Interface 2.0 D:\workshop\Tools\autoaligner-liangmaocheng 有时会看到该两行的内容,却出现在了一行上。需用到分割字段,光标停在断开处→右键→split→弹出对话框→OK。 连线:分别不间断地单击两个序号,该两序号就可连线。 断线:连线后,再分别不间断地单击两个序号,该两序号就可断线。 Save alignments: 会存成四文个文件。分别指出已完成和未完成、源语和目标语的情况。 ALIGN.renmin_source ALIGN.renmin_target NOTALIGN.renmin_source NOTALIGN.renmin_target 5 对于多译本,要做修改,一个译本时则不需要了。 用editpadpro 打开一个译本文件e-c sanlian-1.tmx,为了显示三列,即一列英文,两列中文,需要做下面改动。 <tuv xml:lang=“ZH”> “ZH”替换成”CN”。 Replace all按钮;此操作要在文件合并前做。 目的: 以免用软件打开合并文件时,出现两个译文重合,只显示一个译文的情况。 6 Text merger: ?D:\workshop\4-txt2tmx text2tmx.exe(与上文转换和自动对齐的软件相同) 需要装Java。 D:\workshop\Tools\06运行环境 Java_jdk-1_5_0_08-windows-i586-p.exe 底部:TMX merger选项卡: Choose TMX Files ,同时选定两个*.tmx文件。 合并后,文件类型没变,还是*.tmx文件。 第6步时可能的出错 有时可能出现TMX merger missing,其原因是在D:\workshop\4-txt2tmx 目录下,除了text2tmx.exe外,少了一个文件: TMXMerger-1.0,即屏幕显示的TMXmerger missing. 要把原来目录下的TMXMerger-1.0文件也拷到text2tmx.exe的同一目录下。即可运行。 7 Olifant –paraconc 使用该软件打开 合并后的文件,进行显示 8 进行检索 可以把’XYZ’换成所需的内容,如’Well’。注意是区分大小写。 谢 谢

文档评论(0)

shenlan2 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档