网站大量收购闲置独家精品文档,联系QQ:2885784924

基于外贸企业B2B平台翻译教学的小型语料库构建.docVIP

基于外贸企业B2B平台翻译教学的小型语料库构建.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于外贸企业B2B平台翻译教学的小型语料库构建   摘 要:本文基于外贸企业的B2B的销售平台角度,探讨了小型语料库的建立的四个步骤:料采集、格式转换、标注及赋码、语料的整合生成、语料库的检索,将小型语料库用于商务英语翻译教学,能丰富教学手段、提高教学效果。   关键词:B2B外贸平台,商务翻译教学,语料库   一、B2B外贸平台及小型语料库   B2B平台为英文Business-to-Business的缩写,即企业对企业,或者说是进出口商之间的外贸电子商务平台。B2B外贸平台是外贸购销市场的领域的一种,是出口方对进口方的国际营销关系,其具体的运作方式主要是出口方以会员的身份在B2B平台上用英语发布公司、销售产品信息、付款方式及运输等信息,而进口方则可以在外贸平台上发布采购信息,双方都可以在B2B平台看到对方的信息后向另一方发Email询盘或者通过Trade manager等软件在线交流,从而使得外贸得以顺利进行。目前国内著名的B2B外贸平台主要有Global sources Alibaba及Made-in-China等。   小型语料库因其灵活适用性在语料库的研究中成为一种较热的研究项目,大型的语料库主要是研究范围较广的综合性研究,而小型语料库一般是精心采集的,旨在帮助语言学习者理解语言现象的语料库,尤其是在商务英语专业翻译教学与研究过中,可以充分利用海量网络资源及语料库工具创建小型翻译语料库以辅助教学与科研。   二、小型翻译语料库的建立   在创建B2B翻译的小型语料库前,首先应根据该语料库国际贸易用途及B2B网页框架设定一些基本原则,在日常的商务翻译教学过程中需要编撰一系列专用翻译素材与教学辅导素材,如果以B2B平台的翻译为素材,自建小型语料库,对翻译教学将有较大的帮助。目前小型语料库仍未有统一明确的规范与标准,但就其建立过程而言,主要分为料采集、格式转换、标注及赋码、语料的整合生成、语料库的检索四个主要的过程。   1.语料采集和格式转换   开发大型的语料库是一浩繁的系统工程,需要耗费大量的人力物力,对于一般的商务英语翻译教学而言,只需有针对性地建立小型语料库即可,建立B2B翻译教学用小型语料库首要工作就是要进行语料采集和格式转换,欲善其事,必先利其器,须了解常用的工具件。   信息采集工具:因B2B商务平台主要是网页在线信息,故需运用一些网络语料批采集软件,常用的网络信息收集软件主要有Wordsmith Tools里面的网页资料下载工具Webgetter以及Httrack等软件;文字编制的软件主要有Editpad Pro、UltraEdit、EditPlus等软件。   文字识别转换工具:常见的文字识别及转换工具主要有将PDF文档转换成word格式的Solid Converter PDF软件;Adobe Acrobat Pro、CAJ Viewer等,如果是要将扫描的文档传话识别成电子文档还需要ABBYY Finereader软件。   专门针对B2B平台的网页语料采集,一般采用Httrack软件,将要采集的企业的B2B平台信息采集下载。   2. 语料的赋码   从网络上下载的文本一般还不是清洁文本,需要清除杂质与多余的标点符号,将清洁前后的文本进行分类命名保存。语料赋码工作的第一步通常是加Text header,即给语料标注篇名、作者、字数、领域、文体、来源、关键词等,一般做法是将上述项目分别填入尖括号中并放置在文本句首。   目前还没有自动编写Text header的软件,需要手动编写,一般的小型与语料库是可以根据个人实际需要不编写Text header。   目前较通用的语料进行赋码的软件有Tree Tagger自动词性赋码器,使用该赋码器对英语赋码准确率在96%~97%之间,以下为基本的操作步骤:   第一步,双击打开Tree Tagger软件。   第二步,点击左上角的File菜单,选择其中的“Open File”选项或者“open Direction”选项,打开对话框。   第三步,在对话框中选取需要词性赋码的文档,选中后点击“Open”按钮。   第四步,在界面的上方“English,German,French,Italian”语言框中选取文本语言的种类。   第五步,点击“ Start Tagging”按钮,软件就开始对打开的文本进行词性赋码。   Tree Tagger软件对所选文本词性赋码完成后,会在原文本所在文件夹中生成同名文件,只是扩展名已经变成了“.pos”, 此文件就是赋码后的文件。   3.语料的整合   在对B2B平台采集的语料进行赋码后,需要对这些赋码的语料进行整合后,才能做检索工作。目前做语料整合检索的软件主要有Word

您可能关注的文档

文档评论(0)

jingpinwedang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档