雅信2.5语法简述解析.doc

CAT 2.5 0、库格式 雅信标准词库格式(文件后缀必须为.saw)每行: 英文^中文释义(多义用“|”隔开)^联想词^词性^属性 雅信标准句库格式(文件后缀为.txt)每行: 原文句子^译文句子 1、模式 固定部分的单词和释义不变,替换的部分用“*”表示,与其对应的中文释义用“#”表示,即形成模式。系统翻译时将当前句子和模式进行比较,如果相符,就用“*”部分的释义直接替换模式中的“#”部分。 例如: 模式Will you please * ?—请你…好吗?广义语法模式为:请你#1好吗? 原文:Will you please open the window?-若open the window的释义为“打开窗户”,则系统翻译为:“请你打开窗户好吗?”。 2、类技术 把单词或词组进行归类,定义为“属性”。单词和词组的词性及属性在雅信CAT系统中统称为“类”,这样就使所有模式有了继承性。例如:我们把“Man”、“Girl”、“Boy”、“Women”等单词的属性定义为类“人”,同时定义类“人”的单位(量词)为“个”,当这些单词与冠词、数词等搭配时,应加上量词“个”。为此定义:“冠词”+“人”为一个模式,“数词” +“人”为另一个模式。这样,系统中所有属性为“人”的单词或词组将继承该模式。 “类”放在“{}”中,单词释义位置用“@”表示。翻译时用“{}”对应单词的释义替换模式中的“@”位置。 举例 英文句子 译文 广义语法模式 A gas has neither fixed size nor shape. 气体既没有固定尺寸,也没有形态。 Have either * nor 既没有#1,也没有 we arrange not only our work schedules very carefully, but our off-work time as well. 我们不仅安排工作计划非常仔细,而且业余时间安排也同样好。 {v} not only * but * as well 不仅@1#1而且#2也@1同样好。 Flight CA1241 from Beijing is now arriving at gate 3. 从北京飞来的第CA1241号班机现到达第3号进出口。 flight * from * is now arriving at gate * 从#2飞来的第#1号班机现在到达第#3号出口 On December 2nd, 1967 a young girl died in an accident. 1967年十二月2日一个年轻的女孩死于意外事故。 on {月份} {no} , {no} * died in 其中#1代表第1个“*”对应的中文释义,#2代表第2个“*”对应的中文释义;@1代表第一个{}对应英文单词的中文释义,@2代表第二个{}对应英文单词的中文释义等等。 广义语法定义规则: 一个语法模式,最多可含有3个“*”。每个“*”所代表的单词个数也可加以限制,为0时不考虑长度(默认值)。每个“*”对应释义“#”的位置根据译文句子的需要放置。 采用“类”时,最多可含有9个“{}”;{}中的内容可以是词性也可以是属性。 注意:模式中#X(X为1到3的任意数字)和@X(X为1到9的任意数字)可以出现多次或不出现。 规则中使用的“*”、“#”、“{}”和编号“1”、“2”…9均为半角英文字符。单词之间、单词和符号之间要留一个空格(半角)。 3、关联技术 由于一个英文单词常常对应多个中文释义,在翻译时选择哪个释义对最终的译文质量非常重要。当两个或多个单词同时出现在一个句子中或某个单词和不同词性、属性的单词或词组连用时,其释义往往是唯一的,因此我们可采用关联的方法使释义选择更加准确。 (1)单词之间的关联(用模式直接定义) ???? ?一般地,一个英文单词通常对应多个中文释义。比如take off释义有“脱去、起飞、减弱、带领、取消、拿掉”等多种含义。当它与clothe(衣服)连用时应译为“脱去”;当它与helicopter (直升飞机)连用时应译为“起飞”。因此,我们把clothe与take off进行关联,即当clothe遇到take off时,clothe的释义选“衣服”,take off的释义选“ 脱去”。 helicopter * take off 直升#1机起飞 take off * clothe 脱去#1衣服 单词之间的关联与语法模式的区别: 前者不考虑单词在句子中的顺序,后者要考虑! (2)单词与类的关联(需有“类”定义的支持) 上面的例子推而广之,所有类型的飞机与take off组合释义都应选“起飞”,故把airboat、airplane、helicopter等单词的属性定义

文档评论(0)

1亿VIP精品文档

相关文档