声调语言拉丁线性化处理技术.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
声调语言拉丁线性化处理技术

声调语言拉丁线性化处理技术摘 要:近代以来全世界大多数语言在文字上都推行了拉丁化,在此过程中很多语言遇到了诸多问题,其中最明显的一个问题就是文字的线性化。特别是对于声调语言来说,如何使文字在表现声调的基础上进行线性化是一个棘手的问题。本文针对于该问题,以粤语为例,采用音节之中同一音素不同书写及组合出现等方法,对声调语言进行无损伤线性化处理。 关键词:线性化;声调;同位书写;组合出现 中图分类号:H201 文献标识码:A 文章编号:1009-0118(2012)07-0280-03 一、引言 近代以来由于种种原因,很多原本采用非拉丁字母书写的语言纷纷改用拉丁字母书写,例如越南语,马来语,壮语,苗语等。在拉丁化的过程中,为了书写清晰美观,打印和信息处理的方便,一般来说都会遵循线性化这一原则,即在书写的过程中尽可能地只用26个拉丁字母书写,尽可能少地使用调号,辅助符号等。但是进行拉丁化的语言中有很多是是声调语言,在这些语言中声调是用来区分语义的。例如汉语,同样是yi,声调不一样就会有不一样的意思:衣,移,以,意,其他声调语言有类似的情况。那么如何在线性化的过程中将声调也明了地表现出来就成了一个问题。 对这个问题有很多学者已经提出了不少宝贵的方法,其中最为典型的一种就是将一些特殊的字母,包括在很多情况下不发音的字母以及在该语言中用不上的字母来进行标调,例如:壮文中的“j”“q”“x”“z”。这种方法虽然简单易行,但是看起来很奇怪,奇怪之处在于国际上大多常用的语言很少有将字母用来标调的,例如英语,法语,德语,西班牙语等。因此,类似的文字很难给人一种国际认同感。并且用这些方法所标的声调数量也是非常有限的,因为在用26个拉丁字母表现一种语言时,鲜有有大量字母在书写音节时是用不上的,如汉语拼音方案中只有V这个字母是没有被使用的。 二、同位书写组合出现法 鉴于以上论述,本文提出了一套新的拉丁线性化技术,适用于声调语言,特别是声调数目较多的语言。不同于以往的线性化技术,该技术采用同位书写组合出现法标调。 所谓同位书写,就是同一个音位用不同的字母或字母组合进行书写。例如英语里的/i:/可以写成可以ee,如see也可以写成ea,如sea.那么ee和ea就是同位书写了。同位书写的字母或字母组合不得少于两个。另外,同位书写不仅局限于元音,还可以用于辅音,例如英语里的/f/可以写成f,如food,也可以写成ph,如photo.对于同位书写的不同字母或字母组合,可以人为地定义名字,比如“阴书”,“阳书”。例如我们可以规定在英语中对于/f/这个音素,f是阴书,ph是阳书,当然这个规定对英语来说是没有多大意义的。对于多于两个的同位书写字母或字母组合我们可以给出更多的名称,比如:“阴书”“阳书”“中书”“阴阳书”等等。 所谓组合性出现,是指一个音节中几个因素以各自不同的书写方式进行排列组合式地组合出现,以达到表调的效果。比如在用汉语拼音书写“山西”和“陕西”的时候,人们往往会把前者写成Shanxi,后者写成Shaanxi加以区分。这个例子用在同位书写组合出现法中也是可行的。普通话音节构成是CVC,即一个辅音(consonant),一个元音(vowel),最后的一个辅音是由/n///其中一个构成的,其实当没有这两个辅音韵尾时,我们也可以将其看做是空辅音韵尾。普通话有四个声调,那么就需要有四种不同的音节表现形式。为了方便,我们可以只需采用后两个因素VC进行各自阴书和阳书的不同排列组合来实现四个不同的声调,例如可以规定/a/这个音的阴书是a,阳书是aa,/n/的阴书是n,阳书是nh;继续规定这两个因素以阴书和阴书组合时表第一声,以阴阳组合出现时表第二声,以阳阴组合出现时表第三声,以阳阳组合出现时表第四声。那么据此Shan读第一声对应的汉字可以是“山”;Shanh读第二声,无对应的汉字;而Shaan读第三声,对应的汉字可以是“陕”;Shaanh读第四声,对应的汉字可以是“善”。 1

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档