论粤方言语音数据库建设.docVIP

  • 21
  • 0
  • 约5.48千字
  • 约 12页
  • 2018-06-07 发布于福建
  • 举报
论粤方言语音数据库建设

论粤方言语音数据库建设   [摘要]近年来计算机技术的日新月异对学术研究方法的更新带来巨大的便利和更高的要求,本文着重探讨利用电脑来建设粤方言语音数据库的基本思路和框架,以便今后方言资料更大量而精确地保存,为进一步的理论研究如方言类型比较、方言特征的地理分布研究、方言语音的数据分析等打下基础。   [关键词]粤方言 语音数据库   [中图分类号]TP392;H178 [文献标识码]A [文章编号]1000-7326(2008)04-0147-04      一、方言调查研究和方言数据库建设      近年来,计算机的普遍运用给方言研究、方言调查格局带来巨大的便利。计算机数据存储信息多,检索速度快,非常适用于方言调查材料的整理和保存。过去的方言数据库只包含单一文字信息(或可称为第一代方言数据库),例如文字、国际音标(包括各种方言声调库、字库、词库),现在图像和语音媒体文件作为方言数据库的一个重要的信息成分,逐渐被引入到方言数据库中,可称第二代方言数据库。   图像文件在方言数据库中的应用。主要体现在方言地图的制作上。方言地图是方言地理学的最重要体现形式,如今国内各类方言地图的项目很多:如北京语言文化大学曹志耘牵头的大型项目《汉语方言地图集》,暨南大学甘于恩牵头的国家社科项目《广东粤方言地图集》等。这两个项目皆使用美国AR-CVIEW9.2自动绘图软件来处理方言数据。2006年底史皓元、石汝杰和顾黔合著的《江淮官话与吴语边界的方言地理学研究》一书,使用了福岛秩子、福岛?介夫妇设计的语言地图软件――SEAL 6.2E(System of Exhibition and Analysis of Linguistic Data),通过密集的布点调查,制作了多幅方言特征地图和方言同言线,比较精确地将江淮官话与吴语的特征差异和地理分布展示出来。   方言语音数据库和方言地图都是继第一代方言数据库之后的新型数据库,但两者侧重点不同:方言地图的绘制注重表现方言空间上的分布,而方言语音数据库更多注重方言语音调查结果的精确记录,并拓展至语音学的实验分析。传统的方言田野调查,调查者先通过自己对某种方言听音、辨音之后,书面记录该方言的语音,所得出的方言调查结果,在他人对记音表示怀疑时,往往缺乏有力的对证。   新一代方言语音数据库的优点在于:一方面能够以录音的多媒体文件形式来真实地记录该方言的读音,对纯粹书面记录的方言资料起到很好的补充和印证作用,从而确保方言调查资料的可信度。即使没有亲自参与田野调查的学者也能通过录音和音系资料的比对获得对该方言语音的充分、真实的了解,从而更好地提出对该方言调查结果的意见和建议。另一方面,所录语音数据还可以通过字音切分在语音分析软件平台上(例如Praat)进行语音试验分析,对一些拿捏不准的语音结合试验分析加以定性,从而提高方言调查的精确度和科学性。此外,方言语音文件可以反复播放,减少了调查过程中发音人的发音次数,缩短了方言田野调查的时间,提高了田野调查的工作效率。      二、粤方言语音数据库的设想和规划      广东粤方言的调查研究工作很早就开展了,尤其是在暨南大学詹伯慧教授和香港中文大学、香港理工大学张日升教授的推动下,自上个世纪八九十年代开始。省港合作逐批逐次对广东的粤方言进行了全面的调查。所承担的大型科研项目和出版的科研成果有:广东省社会科学“七?五”规划重点课题――珠江三:角洲方言调查,出版的成果是:《珠江三角洲方言字音对照》(1987)、《珠江三角洲方言词汇对照》(1988)、《珠江三角洲方言综述》(1990);广东省社会科学“八?五”规划重点课题――广东北江、西江流域的方言调查,出版的成果是:《粤北十县市粤方言调查报告》(1994)、《粤西十县市粤方言调查报告》(1998);广东省哲学社会科学“九?五”规划重点项目,其成果是《广东粤方言概要》(2002)。除了这些铺开面较广的大型项目外,单点或微观的粤方言研究成果则不胜枚举:比较突出的如中山大学李新魁、黄家教牵头的《广州市志》中的方言志部分,后扩展出版为专著《广州方言研究》(1995)。但由于当时的技术条件和资金条件的限制,尤其是计算机技术在方言研究领域里的应用还不成熟,因此上述这些粤方言的调查成果只有纸笔记录的书面形式,没有做成可以随机调阅的方言数据库形式,更不用说配备多媒体音频资料的第二代方言数据库了,这不利于大规模、大跨度以及更具深度的理论比较研究。   以目前的技术要把以往方言的纸质调查成果直接转为电子形式并不困难。例如像PDF的电子书阅览格式,或超星PDJ的阅览格式,还有Apbi的方正电子书阅览格式。但这些仅仅是电子图书,并不是方便查询和交互数据的方言数据库。   随着计算机技术的突飞猛进,语言学界已越来越广泛

文档评论(0)

1亿VIP精品文档

相关文档