- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于建设大规模中介语语音
数据库的几点思考
——兼对中国少数民族说汉语的中介语
语音数据库的介绍
刘 岩
中央民族大学教授
提 要语音数据库的建设可以为中介语研究提供丰富的语言材料和准确
的参数数据,有助于探索中介语的本质特征。中央民族大学与中国社会科
学院语言研究所合作共建了一个“中国少数民族说汉语的中介语语音数据
库”,目前正在进行子项目“藏族人说汉语的中介语语音数据库”的建设。
本文基于这个数据库的建设过程,谈谈中介语语音数据库建设的意义和作
用、田野调查和建库步骤、录音和标记使用工具以及对数据库的深入研究
等问题的思考。
关键词少数民族说汉语中介语语音数据库
近年来,语言数据库以其搜集语料规模大,处理方法和操
作手段更科学、更快捷的优势在语言学领域受到重视。而在第
二语言习得的研究领域中,中介语理论把研究重点转移到语言
学习者及其在第二语言习得过程中采取的种种手段上来。语言
数据库的建设可以为中介语研究提供丰富的语言材料和数据基
础,有助于探索中介语的本质特征。中央民族大学与中国社会
科学院语言研究所合作共建了一个“中国少数民族说汉语的中
429
不同环境下的汉语教学探索
介语语音数据库”,目前正在进行子项目“藏族人说汉语的中介
语语音数据库”的建设。本文基于这个数据库的建设过程,谈
谈对中介语数据库建设相关问题的思考。 、
一 中介语语音数据库建设的意义和作用
语音数据库的特点是以语音事实为根据,通过自然语音的
采集、存储,详尽、大量地占有语音材料;通过语音标注、检
索、统计等功能,为理论上得出比较可靠的结论而服务,为语言
定量分析、语音词典编纂以及自然语言理解和翻译等领域应用打
下基础。同时也可在大量语音材料的基础上来检验传统的基于手
工搜集材料所得出的各种语言理论,从而使我们对自然语音的各
种复杂现象获得更为深刻全面的认识。“藏族人说汉语的中介语
语音数据库”的建设主要是基于以下三个方面的目的:
首先,为藏族人说汉语的中介语语音的特性研究提供丰富
可靠的数据,推动相关语音标准的制定和藏族地区的汉语普通话
语音教学工作。关于藏族人说汉语的语音特征,近年来也有研究
者进行了一些摸索,发表了一些论文,但大都是停留在教学实践
的感性认识上,总体看来过于局部、过于零散,定量研究较少。
当前,迫切需要进行系统性、实验性研究。在研究中,我们不仅
要对中介语进行量化的统计分析,而且要进行精确的声学实验和
对比分析,在统计数据和科学分析的基础上找出造成中介语语音
特征的根本原因,为语音教学提出具有针对性的对策。
其次,为中介语语法、语义、语用特征等方面的研究提供
持续性研究的基础。语音数据库所采录的多种形式的语言材料,
具有充分性、客观性和可验证性。语法、语义、语用的研究者
关于建设大规模中介语语音数据库的几点思考
可以根据自己的研究目的,很方便地检索、使用,实现语法、
语义、语用研究中的定量与定性相结合。
最后,为藏族人说汉语的语音识别等语音信息处理技术发
展服务。在语言工程方面,尽管普通话语音识别、语音合成系
统的开发取得了很大进步,但在面对少数民族说的普通话时却
遇到了挑战。人口众多的少数民族对汉语普通话的使用愈来愈
普遍,而且不同民族带有各自不同的语音特点。藏族人说的汉
语普通话带有非常明显的藏语特征。因此,要提高面向藏族的
汉语普通话的语音识别率,对这些语音特点进行定量描写,并
将其与标准普通话进行对比研究十分必要。
二语音数据库的建设过程及相关问题
语音语料库制作一般需要经过以下的阶段或步骤:针对具
体任务,制定语音库制作的各种规范;语音库制作的准备;语
音库预收集;语音库预评测,语音库正式收集;语音库标注;
生成统计各种电子发音词词典与词频等;语音库的评测;语音
库的分发。其中,有的步骤如收集和标注可以并行进行,有的
步骤可以根据具体任务省略。在具体的建库步骤中,我们既有
文档评论(0)