关于建设大规模中介语语音数据库几点思考--兼对中国少数民族说汉语中介语语音数据库介绍.pdfVIP

关于建设大规模中介语语音数据库几点思考--兼对中国少数民族说汉语中介语语音数据库介绍.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于建设大规模中介语语音 数据库的几点思考 ——兼对中国少数民族说汉语的中介语 语音数据库的介绍 刘 岩 中央民族大学教授 提 要语音数据库的建设可以为中介语研究提供丰富的语言材料和准确 的参数数据,有助于探索中介语的本质特征。中央民族大学与中国社会科 学院语言研究所合作共建了一个“中国少数民族说汉语的中介语语音数据 库”,目前正在进行子项目“藏族人说汉语的中介语语音数据库”的建设。 本文基于这个数据库的建设过程,谈谈中介语语音数据库建设的意义和作 用、田野调查和建库步骤、录音和标记使用工具以及对数据库的深入研究 等问题的思考。 关键词少数民族说汉语中介语语音数据库 近年来,语言数据库以其搜集语料规模大,处理方法和操 作手段更科学、更快捷的优势在语言学领域受到重视。而在第 二语言习得的研究领域中,中介语理论把研究重点转移到语言 学习者及其在第二语言习得过程中采取的种种手段上来。语言 数据库的建设可以为中介语研究提供丰富的语言材料和数据基 础,有助于探索中介语的本质特征。中央民族大学与中国社会 科学院语言研究所合作共建了一个“中国少数民族说汉语的中 429 不同环境下的汉语教学探索 介语语音数据库”,目前正在进行子项目“藏族人说汉语的中介 语语音数据库”的建设。本文基于这个数据库的建设过程,谈 谈对中介语数据库建设相关问题的思考。 、 一 中介语语音数据库建设的意义和作用 语音数据库的特点是以语音事实为根据,通过自然语音的 采集、存储,详尽、大量地占有语音材料;通过语音标注、检 索、统计等功能,为理论上得出比较可靠的结论而服务,为语言 定量分析、语音词典编纂以及自然语言理解和翻译等领域应用打 下基础。同时也可在大量语音材料的基础上来检验传统的基于手 工搜集材料所得出的各种语言理论,从而使我们对自然语音的各 种复杂现象获得更为深刻全面的认识。“藏族人说汉语的中介语 语音数据库”的建设主要是基于以下三个方面的目的: 首先,为藏族人说汉语的中介语语音的特性研究提供丰富 可靠的数据,推动相关语音标准的制定和藏族地区的汉语普通话 语音教学工作。关于藏族人说汉语的语音特征,近年来也有研究 者进行了一些摸索,发表了一些论文,但大都是停留在教学实践 的感性认识上,总体看来过于局部、过于零散,定量研究较少。 当前,迫切需要进行系统性、实验性研究。在研究中,我们不仅 要对中介语进行量化的统计分析,而且要进行精确的声学实验和 对比分析,在统计数据和科学分析的基础上找出造成中介语语音 特征的根本原因,为语音教学提出具有针对性的对策。 其次,为中介语语法、语义、语用特征等方面的研究提供 持续性研究的基础。语音数据库所采录的多种形式的语言材料, 具有充分性、客观性和可验证性。语法、语义、语用的研究者 关于建设大规模中介语语音数据库的几点思考 可以根据自己的研究目的,很方便地检索、使用,实现语法、 语义、语用研究中的定量与定性相结合。 最后,为藏族人说汉语的语音识别等语音信息处理技术发 展服务。在语言工程方面,尽管普通话语音识别、语音合成系 统的开发取得了很大进步,但在面对少数民族说的普通话时却 遇到了挑战。人口众多的少数民族对汉语普通话的使用愈来愈 普遍,而且不同民族带有各自不同的语音特点。藏族人说的汉 语普通话带有非常明显的藏语特征。因此,要提高面向藏族的 汉语普通话的语音识别率,对这些语音特点进行定量描写,并 将其与标准普通话进行对比研究十分必要。 二语音数据库的建设过程及相关问题 语音语料库制作一般需要经过以下的阶段或步骤:针对具 体任务,制定语音库制作的各种规范;语音库制作的准备;语 音库预收集;语音库预评测,语音库正式收集;语音库标注; 生成统计各种电子发音词词典与词频等;语音库的评测;语音 库的分发。其中,有的步骤如收集和标注可以并行进行,有的 步骤可以根据具体任务省略。在具体的建库步骤中,我们既有

文档评论(0)

gubeiren_001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档