- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于发音动作的中英文元音交叉语言对比研究.doc
基于发音动作的中英文元音交叉语言对比研究
摘要: 本文通过电磁发音仪(Electro Magic Articulography,EMA)AG500,以200帧/秒的采样率采集了英语和汉语的标准发音动作数据,然而,交叉语言比较的首要任务就是要消除特定说话人声道特性及其它个人生理特性等音素而引起的固有差别,本文采用了基于说话人归一化的普氏算法来进行说话人归一化处理,获得了英汉相似音素发音的元音对比最小对,最后成功揭示了2种语言易混淆元音发音文本对在口腔内外发音动作上的区别。
中国 8/vie
关键词:发音动作; 电磁发音仪(EMA)AG500; 中英文交叉语言; 普氏变换; 对比最小对
中图分类号: TP393
文献标志码: A
: 2095-2163(2016)06-0081-03
0引言
语音是一种多模式的通信形态,包括视觉、听觉、触觉等自然模式,以及大脑电极活动、电磁活动等非自然模式[1]。除了整体表现出物理属性和社会属性外,语音还具有相应的生理属性[2]。近年来,随着发音动作观测技术的快速发展,越来越多的研究开始关注语音的生理属性,语音可视化就是在上述背景下得以创立并已进入深度探索的一门重要的基础功能技术。
在众多发音动作观测的新技术中,电磁发音仪(Electro Magic Articulography,EMA)是研究微小复杂动作的专用设备。该仪器可逼真模拟多数情况下不易察觉的舌头、软腭等发音器官运动的发音动作[3]。
为了纠正英语和普通话发音中的常见错误,需要生成英汉双语的发音文本,从而有效地帮助母语为汉语的学习者学习英语发音,反之也可同样帮助母语为英语的学习者学习汉语普通话。另外,根据第二语言学习的有关研究可知,母语对第二语言的学习有一定的副作用[4],例如,当以汉语为母语的主体在学习英语时,那些英语音素常会被一个母语中的类似音素替代。
综合以上分析论述可知,有必要通过交叉语言对比的方法探寻得到英语和汉语中易被第二语言学习者错发或漏发的发音文本对,并有针对性地展开交叉对比研究。本文即针对这一研究内容给出如下阐释分析。
[BT4]1经验法获得中英文三维发音动作文本
为了获得一个双语的EMA发音动作数据库,提取中英文发音动作的特征,分别采集了普通话和英语的三维多通道EMA发音动作数据,数据采集者分别是2名本土的女性说话人。
首先,研究以《英语发音字典》[5]、《语音学》[6]、《标准汉语》[7]和《标准汉语语音学》[8]为准则选出2种语言中特有的音素(汉语中不存在的英语音素以及英语中不存在的汉语音素,及其相近音素)。表1中列出了这些音素,表中的所有音素都用国际音标(International Phoic Alphabet,IPA)的符号规范书写。
由表1中的音素对可知,经验的易混淆元音音素包括5个中文元音、7个英文元音,共计12个易混淆的元音音素。这些音素对在听觉上将难于辨识,然而,其舌头和唇部的发音动作却存在着明显差异。各音素对的图形对比如图1所示。
图1描绘了中英文的元音的相似音素的静态帧和关键帧,图中所有音素的静态帧都选为同一帧,用虚线标示;英语音素的关键帧用实线标示;而普通话的关键帧用点划线标示。图中用T1、T2、T3分别标示了舌尖、舌体和舌后3个数据采集点,而用L1、L2和L4分别标示了左嘴角、上唇和下唇3个离散数据采集点。
分析图1可知:这些易混淆的音素具有相同的发音部位,但是其发音方法和发音动作(包括唇形、舌位舌头与牙齿或上颚的接触程度等)却截然不同。这与已有的经验分析结果也是一致的,例如:在元音的学习中,很多中国学生不能正确区分松元音(lax voation)算法。该算法是由原多点物向目标多点物的线性几何变换,普氏变换由旋转变换、尺度变换和平移变换组成,其误差度量是最小均方根误差[9]。
假设研究时需将原说话人的发音动作数据D1变换到目的说话人的发音动作数据D2,而D1的归一化数据为D3;由旋转变换、尺度变换和平移变换组成的混合变换则如公式(1)所示:
[HT5SS]D3=[WT5HX]H[WT5BX]D1a+b[HT5”SS][JY](1)
其中,归一化参数([WT5”HX]H[WT5”BX],a,b)由目标数据D2和原数据的归一化数据D3之间的最小均方根误差进行优化。
具体地,旋转矩阵[WT5”HX]H[WT5”BX]可通过奇异值分解得到:
[HT5SS](D1′)TD2′=[WT5HX]U[WT5BX][WT5HX]V[WT5BX]T[HT5”SS][JY](2)
[HT5SS][WT5HX]H[WT5BX]=[WT5HX]V[WT5BX]Λ[WT5HX]U[WT5BX]
您可能关注的文档
- 基于S7―200 SMART PLC的多步进电机控制系统设计.doc
- 基于S7―200PLC的简接冷却供水系统.doc
- 基于SMART原则的LTE技术人才培养项目.doc
- 基于SMART原则的电力高空作业人员体质测试指标遴选研究.doc
- 基于SOA架构技术的软件开发.doc
- 基于Sobel和hough变换的车道线识别算法研究.doc
- 基于SOL Multiphysics的光子晶体线缺陷波导设计.doc
- 基于Spark的智慧校园数据挖掘研究.doc
- 基于SPSS的高校绩效评价研究报告.doc
- 基于SSH的学生职业成长信息系统构建.doc
- 2024年江西省高考政治试卷真题(含答案逐题解析).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)物理试卷(含答案详解).pdf
- 2025年四川省新高考八省适应性联考模拟演练(二)地理试卷(含答案详解).pdf
- 2024年内蒙通辽市中考化学试卷(含答案逐题解析).docx
- 2024年四川省攀枝花市中考化学试卷真题(含答案详解).docx
- (一模)长春市2025届高三质量监测(一)化学试卷(含答案).pdf
- 2024年安徽省高考政治试卷(含答案逐题解析).pdf
- (一模)长春市2025届高三质量监测(一)生物试卷(含答案).pdf
- 2024年湖南省高考政治试卷真题(含答案逐题解析).docx
- 2024年安徽省高考政治试卷(含答案逐题解析).docx
文档评论(0)