生成式AI合成语音的神经感知机制:与真人语音的ERP对比研究 .docxVIP

  • 0
  • 0
  • 约3.3万字
  • 约 44页
  • 2026-07-01 发布于甘肃
  • 举报

生成式AI合成语音的神经感知机制:与真人语音的ERP对比研究 .docx

PAGE2

生成式AI合成语音的神经感知机制:与真人语音的ERP对比研究

摘要

本研究聚焦于生成式人工智能合成语音与真人语音在人脑神经感知层面的加工差异,以事件相关电位技术为方法论核心,系统探讨两类语音在音段、超音段及副语言信息处理上的神经分离机制。

随着生成式AI语音合成技术逼近自然人声水平,一个根本性的理论问题亟待解答:人类大脑是否以相同方式处理机器生成与人类发出的语音?本研究从该问题出发,构建“感知真实性梯度”理论框架,提出人脑对合成语音的加工存在可量化的神经分离。

论文第一章梳理研究背景,指出现有语音合成评价体系偏重声学参数与主观评分,缺乏神经层面的客观指标;第二章系统回顾国内外语音感知研究,揭示ERP成分在揭示语音加工时间进程上的独特优势;第三章界定音段、超音段、副语言信息三类核心概念,并阐释双重通路模型与预测编码理论;第四章分析合成语音感知问题的历史生成与内在矛盾;第五章深入阐释从声学偏离到神经分离的串行-并行混合作用机制;第六章构建包含感知层级、时间进程和补偿策略的三维理论框架;第七章总结核心结论并提出对语音合成评估体系改进的实践启示;第八章反思研究局限并展望未来方向。

全文以“提出感知差异问题→分析神经分离机制→构建三维理论框架”为逻辑主线,试图为神经语言学与人工智能的交叉研究提供新的理论视角。

第一章绪论

1.1研究背景

生成式人工智能语音合成技术已进入

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档