不同口型视素（ p 与 b ）在口罩遮挡下的视觉混淆与上下文恢复 .docxVIP

下载本文档

2
0
约1.91万字
约 24页
2026-06-30 发布于湖北
举报

不同口型视素（ p 与 b ）在口罩遮挡下的视觉混淆与上下文恢复 .docx

PAGE2

不同口型视素（/p/与/b/）在口罩遮挡下的视觉混淆与上下文恢复

摘要

视素是视觉言语感知中具有区分意义的最小可视语音单位，其识别构成了唇读技术的核心基础。口罩遮挡截断了口鼻区域的关键视觉信息，导致双唇塞音视素/p/与/b/在视觉特征上几乎完全重叠，形成严重的感知混淆。本文以这一具体的混淆现象为切入点，系统探讨视觉混淆的生成机制、内在矛盾以及上下文语境在混淆恢复中的补偿作用。研究揭示，在缺乏语言模型的条件下，感知者仅依靠视觉信号区分/p/与/b/的准确率低至35%左右，而引入句子层面的语境信息后，准确率可跃升至78%，这一跃升表明语境知识以先验概率的形式从根本上重塑了视觉识别的决策边界。本文综合运用结构分析、矛盾解析与逻辑推演等方法，构建了一个基于贝叶斯推理的视觉-语言感知融合理论框架，将语境恢复机制形式化为先验概率对视觉似然率不足的补偿过程。全文共八章：第一章绪论界定研究问题与思路；第二章梳理国内外唇读与视素混淆研究的进展；第三章界定视素、视素混淆与语境恢复等核心概念，并阐释贝叶斯感知理论；第四章从历史演变、结构成因和内在矛盾三个层次剖析/p/与/b/视素混淆的问题本质；第五章深入阐释语境恢复机制的作用逻辑、条件边界与演变规律；第六章在前述分析基础上提出“先验补偿”理论框架，并论证其解释力；第七章总结研究结论与理论贡献，提出面向助听技术与语音识别系统的实践启示；

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

不同口型视素（ p 与 b ）在口罩遮挡下的视觉混淆与上下文恢复 .docxVIP