第一部分:基本理论:.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一部分:基本理论: 语音信号处理方法 细则 解释 备注 时域处理 语音数字化和预处理 数字化:取样-量化 预处理目的:提升语音信号的高频部分,使信号的频谱变得平坦。以便于进行频谱分析或声道参数分析。 短时平均能量和短时平均幅度 短时平均能量主要用途: 可以从清音中区分出浊音 可以用来确定声母与韵母,无声与有声,连字等的分界。 可以作为一种超音段信息用于语音识别。 短时平均幅度: 因为短时平均能量对于高电平信号处理过于灵敏,所以采用短时平局幅度。 短时过零分析 如果信号按段分割,就称为短时,把各段信号的过零率作统计平均,就是短时平均过零率。 短时自相关函数和平均幅度差函数 短时自相关函数具有自相关函数所有的性质,是语音信号时域分析的一个重要参量。 短时平均幅度差函数与短时自相关函数类似的功效,但运算量和对硬件的要求可以降低许多,相对来说,这种技术应用广泛。 高阶统计量 一般指高阶矩、高阶累积量、高阶矩谱、高阶累积量谱。 时频处理 短时傅里叶变换 是个一个二维函数,也称时频函数。 物理意义:函数将窗函数的中心移至某处截取信号,再做傅里叶变换。 矩形窗具有较窄的主瓣,因而具有较高的频率分辨率,但它具有较高的旁瓣,且会产生“破碎”的频谱;采用哈明窗得到的短时频谱却要平滑的多,因而应用的比较普遍。 短时傅里叶变换以固定的滑动窗对信号进行分析,从而可表征信号的局域频率特性。 小波变换 时域等宽的分析方法并不是对所有信号都合适,例如:在信号的低频端具有很高的频率分辨率,而在高频端的频率分辨率较低。所以出现了 小波变换。 分析的目的:既要看到森林(信号的概貌),又要看到树木(信号的细节)。 倒谱同态处理 复倒谱和倒谱 无论对于语音通信、语音合成还是语音识别,倒谱参数所含的信息都比其他参数多,其缺点是运算量较大。尽管如此,倒谱分析仍是一种有效的语音信号分析方法。 语音信号的倒谱分析与同态解卷积 将语音信号中的激励信号与声道响应分离,并且只需用十几个倒谱系数就能相当好地描述语音信号的声道响应。 避免相位卷绕的算法 缘由:在复倒谱分析中,Z变换后得到的是复数,所以取对数时进行的是复对数运算,这时存在相位的多值性问题,称为“相位卷绕”,由于相位卷绕使后面求复倒谱、以及由复倒谱恢复语音等运算均存在不确定性而产生错误。 解决方法:最小相位信号法 第二部分:语音识别系统 项目 细节 解释 备注 语料库 基本特征 理论语言学原则指导 构成和取样按照明确的语言学原则并采取随机抽样方法收集语料,而非简单堆积。 作为自然语言运用的样本,具有代表性。 以电子文本形式存储且通过计算机自动处理。 基于语料库的研究以量化研究为基石,以概率统计为基本手段,以“数据驱动”为基本理念。 语料文本是一连续的文本或话语片断,而不是孤立的句子和词汇。 类型 以不同层面来考虑可以划分为不同的类型。 语音语料库 建立、收集和标注。 语音特性描述。 863汉语普通话合成语料库 语音识别的预处理 语音识别单元的选取 1、选择原则: 首先,对于不同的语言,基元选择的考虑是不同的,例如:汉语,可用“声母—韵母”,也可用音节字、词、等作为识别单元。 第二,识别基元选择具有灵活性,用它可以组成其他的语音或语法单位,具有稳定性。灵活性希望基元尽可能地小,如音素;而稳定性则希望基元尽可能地大,如词甚至词组。 第三,基元的选择还需要考虑搜索时间模型存储开销。基元选择愈小、存储量愈小,算法愈复杂,正识率愈低。 第四,基元选择也与实际用途有关,有限词汇量的识别基元可以选的大一点(如词或短语等);而无限词汇量则应选的小一点(如音素、声母—韵母等)。 这是语音识别中非常重要的环节 自动分段—端点检测技术 作用:用数字处理技术来找出语音信号中的各种段落(如音素、音节、词素、词等)的始点和终点的位置。 方式: 基于能量的端点检测 基于LPC-10声码器的端点检测。 基于信息熵的语音端点检测 基于频带方差的端点检测 基于倒谱特征的带噪语音信号端点检测 基于HMM的端点检测方法 基于分形技术的端点检测 基于自相关相似距离的端点检测 基于迟滞编码的端点检测 10、实时端点检测算法 在汉语中主要目的是找出字的两个端点,进而找出其中声母段和韵母段 ▲语音信号特征参数 基音周期 概念:指发浊音时声带震动所引起的周期运动时间间隔。 几种有效且实用的的方法: 1、自相关法及其改进:区分清音和浊音并估计出基音周期。 具体方法:1、先对语音信号进行低通滤波,然后再计算短时自相关函数。 2、采用中心削波技术 3、用短时幅度差函数来代替短时自相关函数,这样也省去乘法运算

文档评论(0)

xiaowei110 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档