- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
软计算-7.ppt
六、学习向量量化(LVQ:Learning Vector Quantization) SOM的有教师示教学习 1、LVQ网的基本想法 SOM网中,竞争层配有较多的神经元,进行输入数据向两维的配置 LVQ网主要进行输入数据的模式分类,主要进行信息压缩、模式识别 LVQ可以看作是将SOM改为有教师示教的网络 在这种情况下,每一个输入学习模式应归属的类别是预先知道的 有教师示教比无教师示教学习需要较少的时间,同时也有较高的分类精度 有时为了提高SOM网的分类精度,对于一个已用无教师示教方式学习完毕的网络,追加一些已知分类结果的学习模式,然后让网络按有教师示教的方式学习 这样,对提高网络分类精度有明显效果 2、LVQ网络结构 同SOM网一样,2层结构 由于主要用于信息压缩及模式识别,所以通常第2层神经元的个数比第1层神经元的个数少,且同层神经元间无结合 LVQ网中,第2层的各个神经元具有自己的领土。输入向量通过第1层与第2层间的权重被分类到某一领土上 3、LVQ1学习流程 kohonen将SOM改良为有教师示教的学习,首先提出了LVQ1 学习算法: STEP 1:网络的初始化:将输入层与输出层间的权值的初始值设定为较小的随机数 STEP2:输入向量的输入:向输入层输入向量x (x1, x2, ….xn) STEP3:在输出层,计算各神经元的权值向量与输入向量间的距离 与SOM一样:输出层第j个神经元与输入向量的距离为: dj [∑i 1, N xi – wji 2]1/2, j 1,2,…, M wji是输入层第i个神经元与竞争层第j个神经元间的权值 STEP4:选择输入向量与权值向量的距离最小的神经元,即确定获胜神经元j* j* min [ dj ],j 1, 2, ……M STEP5:权值的学习: 如果正确的神经元成为获胜神经元,即分类正确了,则按下式更新权值: Δwji +η(xi – wji) 将神经元j* 所对应的连接权向量朝x靠拢(相当于奖励) 如果错误的神经元成为获胜神经元,即误识别了,则按下式更新权值: Δwji -η(xi – wji) 将神经元j* 所对应的连接权向量朝离开x的方向引导(相当于惩罚) η,正的常数 STEP6:回到STEP2,反复进行2~5的动作,学习权值,直到P个学习模式全部提供一遍 STEP7:回到STEP2,反复进行2~6的动作,直到完成规定的学习次数 4、LVQ2学习流程: LVQ2是对LVQ1稍加改进的算法 当发生误识别,即不该获胜的神经元以微小的优势获胜时对LVQ1的改良算法 这相当于输入向量正好处在2个神经元的领土的边界处,仅以微小的误差而误进入别的领域 学习算法:1)- 4)同LVQ1 STEP5:权值的学习: 正确识别时,同LVQ1: Δwji +η(xi – wji) 误识别时,只有满足以下的条件,优胜神经元与第2位的神经元才共同按LVQ1的公式更新: 第2位的神经元正确 第2位的神经元与获胜的神经元的差很小 Δwji -η(xi – wji) STEP6:回到STEP2,2~5的动作反复进行,学习权值 开发者kohonen利用LVQ2,进行芬兰语的语音识别等,得到了比LVQ1还好的特性 SOM网应用举例——语音打字机 SOM网最成功的应用例子,就是由Kohonen本人开发的芬兰语语音打字系统 他把自组织特征映射神经网络巧妙地应用于语音识别这一古老而又复杂的模式识别问题,取得了令世人瞩目的成绩 这一应用的基本原理是,将大量不同的音素 即区别声音的最基本单位 提供给含有SOM网络的语音识别系统,在网络充分学习之后,当向系统输入发音时,系统会自动识别声音,并将其转换为文字通过打印机输出 该系统对输入声音的正确识别率高达90%以上 从信号处理的观点来看,语音波形是一种不规则且十分复杂的实变模拟信号 同一音素,不同的发音者具有不同的波形与强度。即使是同一发音者.其发音音素也会因语句中前后单词关系的不同而不同 在某些情况下,即使音素之间有差别,但往往因其功率谱信号重迭而给音素的识别造成困难。因此,用传统的方法进行语音识别需要十分复杂的技术 而应用SOM网络,可使语音识别的处理过程大大减化,比传统技术明显优越 Kohonen开发的语音处理系统是以SOM网络为核心,包括前、后处理子系统在内的一个复合系统 结构图 SOM网络承担着系统中音素的分类任务,即对语音频谱信号进行矢量化处理 由麦克风输入的信号首先通过截止频率为5.3kHz的滤波器,滤除语音中所含的噪声,然后以13.03kHz的采样频率,用12位A/D将语音模拟信号转换为数字信号。接着将这一数字信号进行256点的FFT 快速傅里叶变换 处理,得到分辨率为9.83ms的语音信号的频谱 将这些
文档评论(0)