中 文  信  息  学  报 第 16 卷 第 3 期   JOURNAL OF CHINESE INFORMATION PROCESSING Vol . 16 No. 3 基于拼音模型的声学层识别的研究① 1 2 黄顺珍  方棣棠 ( 1. 深圳大学信息工程学院计算机科学与技术系  深圳  5 18060 2 . 清华大学信息科学技术学院计算机科学与技术系  北京  100084) 摘要 :本文介绍拼音模型的原理及应用 。拼音模型是累加语言模型中同音字的相关数据后得到的 3 元模 型 ,是在原来的声学模型和语言模型之间增加的一个新环节 ,可用来求取相关拼音串的先验概率 ,实验结果表 明 ,用它作为声学层识别的后处理 ,可使第 1 名的识别率提高 13 个百分点 ,可使前 5 名的识别率与原来声学 模型输出前 10 名的识别率相当 。 关键词 :声学模型 ;拼音模型 ;语言模型 ;连续语音识别 中图分类号 : TP39 1. 42 The Research of Acoustic Layer Recognition Based on Pinyin Model HUAN G Shunzhen1  FAN G Ditang2 ( 1. Dept . of Computer Sci . and Tech . College of Info . Engineering Shenzhen Univer sity  Shenzhen  5 18060 2 . Dept . of Computer Sci . and Tech . School of Info . Sci . and Tech . Tsinghua Univer sit y  Beijing  100084) Abstract :The principle and application of Pinyin model are introduced in t his p ap er . The Pinyin model is Trigram t hat adds up same voice data in language model and it is a new link between original acoustic and language model . It can be used to obtain probability of interrelated Pinyin string. The result s in experiment s show that by using the model to make final process of the recognition of acoustic layer ,the recognition rate of the top one can be increased 13 percent ,and the rate of the front fine is similar with the one of the front ten which are output from original acoustic model . Keywords :acoustic model ;Pinyin model ;language model ;continue sp eech recognition 一 、前言 连续语音识别系统从总体上可看为由如下两部分所组成 : 图 1  连续语音识别系统组成图 声学层识别是在声学模型支持下实现 ,其识别率依赖于语音质量 、基元选择 、特征抽取 、建 模方法 、搜索算法 、识别判决等因素 。对于非特定人大字表连续


