07基于内容的音频检索2课件.pptVIP

  • 3
  • 0
  • 约 46页
  • 2016-06-30 发布于湖北
  • 举报
07基于内容的音频检索2课件.ppt

基于内容的音频检索 河南师范大学 计算机学院 第二讲 5.4 语音识别和检索 语音索引和检索的基本方法 运用语音识别技术把语音信号转化为文本,然后应用IR技术进行索引和检索. 除了实际的发生词汇之外,包含在语音中的其他信息,如发声者的身份和发声者的情绪等,都可用于增强语音索引和检索. 下面分别介绍语音识别和发声者识别技术 5.4.1 语音识别 语音识别 就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。 语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等学科紧密相连。 语音识别技术主要包含以下几个方面: 语音控制、电子发声、连续语音识别、非连续语音识别和语音学习。目前主要是在支持中英文,实现中英文混合识别问题上,存在一些障碍。同时在识别大量词汇和个别发音方面还很难做到准确。 语音识别的发展历程: 语音识别技术萌芽于50年代机器翻译研究时期,到60年代末70年代初,此课题的研究才取得了实质性的进展,一方面是由于计算机的计算能力有了迅速的提高,能够实现复杂的软、硬件环境;另一方面,数字信号处理理论和算法在当时有了蓬勃发展。 80年代新一代智能计算机的研制,以及模式识别、自然语言理解等技术的成熟,为语音识别技术的突破打下了基础。 90年代一些基于非特定人连续语音识别的语音识别技术产品开始出现,较有

文档评论(0)

1亿VIP精品文档

相关文档