语音识别及图像识别认知实习.pptVIP

  • 13
  • 0
  • 约2.34千字
  • 约 16页
  • 2018-06-27 发布于湖北
  • 举报
语音识别及图像识别认知实习

语音识别与图像识别认知实习 刘 刚 liugang@bupt.edu.cn 2014.9 实习内容 基础知识 模式识别基本原理 语音识别基本原理 图像识别基本原理 系统演示 什么是模式识别 模式(pattern) 存在于时间,空间中可观察的事物,具有时间或空间分布的信息。 模式识别(Pattern Recognition) 指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。 模式识别是模拟人的某些功能 模拟人的视觉: 计算机+光学系统--?图像识别 模拟人的听觉: 计算机+声音传感器---?语音识别 模拟人的嗅觉和触觉: 计算机+传感器 模式识别在智能信息处理中的地位 模式识别在信息科学中的地位 信息获取、信息传递、 信息认知、 信息再生、 信息思维、 信息传递、 信息施效 识别论、 通信论、 知识论、 决策论、 智能论、 通信论、 控制论 模式识别的原理框图 语音识别基本原理 什么是语音识别 语音识别是研究如何采用数字信号处理技术自动提取以及决定语音信号中最基本、最有意义的信息的一门新兴的边缘学科。 分类 语音识别(内容) 说话人识别 语种识别 性别识别 情绪识别 语音识别的应用领域 桌面系统 更多是理论研究,应用不多,基础,重要,搜索 嵌入式系统 智能终端,软硬件实现,分布式 电话系统 最大的应用领域(信息服务) 人机交互 语音合成(TTS)基本原理 什么是TTS Text To Speech 框图 评价指标 可懂度、自然度 TTS的应用 CTI基本原理 什么是CTI 计算机电话集成(Computer Telephony Integration),将计算机技术应用到电话系统中,能够自动地对电话中的信令信息进行识别处理,并通过建立有关的话路连接,而向用户传送预定的录音文件、转接来话等。 计算机电信集成(Computer Telecommunication Integration),不仅要处理传统的电话语音,而且要处理包括传真、电子邮件等形式的信息媒体 应用 目前提供的一些典型业务主要有基于用户设备(CPE)的消息系统、交互语音应答、呼叫中心系统、增值业务、IP电话等。 在CTI中的应用 NEC Aspila EX 电话交换机 三汇STH-8电话语音卡 语音门户 图像识别之人脸识别 文字识别、指纹识别、虹膜识别、掌纹识别、人脸识别、车牌识别…… 人脸识别是指通过人脸进行身份确认或者身份查找的技术或系统 人脸图像采集 人脸定位 人脸识别预处理 身份确认以及身份查找等; 人脸识别的应用 公安刑侦破案 通过查询目标人像数据寻找数据库中是否存在重点人口基本信息。例如在机场或车站安装系统以抓捕在逃案犯。 门禁系统 受安全保护的地区可以通过人脸识别辨识试图进入者的身份。 摄像监视系统 在例如机场、体育场、超级市场等公共场所对人群进行监视,以达到身份识别的目的。 网络应用 利用人脸识别辅助信用卡网络支付,以防止非信用卡的拥有者使用信用卡等。 演示系统(1) 关键词识别系统 计算机声控系统 语音检索系统 广播新闻语音检索demo 音频样例检索系统 哼唱检索系统 人脸检测系统 演示系统(2) 语音检索 检索对象: 广播新闻语音,如新闻联播 检索输入: 文本 * 模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。 什么是模式和模式识别?广义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以称之为模式;狭义地说,模式是通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息;把模式所属的类别或同一类中模式的总体称为模式类(或简称为类)。而“模式识别”则是在某些一定量度或观测基础上把待识模式划分到各自的模式类中去。 模式识别的研究主要集中在两方面,即研究生物体(包括人)是如何感知对象的,以及在给定的任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家、生物学家、神经生理学家的研究内容,属于认知科学的范畴;后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果 * 用户接口/查询手段 多媒体检索 * 模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪

文档评论(0)

1亿VIP精品文档

相关文档