第5章多媒体通信系统中的关键技术.pptx

第5章多媒体通信系统中的关键技术.pptx

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章 多媒体通信系统中的关键技术;;5.1 多媒体信息输入输出技术;5.1.1 视频信息输入输出技术;1. 视频卡的基本工作原理;2. 常用视频卡;视频转换/捕获卡 视频转换卡完成计算机视频信号和电视视频信号间的转换 完成由计算机的VGA信号到各种标准制式的电视信号的转换并在电视机上播放或进行录像(PC-TV,VGA-TV) 完成将标准的各种制式电视信号转换成计算机屏幕上显示的VGA信号(TV-VGA) ;视频转换/捕获卡 视频捕获卡主要功能是从视频图像信息中实时或非实时地捕获静态或短时间的动态视频图像。 ;MPEG卡 压缩卡:对静止和动态图像按照相应的标准进行实时和非实时的压缩和还原处理。 解压缩卡(影碟卡):把MPEG文件进行解压缩并恢复播放。它可以播放MPEG-1标准压缩的数字影视片(如VCD)。 视频卡发展方向 与影视技术的结合:可以在一块高档卡上集成视频输入输出、压缩和解压缩、特技效果及视频编辑功能。 与网络通信技术结合:完成多媒体视频会议、可视电话和多媒体通信功能;3. 摄像头;主要性能指标 摄像器件:CCD(成像质量高),CMOS 像素分辨率:30万、130万。。。 颜色深度:24真彩、30真彩。。。 视频捕获速度:帧率,影响流畅度 接口方式:USB速度快,连接简单,即插拔;4. 投影仪;技术指标 亮度 分辨率 灯泡寿命;5.1.2 音频信息输入输出技术;音频卡的主要功能 录制和播放声音文件 对声音文件进行编辑和合成 倒播、增加回音、淡入淡出、循环放音、交换声道等 对数字声音文件进行压缩和解压缩 MIDI音乐录制和合成 利用计算机完成对外部电子乐器的操作和控制 文语转换和语音识别 让计算机朗读文本和让计算机听懂声音信息;声卡的主要作用是对声音信息进行录制和回放 可支持的采样频率 8kHz,11.025kHz——针对一般语音质量的要求 16kHz,22.05kHz,32kHz——针对普通音乐效果 44.10kHz,48kHz——针对高保真音乐效果;5.1.3 语音识别和语音合成技术;语音识别技术;语音识别系统的分类 按可识别词汇量的多少:100以下,100-1000,1000以上 按语音的输入方式:孤立词、连接词、连续词 按发音者类型:特定人、限定人、非特定人 按发音者的声纹:根据语音识别说话人身??;语音识别过程;语音识别过程;语音识别过程;语音识别技术的发展趋势 ;突破性进展表现为:; 目前,全球语音技术市场规模超过30亿美元,近年来年增长率保持在25%以上,未来语音识别市场被看好,其中电信行业(Vo IP等),移动应用领域(手机、学习机、平板电脑、车载系统等移动设备),都会呈现出爆发式增长。下面列举几个电信及移动应用领域成功的语音产品/软件。; 21 世纪是信息和网络的时代,Internet、宽带 IP 网、公用电话网、移动电话网把全球各地连接起来,巨 大的信息资源能够通过网络在短暂时间内迅速扩散到全球范围,几乎所有人与机器进行信息交互相关的需 求和服务,例如自然口语对话、信息索取、电子商务、数字图书馆、远程教育、语音翻译等,都可能会在 网络上实现。 语音识别技术研究和应用的重要发展趋势是,让人在任何地方,任何时间,对任何事都能够 通过语音交互的方式,更加方便地享受到更多的社会信息资源和现代化服务。人类将越来越多地体验到语 音识别技术可能的便捷优点。 ;语音合成;语音合成的研究目标是: 可懂 清晰 自然 具有表现力 研究意义 语音合成技术可以大大改善人机交互环境 计算机反馈信息的方式是屏幕显示。这种单调的信息输出方式给用户带来许多不便,特别是长时间地注视显示屏使人疲劳,降低人获取信息和理解信息的能力。 网络环境的输出设备多种多样:这种枯燥单一的交互方式影响了计算机的应用。 计算机语音输出能提供声文并茂的信息表示方式,可以改变人机交互“默默无闻”的状况,为计算机的普及应用创造更好的条件。 将“能看到”、“看不到”的信息变成“可听”的信息 将“非即时获得的信息”变成“即时可听”的信息;;语音合成技术;有限词汇的计算机语音输出 语音报时、公共汽车报站、叫号系统 基于语音合成技术的文语转化(TTS) 除了完成文字到语音的映射外,还要完成对书面文字的理解以及对语音韵律的处理 ;文语转换技术 有声电子文档、信息电话查询系统、基于计算机的办公教学娱乐多媒体软件、嵌入式操作系统。。 包括文本分析、韵律生成、语音合成 文本分析:使计算机认识文字、如何发音、用什么发音 韵律生成:生成发声文本的韵律特征(声调、停顿等) 语音合成:;§ 6.7 专用语音合成硬件;一个合成系统;;§ 6.8语音合成的应用;语音合成技术的应用;语音合成技术的应用;语音合成技术

文档评论(0)

文单招、专升本试卷定制 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档