多媒体原理和系统设计复习总结.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒体原理和系统设计复习总结

多媒体原理与系统设计 多媒体技术概述 相关基本概念 媒体:信息传输、存储和呈现的载体 新媒体:艺术与现代数字媒体技术结合的新型媒体形态 媒体分类: 感觉媒体:作用于感觉器官的信息形态 表示媒体:以模拟或数字编码形态出现的感觉媒体 显示媒体:(显示器) 存储媒体:(光盘) 传输媒体:(光纤) 多媒体(技术):融合了两种以上感觉媒体的协同应用系统和技术,以帮助人们获得更丰富的应用体验 超媒体:(媒体的媒体)通过超链接技术构成的多媒体系统 多媒体技术的特点: 媒体形式的多样性 媒体技术的集成性 媒体应用的交互性 应用场景 多媒体电子消费领域 现代教育技术领域 通信领域 军事领域管理与决策领域 表演与会展领域 信息可视化领域 物联网工程领域 Web应用系统 多媒体技术的体系结构 数字音频基础 声音的相关概念 声音的基本物理属性:频率、振幅 声音的三要素:音高、音色、音强 模拟音频(Analogous Audio):用连续的电流或电压表示的音频信号 数字音频(Digital Audio):通过采用和量化技术获得的离散性(数字化)音频数据 采样频率:单位时间内采集的样本数,是采样周期的倒数 CD-Audio采样频率为44.1kHz 一般网络和移动通信采样频率:8kHz 量化深度:表示一个样本的二进制的位数(样本的比特数) 声卡的结构及工作原理 功能模块: DSP:Digital Signal Processor(数字信号处理器) Sampling(采样) Quantization(量化) Code and decode(编/解码) D/A Synthesizer:合成器 ROM/RAM:波表 Mixture:混声器(过滤、去噪、切换单/双声道) 数字音频编码 音频编码:将模拟音频转换成数字音频里并以某种格式存储的技术或过程 PCM编码:即通过脉冲编码调制的方式生成数字音频数据的技术或格式 PCM的均匀量化:量化阶跃值是常数的PCM量化 非均匀量化:量化阶跃值为变量的PCM量化(又称非线性量化) μ律压扩:有μ洗漱调节的对数函数型非线性量化PCM编码 A律压扩:由A系数调节的分段函数型线性与非线性组合量化构成的PCM编码 增量调制编码(DM):通过增量起伏来记录模拟音频信号实际变化过程的数字音频编码(数据量很小,用离散的跳跃信号去仿真(模拟)去逼近输入信号的变化) DM算法描述: y0 = 0; y[0] = 0; x[0] = 1; for (ith sampling not end) { if ( x[i-1] == 1 ) y[i] = y[i–1] + D ; else y[i] = y[i-1] - D ; if ( yi y[i] ) x[i] = 1 else x[i] = 0; } 音频数据处理程序设计 音频数据格式分析 波形音频文件格式:存储数字音频样本序列的格式文件,该文件直接记录的音频的波形 WAVE波形音频文件:使用最广泛,遵从RIFF格式标准 文件结构:RIFF WAVE Chunk、Format Chunk、Fact Chunk、Data Chunk wav数据的bit格式形式: 单声道8bit量化、双声道8bit量化 单声道16bit量化、双声道16bit量化 音频回放与编程接口 使用PlaySound函数 使用MCI函数 基于DirectShow开发包的应用程序:目标是简化在Windows平台上创建数字媒体的任务,通过将应用程序从数据传输、硬件区别、同步中隔离出来 诸多挑战: 多媒体流包含大量需要被快速处理的数据 音频和视频必须同步 数据来源很多:本地、计算机网路、广播、摄像机 数据格式繁多: Audio-Video Interleaved (AVI) Advanced Streaming Format (ASF) Motion Picture Experts Group (MPEG) Digital Video (DV) 应用程序并不能预见终端设备上的硬件 基于Media Foundation开发包的应用程序 基于MF的音频转码程序设计 无损数据压缩编码 熵编码 算术编码(Arithmetic Coding) 行程编码:可用索引+索引对象(重复对象)的方式来表示 字典编码 第一类字典编码:用指向早起曾经出现过的字符串的指针来表示当前被编码字符串 算法:LZ77算法、LZSS算法(LZ77的改进版) 第二类字典编码:从输入的数据流中创建一个短语词典,后续数据流中若出现词典中的短语,则可用该短语在词典中的索引表示该短语,而不需要输出短语本身

文档评论(0)

sanshengyuan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档