- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 媒体及媒体处理 第二章 媒体及媒体处理 2.1 概述 2.1.1 媒体数据与信息 2.1.1 媒体数据与信息 媒体、数据、信息、知识之间关系示意图 2.1.2 计算机中媒体种类与性质 2.1.3 多媒体数据的特点 2.2 视觉类媒体 2.2.1 视觉媒体概述 2.2.2 位图图像 2.2.2 位图图像 2.2.2 位图图像 2.2.2 位图图像 2.2.3 矢量图形 2.2.3 矢量图形 2.2.3 矢量图形 2.2.3 矢量图形 2.2.3 矢量图形 2.2.4 动态图像(影视) 2.2.4 动态图像(影视) 2.2.4 动态图像(影视) 2.2.4 动态图像(影视) 2.2.5 符号媒体 2.2.5 符号媒体 2.3 听觉类媒体 等响曲线:频率—声强 (同一响度)音调曲线:频率— 声调 2.3.1. 语音的产生及特征 一、语音的产生: a. 肺部:空气和振动的能源 b.喉咙:声带 --振动源、决定频率的大小 声门-- 声音的节奏 c. 声道:共振腔 喉管---管状共振腔 口腔---可变共振腔 d. 鼻腔:共振腔, 固定形状 e. 发音器官:牙齿、嘴巴、舌头 人们说话时,不断地改变发音器官 的形状,大小,从而产生不同的声音。 2.3.2. 语音的特性 目的:如何对语音进行分析,找出其规律,从而用计算机建模 语音-- 表示语言的声音, 语言-- 由语句、单词组成 2.3.3. 物理特性 问题:物理语音声波波动特性 :频率,振幅。 与 信息(语义) 之间的关系? 一、时域分析 方法: 振幅 - 时间的关系。 1。元音部分:振幅大,周期性明显、 辅音部分:周期性不明显,波形紊乱 2。辅音: 浊音:频率低,振幅大 清音:频率高,振幅小 3。对应语句,可以找出相应的音素音节,但是反之不行, 特点:直观性强,容易数字化 三、 语谱分析 频谱-- 时间 的关系 采用富里叶频谱 F(f)—— t I am a student 特点: 发音的频谱随时间的变化而变化 2.4 其他类媒体 256色标准图像转换成的灰度图 24位标准图像转换成的灰度图 图像的种类 模拟视频标准 目前国际上流行的视频制式标准分别为 NTSC制式、PAL制式和SECAM制式。 美国、日本、中国台湾等地区使用NTSC制 式。 中国及欧洲大多数地区使用PAL制式,PAL 制式规定:每秒25帧,每帧水平扫描线为625条 水平分辨率为240-400个像素点,采用隔行扫描 方式,场频(垂直扫描频率)为50Hz,行频(水平 扫描频率)为15625Hz。 法国、俄罗斯、非洲地区采用SECAM制式。 图像概述 图(picture):通过摄影或描绘得到外在景物的相似物。 像(image):直接或间接(如拍照)人或物的视觉印象 图像:凡是能为人类视觉系统所感知的信息形式或人们心目中的有形想象。 位图图像(bitmap):在空间和亮度上已经离散化了的图像。 几个重要的技术参数 分辨率:屏幕分辨率、图像分辨率、像素分辨率 图像颜色数:真彩色概念 位图图像的数据量:设图像的垂直方向分辨率为h像素,水平方向分辨率为w像素,颜色深度为c位,则该图像所需数据空间大小B为: B=(h*w*c)/8(字节) 图像的采集、存储与输出 采集:扫描仪、摄象机等 存储:包括说明部分和数据两部分 说明部分:图像格式,深度、高度、宽度、调色板、压缩方法。 数据部分:描述每一个像素颜色的数据。 文件格式:tiff, bmp 、dib、 tif 输出:显示器、打印机、录像带 图像的处理:原始采样图像要经过处理才能使用。 图像处理主要过程如下: 图像数据的压缩: 图像的优化: 图像的编辑: 图像格式转化 常用优秀图像处理软件:PhotoShop, AcdSee等 矢量图形(图形)概述 Graphics是一种抽象化的图像,是对图像依据某个标准进行分析而产生的结果。它不直接描述数据的每一点,而是描述产生这些点的过程及方法。 图形以一组指令的形式存在。指令可描述:线、圆、弧、矩形的大小和形状及曲面、光照、材质等。 图形的显示过程:解释指令,以计算时间换存储空间 图形的特性 图形是对图像抽像的结果:可由人工(数字化仪)或计算机来做: 图像分析:计算机自动将图像转化位图形的过程 提取对象:单线条、轮廓、图元,字符、颜色块等 成功的例子:OCR、电路图、工
您可能关注的文档
- 多媒体技术第四讲.ppt
- 多媒体技术复习资料.doc
- 多媒体技术基础及应用试题及答案5.doc
- 多媒体技术基础作业第三部分(教材第七.doc
- 多媒体技术简介.ppt
- 多媒体技术教程.ppt
- 多媒体技术实验指导.doc
- 多媒体技术应用知识点.doc
- 多媒体技术与应用.doc
- 多媒体技术与应用教学要求及知识点.doc
- 2025至2030中国婴儿拉式蚊帐行业发展现状及发展趋势与投资风险报告.docx
- 2025至2030中国半导体陶瓷靶行业项目调研及市场前景预测评估报告.docx
- 2025至2030中国果汁行业供需趋势及投资风险报告.docx
- 2025至2030中国双节距滚子链行业项目调研及市场前景预测评估报告.docx
- 2025至2030全球及中国电子电气中的cPDM行业项目调研及市场前景预测评估报告.docx
- 2025至2030工业风幕行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至20305G技术行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030钛合金行业产业运行态势及投资规划深度研究报告.docx
- 2025至2030中国冶金工程施工总承包行业运营态势与投资前景调查研究报告.docx
- 2025至2030铁路IT支出行业产业运行态势及投资规划深度研究报告.docx
最近下载
- 2024年中国零售商调查报告—全球化视角之海外门店拓展.pdf VIP
- 八大特殊作业(八大危险作业)安全管理知识与规范培训(PPT132页).pptx VIP
- 银行会计岗位招聘笔试题(某大型集团公司)试题集解析.docx VIP
- 磅房计量考试试题及答案.doc VIP
- 绿化养护标准及收费办法.docx VIP
- 儿童闭塞性细支气管炎的诊断和治疗(2023版)专家共识解读课件.pptx VIP
- CTX-M耐药基因流行病学调查及耐药机制研究.pdf
- 中国共产党纪律处分条例测试题附答案+考试注意事项.doc VIP
- 财务会计与税务会计差异及协调探讨.doc VIP
- (高清版)DG∕TJ 08-2410-2022 文物和优秀历史建筑消防技术标准.docx VIP
文档评论(0)