- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图像的获取(capturing):从现实世界中获得数字图像的过程 图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤: 扫描 分色 取样 量化 从取样图像的获取过程可以知道,一幅取样图像由M(行)* N(列)个取样点组成,每个取样点是组成取样图像的基本单位,称为像素(picture element, 简写为pel)。彩色图像的像素是矢量,它由多个彩色分量组成,黑白图像的像素只有1个亮度值 图像的表示方法与主要参数 取样图像在计算机中的表示方法: 单色图像用一个矩阵来表示 彩色图像用一组(一般是3个)矩阵来表示,矩阵的行数称为图像的垂直分辨率,列数称为图像的水平分辨率,矩阵中的元素是像素颜色分量的亮度值,使用整数表示,一般是8位至12位 图像的表示方法与主要参数 图像的属性信息 图像大小,也称图像分辨率(包括垂直分辨率和水平分辨率) 位平面的数目,即矩阵的数目,也就是彩色分量的数目 颜色空间的类型,指彩色图像所使用的颜色描述方法,也叫颜色模型。常用颜色模型:RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等 像素深度,即像素的所有颜色分量的位数之和,它决定了不同颜色(亮度)的最大数目 图像的表示方法与主要参数 数据压缩类型 无损压缩:压缩以后的数据进行图像还原(也称为解压缩)时,重建的图像与原始图像完全相同 例如:行程长度编码(run length coding ,RLC): 111110005555333302222222 513045431072 哈夫曼(Huffman)编码:对出现概率高(低)的编短(长)码,是变长码 有损压缩:使用压缩后的数据进行图像重建时,重建后的图像与原始图像虽有一定的误差,但不影响人们对图像含义的正确理解。如变换编码、矢量编码等 图像的压缩编码 BMP(BitMaP-file)图像:微软公司在Windows操作系统下使用的一种标准图像文件格式,一个文件存放一幅图像,可以使用行程长度编码(RLC)进行无损压缩,也可不压缩。不压缩的BMP文件是一种通用的图像文件格式,几乎所有Windows应用软件都能支持。 TIFF(Tagged Image File Format)图像文件格式:用于扫描仪和桌面出版,能支持多种压缩方法和多种不同类型的图像,有许多图像图形应用软件支持这种文件格式。由文件头、文件目录、目录条目三个部分组成。 常用图像文件格式 常用图像文件格式 名称 压缩编码方法 性质 典型应用 开发组织/公司 BMP RLC 无损 Windows应用程序 Microsoft TIF RLC,LZW 无损 Desktop publishing Aldus,Microsoft GIF LZW 无损 Internet CompuServe JPEG DCT,Huffman 无损/有损 Internet,数码相机等 ISO/IEC JP2 小波变换,算术编码 无损/有损 Internet,数码相机等 ISO/IEC GIF(Graphics Interchange Format):互联网上广泛使用的一种图像文件格式,它的颜色数目较少(不超过256色),文件特别小,适合网络传输。由于颜色数目有限,GIF适用于插图、剪贴画等色彩数目不多的应用场合。GIF格式能够支持透明背景,具有在屏幕上渐进显示的功能。尤为突出的是,它可以将许多张图像保存在同一个文件中,显示时按预先规定的时间间隔逐一进行显示,从而形成动画的效果,因而在网页制作中大量使用。由CompuServe公司1987年开发,基于Lempel-Ziv Walch(LZW)压缩算法、使用特殊码、可变长度。 常用图像文件格式 1、 我国采用PAL制式的彩色电视信号,其帧频为25帧/s,场频为50场/s 2、数字摄像头最高分辨率为640×480,一般都是352×288速度在每秒30帧左右。 3、PAL制式的电视系统在传输图像时所使用的顔色模型为YUV 三要素: 取样频率 量化位数 声道数目 数字声音未压缩前,其计算公式为: 波形声音的码率 = 取样频率 × 量化位数 × 声道数 压缩编码以后的码率 = 压缩前的码率 / 压缩倍数 波形声音的主要参数 语音合成(Speech synthesis):根据语言学和自然语言理解的知识,使计算机模仿人的发声,自动生成语音的过程。目前主要是按照文本(书面语言)进行语音合成,这个过程称为文语转换(Text-To-Speech,简称TTS)。 文语转换过程 文本分析 韵律分析 语音生成 语音合成 音乐合成 MIDI(Musical Instrument Digital Interface):计算机中描述乐谱的一种标准描述语言,规定了乐谱的数字表示方法(包
原创力文档


文档评论(0)