- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 数字媒体及应用 基本概念 媒体:信息的表示和传递形式,包括数值、文字、图像、声音和视频。 数字媒体:数值、文字、图像、声音和视频的二进制编码。有自然数字媒体和合成数字媒体两种类型。 5种与计算机信息处理有关的媒体 感觉媒体 如:声音,文字,图画等 表示媒体 如:声,文,图,活动图像的二进制表示 存储媒体 如磁盘,光盘等 表现媒体 如:输入设备,输出设备 传输媒体 如:同轴电缆,光纤,电话线 多媒体技术: 指能够交互式地综合处理多种不同感觉媒体(语言、音乐、文字、数值、图画、活动图像,其中至少包含声音或活动图像)的信息处理技术。 具有这种功能的计算机就是多媒体计算机。 多媒体技术的特点 多样性 集成性 交互性 文字处理是计算机应用的基础 计算机应用=使用计算机进行信息处理 传统的文字处理过程 计算机文字处理过程 文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体 文本由一系列 “字符”(character)组成,每个字符均使用二进制编码表示 文本在计算机中的处理过程是: 5.1.1. 字符在计算机中的表示 一、字符、字符集及其编码表 文字的基本元素是字母和符号,统称为“字符” (character),它包括:字母、数字、标点、符号等 字符集:一组特定字符的集合 不同的字符集包含的字符数目与内容不同,如: 中文字符集、西文字符集、日文字符集等 字符的编码: 字符集中每个字符的二进位表示,称为该字符的编码或代码(code) 不同的字符其编码各不相同 字符集中所有字符的编码的一览表,称为该字符集的码表 二、西文字符的编码——ASCII码 西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成 美国标准信息交换码(ASCII码): ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符 存在问题: 字符集太小(只有128个字符) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码 ASCII码的两个版本 标准ASCII:上述为标准ASCII ,又称为ISO646标准 ISO2022:标准ASCII码的128个字符有时不能满足使用的要求,ISO又制定了ISO2022标准,称为《七位字符集的代码扩充技术》,用八位二进制表示一个字符,高位为1,共有256(28)个字符,前128和标准ASCII一样,后128专用于IBM PC机中,扩充了西腊字母、数学符号、外语字母、商用图符、游戏符号等。 常用特殊字符有:空格(32)、A(65)、a(97)、0(48),26个英文字符同一个字母小写的ASCII码值比大写字母大32(20H)。 三、汉字编码 汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素,有多个国家和地区使用(中、日、韩、新、马······) 汉字的特点 数量大;字形复杂,同音字多,异体字多 如何编码? 确定收入多少字、哪些字? 在字符集中如何排列? 使用多少个二进位进行编码? 常用的汉字编码字符集 国家标准GB2312-1980 汉字扩充规范 GBK 国家标准GB18030-2005 台湾地区的标准汉字字符集CNS 11643 (BIG 5,俗称“大五码”) 日本工业标准汉字字符集JIS X 0208-90 韩国国家标准汉字字符集KSC 5601-87 UCS/Unicode多文种大字符集 1、GB2312汉字编码字符集 1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1980 GB2312字符集由三个部分构成: GB2312汉字的编码 每一个GB2312汉字使用16位(2个字节)表示 为了与ASCII字符相区别,每个字节的最高位均为“1” 区位码 每个字符用两个字节二进制表示,它的代码表分为94个区,对应第一个字节,每个区又分94个位,对应第二个字节。 国标码 区位码不能用于汉字的通信,因为它和国际标准通信码不兼容。 根据ISO2022的规定,必须将区位码中的区号和位号分别加上32(20H)。得到的代码称为汉字的“国际交换码”(简称交换码、国标码)。 交换码用于汉字的传输和交换。 机内码 汉字存储在计算机中的编码称为机内码。 一个汉字有唯一的机内码,占用二字节,并且每个字节的最高位都是“1”。 它在国标码的每个字节的最高位加1得到。这样是为了和ASCII相区别。 区位码、国际码、机内码三者的转换关系 国际码=区位码+2020H 机内码=国际码+8080H 2、GBK汉字内码扩充规范 GB2312的不足: 汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;
原创力文档


文档评论(0)