- 1、本文档共172页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 数字媒体及应用 5.1 文本及文本处理 5.2 数字声音及应用 5.3 图像与图形 5.4 图像处理软件Photoshop概述 5.5 数字视频及应用 5.6 动画处理软件Flash概述 5.1 文本与文本处理 文字处理是计算机应用的基础 计算机应用=使用计算机进行信息处理 传统的文字处理过程 计算机文字处理过程 文字信息在计算机中称为“文本”(text),文本是计算机中最常用的一种数字媒体 文本由一系列 “字符”(character)组成,每个字符均使用二进制编码表示 文本在计算机中的处理过程是: 5.1.1. 字符编码 字符、字符集及其编码表 文字的基本元素是字母和符号,统称为“字符” (character),它包括:字母、数字、标点、符号等 字符集:一组抽象字符的集合,是常用字符的集合 不同的字符集包含的字符数目与内容不同,如: 中文字符集、西文字符集、日文字符集等 字符的编码: 字符集中每个字符的二进位表示,称为该字符的编码或代码(code) 不同的字符其编码各不相同 字符集中所有字符的编码的一览表,称为该字符集的码表 1、 ASCII码——西文字符的编码 西文是表音文字(拼音文字),它由拉丁字母、数字、标点符号以及一些特殊符号所组成 美国标准信息交换码(ASCII码): ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符 存在问题: 字符集太小(只有128个字符) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码 1. ASCII码 目前,国际上使用的字母、数字和符号的信息编码系统是采用美国标准信息交换码 (American Standard Code for Information Interchange),简称为ASCII码。它有7位码版本和8位码版本两种。 每个字符由七个二进制位表示,共有27=128个字符。每个字符占用一个字节(8位)的存储单元,一般计算机中最高位为0,而在传输过程中为奇偶校验位。 注意几个特殊字母的ASCII码,如 A(1000001)2 a(1100001) 2 0(0110000)2 65 97 48 2、扩充ASCII字符集 ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为1的8位代码(十进制数128~255),称为扩展ASCII码。 3、汉字的编码 汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素,有多个国家和地区使用(中、日、韩、新、马······) 汉字的特点 数量大;字形复杂,同音字多,异体字多 如何编码? 确定收入多少字、哪些字? 在字符集中如何排列? 使用多少个二进位进行编码? 常用的汉字编码字符集 国家标准GB2312-1980 汉字扩充规范 GBK 国家标准GB18030-2005 台湾地区的标准汉字字符集CNS 11643 (BIG 5,俗称“大五码”) 日本工业标准汉字字符集JIS X 0208-90 韩国国家标准汉字字符集KSC 5601-87 UCS/Unicode多文种大字符集 (1) GB2312汉字编码字符集 1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1980 GB2312字符集由三个部分构成:7445 (2)其他五个辅助汉字集 1984年,全国计算机与信息处理标准化技术委员会提出编码字符集的繁体字和简体字对应编码的原则,做出了制定六个信息交换用汉字编码字符集的计划。 这六个集均采用双七位编码方式,分别命名为: 基本集(GB2312-80):简体字集 第一辅助集:基本集的繁体字映射集 第二辅助集:简体字集 第三辅助集:辅二集的繁体字映射集 第四辅助集:简体字集 第五辅助集:辅四集的繁体字映射集 (3)GBK汉字内码扩充规范 GB2312的不足: 汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容 GBK汉字内码扩充规范(1995): 在GB2312基础上,增加了1万多汉字(包括繁体字)和符号 共有21003个汉字和883个图形符号,如“計算機”、冃、冄、円、冇等繁体字和生僻字 与GB8312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”: (4)UCS/Unicode多文种大字符集 背景:为了实现全球数以千计的不同语言文字的
您可能关注的文档
- 刘新昱《计算机信息技术教程》第2章2.3 PC主机.ppt
- 刘新昱《计算机信息技术教程》第2章2.4 常用输入设备.ppt
- 刘新昱《计算机信息技术教程》第2章2.5 常用输出设备.ppt
- 刘新昱《计算机信息技术教程》第2章2.6 外存储器.ppt
- 刘新昱《计算机信息技术教程》第2章2.7 常用医学信息采集与处理设备.ppt
- 刘新昱《计算机信息技术教程》第3章 复习重点.ppt
- 刘新昱《计算机信息技术教程》第3章3.1 软件概述.ppt
- 刘新昱《计算机信息技术教程》第3章3.2 操作系统.ppt
- 刘新昱《计算机信息技术教程》第3章3.3 算法和程序设计.ppt
- 刘新昱《计算机信息技术教程》第3章3.4 常用应用软件.ppt
最近下载
- 初中物理(粤沪版)公式大全最新版2016.doc VIP
- 2024年山西晋城市人民医院招聘笔试参考题库含答案详解.pdf
- 2025年第六届全国国家版图知识竞赛题库及答案(超全题库).doc
- 2025年时事政治热点题库及完整答案(历年真题).docx VIP
- 年产2.3亿片阿司匹林片剂生产车间工艺设计.doc
- HOLLiAS MACS V6.5.2用户操作手册(火电版).pdf
- 宜昌市西陵区社工招聘笔试真题 .pdf
- 四川超高层商务楼脚手架专项施工方案(三排落地式脚手架).doc VIP
- NexION1000-2000系列简易操作指南.doc VIP
- 肿瘤专科护士理论知识考试题库600题(含答案).docx
文档评论(0)