- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.3 字符型数据的表示
2.3.1 西文编码
ASCII码:
只用了7位二进制数对美国自己常用的英文字母、数字、运算符、标点符号等进行编码
控制字符是无法打印或在计算机屏幕上显示的。每个控制字符都对应着一个特定的控制功能,如:CR对应回车键(Enter)、BS对应退格键(Backspace)、ESC对应Esc键等。
通常使用一个字节(8个二进制位)表示一个ASCII码字符,规定其最高位为0。
000
001
010
011
100
101
110
111
0000
32个
控制字符
空格
0
@
P
‘
p
0001
!
1
A
Q
a
q
0010
“
2
B
R
b
r
0011
#
3
C
S
c
s
0100
$
4
D
T
d
t
0101
%
5
E
U
e
u
0110
6
F
V
f
v
0111
`
7
G
W
g
w
1000
(
8
H
X
h
x
1001
)
9
I
Y
i
y
1010
*
:
J
Z
j
z
1011
+
;
K
[
k
{
1100
,
L
\
l
|
1101
-
=
M
]
m
}
1110
.
N
^
n
~
1111
/
?
O
_
o
DEL
b7b6b5
b4b3b2b1
2.3.1 西文编码
ASCII码:
例:“GOOD!”的ASCII 编码用二进制数表示
用十六进制数表示为:
47H 4FH 4FH 44H 21H
2.3.1 西文编码
扩展ASCII码:
国际标准化组织又将ASCII码字符集扩充为8位代码,即ASCII码的扩充。
ASCII码的字符集可以扩充128个字符,也就是使用8位扩展ASCII码能为256个字符提供编码。
这些扩充字符的编码均为高位为1的8位代码(对应十进制数 128~255 ),称为扩展ASCII 码。
扩展ASCII码所增加的字符包括文字和一些图形符号,如ü、é、┴、Ω、√、▓、▄等。
2.3.2 汉字表示
汉字编码需要解决的问题:
计算机键盘上没有按键直接和汉字对应,不能直接利用单个按键输入汉字,需要输入码(多个按键的组合)来对应汉字。
汉字在计算机内的存储需要机内码来表示,以便存储、处理和传输。
汉字个数多、字形变化复杂,需要对应的字库来存储汉字的各种字形,用于打印或显示汉字。
2.3.2 汉字表示
汉字输入码:利用键盘输入汉字时对汉字的编码,是操作者向计算机输入汉字的手段。
拼音码:以汉语拼音为基础的编码方案
搜狗拼音输入法、QQ拼音输入法
字形码:根据汉字的字形进行编码的方案
五笔字型码
基于音形结合的编码
自然码
2.3.2 汉字表示
汉字机内码:
国标码和机内码
GB2312-1980规定每个汉字编码由两个字节构成,实际共定义了6763个常用汉字和682个符号。
GB18030-2000共收录了27000多个汉字。
GB18030-2005以汉字为主并包含多种我国少数民族文字,收入汉字70000多个。
机内码在国标码的基础上每个字节的最高位由“0”变为“1”
汉字字符集至少要用两个字节进行编码
2.3.2 汉字表示
汉字机内码:
Unicode编码与UTF-8
Unicode(统一码、万国码、单一码)
优点:
用4个字节编码
为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换和处理的要求。
不足:
可能带来存储空间的浪费
UTF-8
可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度
2.3.2 汉字表示
汉字字形码:又称汉字字模,用于汉字的显示或打印输出
点阵方式:
存储字符点阵
16×16点阵,24×24点阵、32×32点阵、48×48点阵等
点阵规模越大,字形越清晰美观,所占存储空间也越大。
为了避免数据量过大,点阵方式经常会以牺牲文字质量为代价。但是,对于描述小号汉字点阵方式有明显的优势。
2.3.2 汉字表示
汉字字形码:
矢量方式:
存储数学函数描述的曲线字库,及一系列控制指令。
可产生高质量的汉字输出
明显的缺点是当文字比较小时,表现质量要差一些。
您可能关注的文档
- 袁方全套配套课件大学计算机1-1 IBM公司简介.docx
- 袁方全套配套课件大学计算机1-1 计算机技术的演变.pptx
- 袁方全套配套课件大学计算机1-2 电子计算机的发展.pptx
- 袁方全套配套课件大学计算机1-3 中国计算机发展简史.pptx
- 袁方全套配套课件大学计算机1-4 为什么要学习计算机知识.pptx
- 袁方全套配套课件大学计算机2-1 计算机中的数制.pptx
- 袁方全套配套课件大学计算机2-2 数值型数据的表示.pptx
- 袁方全套配套课件大学计算机3-1 SLC、MLC与TLC闪存技术.doc
- 袁方全套配套课件大学计算机3-1 计算机硬件系统构成.pptx
- 袁方全套配套课件大学计算机3-2 中央处理器.pptx
- 袁方全套配套课件大学计算机3-3 存储器.pptx
- 袁方全套配套课件大学计算机3-5 总线结构.pptx
- 袁方全套配套课件大学计算机3-6 计算机系统结构的发展.pptx
- 袁方全套配套课件大学计算机4-4 软件工程.pptx
- 袁方全套配套课件大学计算机5-1 美国的网络安全意识月.docx
- 袁方全套配套课件大学计算机5-1 计算机网络基础.pptx
- 袁方全套配套课件大学计算机5-2 互联网技术.pptx
文档评论(0)