《Python程序设计》课件第四章_Unicode与字符串.pptxVIP

  • 1
  • 0
  • 约1.69千字
  • 约 57页
  • 2024-05-25 发布于广东
  • 举报

《Python程序设计》课件第四章_Unicode与字符串.pptx

第4章Unicode与字符串;字符编码的发展历程

Unicode标准

Python字符串相关类型

编码和解码

字符串的常用方法

;字符编码的发展历程;文本是人类语言书面化的表现形式

当今主流计算机本质上只能处理二进制数据

二进制数的一位所包含的信息称为1比特(bit),其值只有0或1

比特是计算机中记录信息的最小单位

字节:8比特作为1个字节(byte)

字节是计算机内存中可寻址的最小单位,即一个字节是计算机内存支持的最小数据存取块的大小,无法单独存取小于一个字节的信息;Thebitisabasicunitofinformationincomputinganddigitalcommunications

Abitcanhaveonlyoneoftwovalues,andmaythereforebephysicallyimplementedwithatwo-statedevice

电路的高电平状态与低电平状态

电容的充电状态与放电状态

磁盘上磁性材料粒子的两种不同的磁化状态

Thesevaluesaremostcommonlyrepresentedaseithera0or1

;Thebyte(字节)isaunitofdigitalinformationthatmostcommonlyconsistsofeightbits(8个比特).

Historically,thebytewasthenumberofbitsusedtoencodeasinglecharacteroftextinacomputer,andforthisreasonitisthesmallestaddressableunitofmemoryinmanycomputerarchitectures.

1byte=8bits.28=256.Permitsvalue0through255

;ASCII(/??ski/ASS-kee)

AmericanStandardCodeforInformationInterchange

ASCII第一次以规范标准的类型发表是在1967年,最后一次更新是在1986年,共定义了128个字符(编号从0至127),一个字节包含8位(8比特),而8位能够表示256个独立的状态,剩下的第8位被空置

其中33个字符无法显示(一些终端提供了扩展,使得这些字符可显示为诸如笑脸、扑克牌花式等8-bit符号)。且这33个字符多数都已是陈废的控制字符

;1968年版ASCII编码表;ASCII;ASCII;ExtendedASCII(EASCII);EASCII;EASCII;256个字符并不够用;Unicode标准;Unicode;Unicode的基本概念;Unicode的基本概念;Encoding(编码);Encoding(编码);UTF-8;UTF-8;UTF-8;UTF-8;UTF-8;UTF-8(包罗万象);费斯托斯圆盘;费斯托斯圆盘;费斯托斯圆盘;Python字符串相关类型;Unicode字符串str;Unicode字符串str;Unicode字符串str;不可变字节系列bytes;不可变字节系列bytes;不可变字节系列bytes;可变字节系列bytearray;可变字节系列bytearray;编码和解码;用于编码的str.encode()方法;用于编码的str.encode()方法;编码标准;编码标准;用于解码的bytes.decode()方法;用于解码的bytes.decode()方法;编码与解码;编码与解码;编码与解码;字符串的常用方法;字符串对象的常用方法;字符串对象的常用方法;字符串对象的常用方法;字符串对象的常用方法;字符串对象的常用方法;字符串对象的常用方法;字符串对象的常用方法;字符串对象的常用方法

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档