- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MySQL 字符集
与乱码问题初探
网易杭研王公仆
2013/08/14
乱码问题集
问题1:mysql客户端插入中文内容后再查询却返回乱码
问题2.php网页显示乱码
问题3.XP下打开过的源码文件拷到Linux下编译失败提示
文件格式错误
问题4.utf8到底存储中文占用几个字节
问题5.高考填志愿时姓名的区位码是什么,何谓半角/全角
问题6.有哪些语言支持UNICODE字符集,c语言如何存中文
报告提纲
字符集背景知识
I. 字符集的定义
II. 拉丁文与中文字符集标准简史
III. 统一字符集标准
软件开发中的字符集
I. 编程语言:C/C++/Java
II. 操作系统: Windows/LINUX
III. 数据库:Oracle/MySQL
IV. 文本文件
V. HTML/PHP
MySQL 中的字符集
I. 数据类型
II. 字符集的配臵与相关命令
III. 字符集相关BUG分析
乱码相关问题处理
字符集的由来
思想语言文字/ 字符
二进制计算机发明后为了交流所有软件都有本土化和国际化趋势
字符与数值的映射关系可理解为字符集
信息要交流就需要处理各类字符集也需要定义映射标准与编码规则
拉丁语英文字符集
6bits-BCD码
2*26+10 64 曾经一段时间, 整型的字长都是6 的倍数
7bits-ASCII码
扩充标点符号/ 控制字符互不兼容的时代催生1963年首个行业标准ASCII码
8bits-ASCII与ECMA-35
曾经通信领域扩展第8位为校验码而计算机内存无此需求并利用第8位进行更多扩展如印
刷体控制字符等,但其实256 个字符仍不够用,ECMA-35 统一技术标准规范7bits/8bits 编码及
其转换
ISO8859-1/Latin 1
ISO 8859- 1正式编号为ISO/IEC 8859- 1:1998又称Latin- 1或西欧语言,是国际标准化组织内
ISO/IEC 8859 的第一个8位字符集, 以ASCII 为基础在空臵的0xA0-0xFF 的范围内加入96个
字母及符号借以供使用附加符号的拉丁字母语言使用
ISO8599系列标准
为了包含西欧其他国家使用的特殊字符ISO 定义了一系列标准如法语使用ISO8859- 15 (也
称latin 9)含有法语中的à符号,德语中的Ä也类似,ISO8859共有15套
ISO-2022
欧标组织ECMA-35/ 中国国标GB2312/ 日本工业规格JIS X0202/ 韩国工业规格KS X1004
ANSI 微软按照默认代码页code page 的编码方案解释文本数据, 与ISO 字符集兼容
UNICODE/ISO10646通用字符集
由ISO/IEC 组织与UNICODE 小组并行开发
覆盖32bits 字符数目,理论上包含世界上所有字符
LATIN扩展:ISO/IEC 8859系列标准
英语没有重音字母故可使用以上十五个字集中的任何一个来表示
德语因它除了A-Z, a-z 外还含有Ä, Ö, Ü, ä, ö, ß, ü 七个字母,可使用拉丁字集1-4/ 9- 10/13-
16 中的任何一个来表示
此系列中没有8859- 12号
中文字符集
简体中文
GB2312-80 国家标准GB2312于1981年5月1日实施
区位码字符集/6k 汉字/ 双字节定长编码/ 有三种gb2312,hz-gb2312,ISO2022-cn
GBK 1995年12月微软完成规范后国内作为技术规范使用
扩充GB2312 主要扩充繁体字也包含日文字符/俄文字符共收录汉字2w1k 个
GB18030-2000
您可能关注的文档
最近下载
- Parker Lord公司《电池系统组件的绝缘防护技术评估白皮书》.pptx VIP
- 小型白菜类蔬菜栽培技术.ppt VIP
- 白菜类蔬菜栽培技术 (3).ppt VIP
- 建设工程档案归档清单.xlsx VIP
- 2024年河北省职业院校技能大赛中职组“艺术设计”赛项样题-第四套 .docx VIP
- 2025年浙江省初中学业水平信息科技考试试卷(含答案详解).docx
- 退工原因变更申请表 .pdf VIP
- DB15T+3686.3-2024物业管理服务规程 第3部分:秩序维护.pdf VIP
- 职业院校技能大赛艺术设计中职样题.docx VIP
- 大学生简历毕业生简历求职简历 (27).docx VIP
原创力文档


文档评论(0)