《MYSQL字符集与乱码问题分析》.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MySQL 字符集 与乱码问题初探 网易杭研王公仆 2013/08/14 乱码问题集 问题1:mysql客户端插入中文内容后再查询却返回乱码 问题2.php网页显示乱码 问题3.XP下打开过的源码文件拷到Linux下编译失败提示 文件格式错误 问题4.utf8到底存储中文占用几个字节 问题5.高考填志愿时姓名的区位码是什么,何谓半角/全角 问题6.有哪些语言支持UNICODE字符集,c语言如何存中文 报告提纲 字符集背景知识 I. 字符集的定义 II. 拉丁文与中文字符集标准简史 III. 统一字符集标准 软件开发中的字符集 I. 编程语言:C/C++/Java II. 操作系统: Windows/LINUX III. 数据库:Oracle/MySQL IV. 文本文件 V. HTML/PHP MySQL 中的字符集 I. 数据类型 II. 字符集的配臵与相关命令 III. 字符集相关BUG分析 乱码相关问题处理 字符集的由来 思想语言文字/ 字符 二进制计算机发明后为了交流所有软件都有本土化和国际化趋势 字符与数值的映射关系可理解为字符集 信息要交流就需要处理各类字符集也需要定义映射标准与编码规则 拉丁语英文字符集 6bits-BCD码  2*26+10 64 曾经一段时间, 整型的字长都是6 的倍数 7bits-ASCII码  扩充标点符号/ 控制字符互不兼容的时代催生1963年首个行业标准ASCII码 8bits-ASCII与ECMA-35  曾经通信领域扩展第8位为校验码而计算机内存无此需求并利用第8位进行更多扩展如印 刷体控制字符等,但其实256 个字符仍不够用,ECMA-35 统一技术标准规范7bits/8bits 编码及 其转换 ISO8859-1/Latin 1  ISO 8859- 1正式编号为ISO/IEC 8859- 1:1998又称Latin- 1或西欧语言,是国际标准化组织内 ISO/IEC 8859 的第一个8位字符集, 以ASCII 为基础在空臵的0xA0-0xFF 的范围内加入96个 字母及符号借以供使用附加符号的拉丁字母语言使用 ISO8599系列标准  为了包含西欧其他国家使用的特殊字符ISO 定义了一系列标准如法语使用ISO8859- 15 (也 称latin 9)含有法语中的à符号,德语中的Ä也类似,ISO8859共有15套 ISO-2022  欧标组织ECMA-35/ 中国国标GB2312/ 日本工业规格JIS X0202/ 韩国工业规格KS X1004  ANSI 微软按照默认代码页code page 的编码方案解释文本数据, 与ISO 字符集兼容 UNICODE/ISO10646通用字符集  由ISO/IEC 组织与UNICODE 小组并行开发  覆盖32bits 字符数目,理论上包含世界上所有字符 LATIN扩展:ISO/IEC 8859系列标准  英语没有重音字母故可使用以上十五个字集中的任何一个来表示  德语因它除了A-Z, a-z 外还含有Ä, Ö, Ü, ä, ö, ß, ü 七个字母,可使用拉丁字集1-4/ 9- 10/13- 16 中的任何一个来表示  此系列中没有8859- 12号 中文字符集 简体中文 GB2312-80 国家标准GB2312于1981年5月1日实施  区位码字符集/6k 汉字/ 双字节定长编码/ 有三种gb2312,hz-gb2312,ISO2022-cn GBK 1995年12月微软完成规范后国内作为技术规范使用  扩充GB2312 主要扩充繁体字也包含日文字符/俄文字符共收录汉字2w1k 个 GB18030-2000

文档评论(0)

ghfa + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档