- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Python字符串的encode与decode研究
为什么Python使用过程中会出现各式各样的乱码问题,明明是中文字符却显示成“/xe4/xb8/xad/xe6/x96/x87”的形式?为什么会报错“UnicodeEncodeError: ascii codec cant encode characters in position 0-1: ordinal not in range(128)”?本文就来研究一下这个问题。字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。?decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode(gb2312),表示将gb2312编码的字符串str1转换成unicode编码。?encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode(gb2312),表示将unicode编码的字符串str2转换成gb2312编码。?因此,转码的时候一定要先搞明白,字符串str是什么编码,然后decode成unicode,然后再encode成其他编码代码中字符串的默认编码与代码文件本身的编码一致。?如:s=中文如果是在utf8的文件中,该字符串就是utf8编码,如果是在gb2312的文件中,则其编码为gb2312。这种情况下,要进行编码转换,都需要先用decode方法将其转换成unicode编码,再使用encode方法将其转换成其他编码。通常,在没有指定特定的编码方式时,都是使用的系统默认编码创建的代码文件。?如果字符串是这样定义:s=u中文 则该字符串的编码就被指定为unicode了,即Python的内部编码,而与代码文件本身的编码无关。因此,对于这种情况做编码转换,只需要直接使用encode方法将其转换成指定编码即可。如果一个字符串已经是unicode了,再进行解码则将出错,因此通常要对其编码方式是否为unicode进行判断:isinstance(s, unicode)? #用来判断是否为unicode?用非unicode编码形式的str来encode会报错??如何获得系统的默认编码??#!/usr/bin/env python#coding=utf-8import sysprint sys.getdefaultencoding()??该段程序在英文WindowsXP上输出为:ascii?在某些IDE中,字符串的输出总是出现乱码,甚至错误,其实是由于IDE的结果输出控制台自身不能显示字符串的编码,而不是程序本身的问题。?如在UliPad中运行如下代码:s=u中文print s?会提示:UnicodeEncodeError: ascii codec cant encode characters in position 0-1: ordinal not in range(128)。这是因为UliPad在英文WindowsXP上的控制台信息输出窗口是按照ascii编码输出的(英文系统的默认编码是ascii),而上面代码中的字符串是Unicode编码的,所以输出时产生了错误。将最后一句改为:print s.encode(gb2312)则能正确输出“中文”两个字。若最后一句改为:print s.encode(utf8)则输出:/xe4/xb8/xad/xe6/x96/x87,这是控制台信息输出窗口按照ascii编码输出utf8编码的字符串的结果。unicode(str,gb2312)与str.decode(gb2312)是一样的,都是将gb2312编码的str转为unicode编码?使用str.__class__可以查看str的编码形式
您可能关注的文档
- 11级国贸毕业论文设计.doc
- 12013级电商仓储配送优化设计要求.doc
- -电学实验探究电流与电阻的关系.doc
- 排泄与渗透压调节.ppt
- 10月质控.doc
- 12大自然的启示--3.doc
- 12太阳星座与上升及月亮的性格分析.docx
- 130909市场营销-1pptConvertor.doc
- 07-维修电工技能训练教学大纲.doc
- 13临床药师参与1例化疗药物不良反应会诊分析.docx
- 吉林省辽源市东辽县第一高级中学2025届高考仿真卷数学试卷含解析.doc
- 2025届四川省遂宁市重点中学高考全国统考预测密卷数学试卷含解析.doc
- 2025届福建省仙游县郊尾中学高三第三次模拟考试语文试卷含解析.doc
- 2024年安徽阜阳兴泉发展有限公司下属子公司公开招聘工作人员7人笔试参考题库附带答案详解.pdf
- 2025届江苏省无锡市石塘湾中学高三冲刺模拟英语试卷含解析.doc
- 贵州省黔东南州锦屏县民族中学2025届高三第二次联考英语试卷含解析.doc
- 辽宁师大附中2025届高三第四次模拟考试数学试卷含解析.doc
- 重庆市云阳江口中学2025届高考冲刺押题(最后一卷)语文试卷含解析.doc
- 安徽省阜阳市界首市2025届高三第一次调研测试数学试卷含解析.doc
- 2025届黑龙江省牡丹江市高考仿真卷数学试卷含解析.doc
文档评论(0)