- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
附录二gbk编码支持的字符
A6产品字符编码问题
目录
1. 前言: 1
2. 检测方法: 1
a) 从开始——程序——附件——记事本中将字符拷贝到文本文件中 1
b) 菜单文件——保存,如果存在不能识别的字符,则会显示 1
c) 关闭记事本,重新打开保存后的文件,不能识别处的符号显示为?号 2
3. 处理方法: 2
a) 对于文件名中含有特殊字符,A6精灵不能上传附件问题的解决 2
i. 检测文件名: 2
ii. 修改文件名 3
b) 对于在表单、协同等文本录入的情况输入的特殊字符不能显示问题的解决 3
4. A6精灵不能识别而IE能识别的原因 4
附录一:汉字编码问题简介: 4
GB2313字符集 4
BIG-5字符集 4
GBK字符集 4
Unicode字符集 4
附录二:GBK编码支持的字符 5
前言:
A6产品在客户端与数据库存储均采用GBK编码方式,对某些特殊字符的使用上有一些限制,下面就GBK的介绍与检测方式,以及针对特殊字符如何处理的说明。
检测方法:
从开始——程序——附件——记事本中将字符拷贝到文本文件中
菜单文件——保存,如果存在不能识别的字符,则会显示
关闭记事本,重新打开保存后的文件,不能识别处的符号显示为?号
处理方法:
对于文件名中含有特殊字符,A6精灵不能上传附件问题的解决
检测文件名:
1将拷贝到需要检测的文件夹的上层,如图所示
2 双击批处理文件,会在当前目录生成一个filename.txt的文件夹,用记事本打开查看,查看含?号的文件名即是A6精灵不能支持的文件名
修改文件名
1 文件少时,做手动修改。找到A6精灵不支持的文件名,将文件名称改名,剔除或替换显示为?号的那个文件名中的字符
2 文件多时且有共同特征时可做批量化修改。对于文件名比较多情况,可采用DOS命令做大批量的修改。需要找到文件名中的共同特征点然后修改,比如本文中可执行DOS命令为
将不能识别的圆点改为中文的圆点,一次性修改了两个文件名。
对于在表单、协同、讨论、公告、新闻等文本录入的情况输入的特殊字符不能显示问题的解决
对于目前的一些输入法支持西文的编码方式,因此采用输入法输入的某些特殊字符由于在中文编码中没有,所以GBK不能正确解析,这种情况采用WORD来插入替换输入法插入的字符。打开WORD应用程序,菜单插入——符号
注:在采用以上方法插入的符号仍然不能正常显示时上报BUG
A6精灵不能识别而IE能识别的原因
IE是Windows的浏览器,作为客户端使用,是支持Unicode编码的,因此可以正确的输入到服务器端并保存。
A6精灵是标准的ANSI编码,与记事本中采用ANSI编码时保存文件时的效果一致,输入到服务器端时该符号已经变为?号,因此不能使用!
附录一:汉字编码问题简介:
GB2313字符集
收入汉字6763个,符号715个,总计7478个字符,这是大陆普遍使用的简体字符集。楷体-GB2313、仿宋-GB2313、华文行楷等市面上绝大多数字体支持显示这个字符集,亦是大多数输入法所采用的字符集。市面上绝大多数所谓的繁体字体,其实采用的是GB-2313字符集简体字的编码,用字体显示为繁体字,而不是直接用GBK字符集中繁体字的编码,错误百出。
BIG-5字符集
收入13060个繁体汉字,808个符号,总计13868个字符,目前普遍使用于台湾、香港等地区。台湾教育部标准宋体楷体等港台大多数字体支持这个字符集的显示。
?GBK字符集
又称大字符集(GB=GuóBiāo国标,K=扩展),包含以上两种字符集汉字,收入21003个汉字,882个符号,共计21885个字符,包括了中日韩(CJK)统一汉字20902个、扩展A集(CJK Ext-A) 中的汉字52个。宋体、隶书、黑体、幼圆、华文中宋、华文细黑、华文楷体、标楷体(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字体支持显示这个字符集。
Unicode
Unicode也是一种字符编码方法,是由国际组织设计,可以容纳全世界所有语言文字的编码方案。Unicode的学名是Universal?Multiple-Octet?Coded?Character?Set,简称为UCS。UCS可以看作是Unicode?Character?Set的缩写。
全国信息技术标准化技术委员会
汉字内码扩展规范(GBK)
Chinese Internal Code Specification
1.0 版
(按编码顺序排列)
81 0 1 2 3 4 5 6 7 8 9 A B C D E F
4 丂 丄 丅 丆 丏 丒 丗 丟 丠 両 丣 並 丩 丮 丯 丱
5 丳 丵 丷 丼 乀 乁 乂 乄 乆 乊 乑 乕 乗 乚 乛 乢
文档评论(0)