- 21
- 0
- 约7.91万字
- 约 132页
- 2017-08-18 发布于湖北
- 举报
Windows BAT批处理 .pdf
批处理文件的编写8-BAT 文件的加密与解密
记事本程序在保存一篇新建的文档时,如果没有指定编码类型,会使
用缺省的ANSI 类型(对于中文版来说,对应的就是GB 码)。
而在打开一篇已创建的文档时,它会分析文档的编码类型,它首
先判断文档头部有无BOM(Byte order Mark,字节序标记,长度为( 2
- 3字节),如有则根据其内容判断编码类型,FF、FE (Unicode),FE、
FF (Unicode big endian),EF、BB、BF (UTF-8)。
因为事实上有很多非ANSI 编码的文档是没有任何BOM 的“纯文
本” ,所以对这些文档不能简单的判断为ANSI 编码。而需要使用一
系列的统计学算法根据文档内容来猜测文档编码。记事本使用了
IsTextUnicode 函数来判断是否为Unicode/Unicode big endian
编码,使用 IsTextUTF8 判断是否为 UTF8 编码。但既然是统计学
算法,就难免存在误判,尤其在文档内容过短时,由于样本的容量太
小,这种误判的概率会显著增大。
比如那个有名的微软与联通有仇的笑话,就是记事本在打开只有
“联通”二字的ANSI 编码文档时,IsTextUTF8 函数将其误判为UTF8
编码。
示例 1
原创力文档

文档评论(0)