EXCEL打开CSV文件乱码的解决方法参照.pdfVIP

  • 1
  • 0
  • 约1.94千字
  • 约 4页
  • 2021-12-10 发布于福建
  • 举报
内蒙古伊利实业集团股份有限公司济南分公司 EXCEL 打开 CSV 文件乱码的解决方法 【故障现象描述】 从网页上导出数据文件存储为 CSV 格式的文件,使用记事本打开文字显示没有问题,使用 EXCEL 打开出现乱码的情况。 【故障原因分析】 此种情况一般是导出的文件编码的问题。在简体中文环境下, EXCEL 打开的 CSV 文件默认是 ANSI 编码,如果 CSV 文件的编码方式为 utf-8 、 Unicode 等编码可能就会出现文件乱码的情况。 【解决方法】 (1)设置 office 语言环境(以 office 2003 为例): 开始菜单 -Microsoft office- Microsoft office 工具 - Microsoft office 2003 语言设置,将 Microsoft office 应用程序默认方式的语言设为“中文(简体) ”,这也是 office 2003 的默认设置。 内蒙古伊利实业集团股份有限公司济南分公司 (2 )使用记事本打开 CSV 文件,文件 -另存为,编码方式选择 ANSI : (3)保存完毕后,用 EXCEL 打开这个文件就不会出现乱码的情况: 内蒙古伊利实业集团股份有限公司济南分公司 【编码方式讲解】 (1)ANSI 编码 不同的国家和地区制定了不同的标准,由此产生了 GB2312, BIG5, JIS 等各自的编码标准。这 些使用 2 个字节来代表一个字符的各种汉字延伸编码方式,称为 ANSI 编码。在简体中文系统下, ANSI 编码代表 GB2312 编码,在日文操作系统下, ANSI 编码代表 JIS 编码。 不同 ANSI 编码 之间互不兼容,当信息在国际间交流时,无法将属于两种语言的文字,存储在同一段 ANSI 编码的 文本中。 当然对于 ANSI 编码而言, 0x00~0x7F 之间的字符,依旧是 1 个字节代表 1 个字符。这一 点是 ASNI 编码与 Unicode 编码之间最大也最明显的区别。例如上面演示的文件中英文字母和数字 并没有出现乱码的情况。 (2 )Unicode 编码 Unicode (统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每 个字符设定了统一并且唯一的二进制编码, 以满足跨语言、 跨平台进行文本转换、 处理的要求。 1990 年开始研发, 1994 年正式公布。随着计算机工作能力的增强, Unicode 也在面世以来的十多年里得 到普及。 Unicode 是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。 Unicode 用数字 0-0x10FFFF 来映射这些字符,最多可以容纳 1114112 个字符,或者说有 1114112 个码位。码位就是 可以分配给字符的数字。 UTF-8 、UTF-16 、UTF-32 都是将数字转换到程序数据的编码方案。 (3)UTF-8 编码 UTF-8 是 UNICODE 的一种变长字符编码又称万国码,由 Ken Thompson 于 1992 年创建。现在 已经标准化为 RFC 3629 。UTF-8 用 1 到 6 个字节编码 UNICODE 字符。用在网页上可以同一页面显 示中文简体繁体及其它语言 (如日文,韩文 ) 。 参考资料: ANSI 编码: /view/1273097.htm 内蒙古伊利实业集团股份有限公司济南分公司 Unicode 编码: /view/40801.htm Utf-8 编码: /view/25412.htm

文档评论(0)

1亿VIP精品文档

相关文档