- 28
- 0
- 约2.11万字
- 约 5页
- 2017-06-09 发布于天津
- 举报
在Java程序中实现繁简体转换.PDF
EXPERTS………………………………………………………………………………………………”
-·…··f0RU啊OF
在Java程序中实现繁/简体转换
高全生 张小玮
摘 要:在实际应用中,为了方便读者阅读,常常需要进行繁/简体汉字之间的字形转换。这里所
说的转换.准确意义应该称之为映射。即两者都对应各自的Unicode编码,在不同编码之间构筑
一个映射关系。主要研究了在编写的Java程序中实现繁/简体转换映射。
关键词:Java;Unicode编码:BIG5字符
意思:龙腾飞的样子)。
1 设计思想
2.2代码实例
目前纯粹的繁体字符主要由BIG5编码所规定.BIG5码中下面是根据BIG5编码字符集生成所有繁体汉字的部分代
共规定了13053个繁体字:而纯粹的简体字符主要由GB2312
码实例:
编码所规定.仅有6763个简体字。 13ackage
设计思路是:先参照BIG5码的规范.生成13053个繁体‘Importjava.io.BufferedWriter;
i‘mportjava.io.File;
字(每个繁体字都有一个唯一的Unicode编码),再由诸如
lmportjava.io.FileNotFoundException;
Word等权威软件。完成13053个繁体字到简体字(每个简体
1importjava.io.FileOutputStream;
字也都有一个唯一的Unicode编码)的转换。从中找出每个字
。Importiava.io.IOException;
在转换前后所对应的Unicode编码是否有发生变化。 importjava.io.OutputStreamWriter;
i’mport
如果前后有发生变化。则在繁体字的Unicode编码和对应
ireport
的简体字的Unicode编码之间建立映射关系,并将该映射关系
class
public
存入一张Hash表中.以便于将来进行繁体到简体映射的查找。
private outputFileName;
String
如果前后没有发生变化.说明当前繁体字与简体字的字形是一 ,,总繁体汉字数。
致的,不需要映射。 PrivateintcharacterCount=O:
,/常用繁体汉字数。
2根据BlG5字符集产生繁体汉字 PrivateintcommonCharacterCount=0:
删}常用繁体汉字数。
2.1 BlG5编码中的汉字
Privateint
BIG5码使用了双字节储存方法。以两个字节来编码一个 publicString
原创力文档

文档评论(0)