汉字输入技术与方法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉字输入技术与方法.txt让人想念而死,是谋杀的至高境界,就连法医也鉴定不出死 因 o o o o o 0 第三章汉字输入方法 ? 文字录入是屮文信息处理的第一步,它可以借助三种手段来实现,即键盘输入、汉字字 形识别和汉字语音识别。 ? 在这三种方式屮,汉字的键盘输入是主流的输入方式,而汉字字形识别输入和语音识别 输入是汉字输入发展的一个趋势,将来的输入技术将是一个多元化的格局。 笫三章汉字输入方法 第一节汉字键盘输入 ? 汉字的键盘输入可分为两种基本的形式: ? 一是通过专用的大键盘来进行幣字的输入,其效率低下,成本高,己经基木不用。 ? 二是通过标准的PC键盘(小键盘)来进行输入,显然,要完成输入过稈,就必须对汉 字进行编码,因此小键盘的输入是一种编码输入。其效率高、成本低,已经成为主流的输入 方式。 第一节汉字键盘输入 ? 如前所述,依据编码的思路不同,可将编码分为流水码、拼音码、拼形码、音形结合码 四类。 ? 每一-种编码都有其特点,在键盘输入方面,日前的格局是职业打字员使用形码(如五笔 字型),非职业打字员使用音码(如全拼),音码向智能化方向发展,相对形码而言优势越加 明显。当前音码的主要不足是不能实现盲打。将音字转换从语旬级拓展到篇章级可以解决盲 打问题。因而可以肯定:音码输入加智能转换,将成为未来键盘输入的主流。现在主要的问 题在于如何提高转换精确度。 第一节汉字键盘输入 ? 汉字键盘输入系统是由编码层次和软件层次两部分构成,这两个层次互相补充,互为依 托,构成完整的输入系统。从“高频先见”、“联想”到“自动识别重码字、词”,软件智能化 的程度在不断提高。 ? 赋予计算机一定的有关汉字、汉语的语法、语用知识,计算机可根据这些知识来取代原 來需要人脑记忆的某些编码规则,辨别同音字和人工选定重码字、词或联想字、词。 第一节汉字键盘输入 ? 一、流水码的代表:内码输入法 ? 内码输入法是Windows内置的一种输入法,它支持区位码、GBK内码、UNICODE码三种 方式的输入。 第一节汉字键盘输入 9 ? 区位码的前二位是区码,后二位是位码。区的编码是从01-94,位的编码也是从01-94。 在区位码输入方式下,键入相应的区码和位码就可以输入一个汉字。汉字是从16区到87 区,01至15区是图形符号和字母。区位码输入支持《信息交换用汉字编码字符集一基 木集》即GB2312-80的内码输入方式。内码编码的范围为:OxAlAlOxFEFE。 ? C;BK内码输入覆盖了汉字扩展内码规范一 GBK屮规定的全部汉字。 ? UNICODE码输入支持《通用多八位编码字符集(UCS)》-国际标准 IS0/IEC10646. 1-1993屮规定的全部汉字。 第一节汉字键盘输入 9 ? ? 可以输入所有的汉字,包括所有的符号,和内码一一对应,只要内码支持多少汉字,它 就可以输入多少字。如在Office XP的简体屮文版屮,可以达到对6万多汉字的输入支持。 ? 对于不认识字的字也可以输入,可以通过偏旁部首对照表来进行 9 9 ■ ? 安装Office XP简体屮文版,Microsoft在屮文简体版Office XP及相应多语言包屮, 专门开发了超大字符集屮文字体(宋体-方正超大字符集)及增强型区位码。 ? 宋体-方正超大字符集字体包括了 27,564个汉字以及在第二平面屮(42,711)选出的 36, 862个在屮国大陆,香港特别行政区(以及部分台湾地区)使用的汉字。因此包括西文等常 用字符在内,宋体-方正超大字符集共包括65, 531个字符。 ? 宋体-方正超大字符集屮包括了 6万4千多汉字,但是由于其中相当多的汉字读音很难确 定,使得按拼音输入的方法难以实现。为此,微软公司专门扩展了原区位/内码/Unicode输 入法,开发了增强型区位码。对于GBK屮的汉字(即在Unicode中U+4E0CTU+9FFF),用户可 以继续按原来的方式输入(通过输入区位码,GBK内码或Unicode码)。但是对于扩展A的汉 字只能通过输入Unicode码,对于扩展B只能通过输入一种4字节的Surrogate码。总Z, 通过增强型区位码用户不仅可以输入GBK的汉字,而且可以顺利输入扩展A及扩展B的汉字。 ? 用户只需就要杏找汉字在《康熙字典》(或《汉语大字典》)屮相应的页码(《康熙字典》 的XXXX. XXX或《汉语大字典》的XXXXX. XXX),并在搜索屮将该页码字符串作为关键字进行 搜索,找到相应的Unicode或Sxrogats然后激活增强区位输入法即可进行输入。 ? 《康熙字典》页码格式为:XXXX. XXX《汉语大字典》页码的格式为:XXXXX. XXXo这里 特别要注明的是这里数据来源于1958年1月第一版的《康熙字典》。 ? 这里小数点前为

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档