汉字信息电脑存储比英文节省一半.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电脑新时代汉字不再落后,其处理效率已经反超英文(其一) 在工业时代,在使用铅字的时候,汉字的机械化处理,诸如机械打字、四码电报、铅活字排版印刷,都显著地落后于英文。这是催生汉字落后论的一个重要社会技术原因。1995年,铅字被淘汰了,电脑打字、网络通信、计算机激光照排取代了繁难、低效的机械打字、四码电报、铅活字排版印刷。这时候汉字依然落后吗?有一些人,包括一些权威的语文学家和管理者,他们认为:电脑产生在使用拉丁字母的西方国家,电脑最适合使用拼音文字的西方,我们实现汉字电脑化处理,花费、开销比西方大得多,效率差得多。本文作者想在这里指出:这种认识是没有根据的,是不符合实际的。实际上,汉字的电脑化处理不再比英文落后、繁难,其处理效率实际上一节实现了对英文的反超。 汉字信息电脑存储----从沉重负担到比英文节省一半 全文参见http///u/2579145677—39】。统计中没有计入文题、词牌名、题解、注释等项。正文统计中含空格及标点。统计结果表明:汉文的简约特点是鲜明的。汉字信息的存储量仅仅是英文的1/d,节省的部分为:(d-1)/d。由于d的值最小为2,故汉文版编码表示用电脑字节数至少比英文省一半(英文比汉字费一倍)。汉文版这种简约性因体裁不同而差异甚大。中国古诗简约性最强,现代白话文为最弱。但这最弱,也只是英文的一半。就文字编码表示、存贮来说,汉字的简捷性具有明显优点, 同一文本的英文版占用电脑存贮量至少比汉文版多耗费一倍。 如果读者想要自己做一下简单统计,还可以用下述办法。我们取一本对外汉语教材《一百句式汉语通》(鲁川,孙文方主编,华语教学出版社,2008年)。取其中六个课文(具体为第2课、22课、42课、62课、82课、98课),共包含16个句式。每个句式都是汉字、英文和汉语拼音对照的。很容易统计出这些课文所含汉字、英文字母、汉语拼音字母的个数(对英文和汉语拼音需要计入空格数)。具体统计结果为: 汉字:英文:汉语拼音=92:381:307=1:4.14:3.34近似地=1:4:3。 由于计算机存储一个汉字用2个字节,存储每个字母用1个字节,所以三种表示所耗费计算机存储量的比例为2:4:3=1:2:1.5。换句话说,同样内容的三种文本所消耗的存储量,英文的是汉字文本的二倍;汉语拼音的是汉字文本的一倍半。类似于《一百句式汉语通》这样有三种文本对照的书籍很多,有兴趣的读者可以选择身边的材料做类似的简单统计。 计算机存储器发展情况 今天的普通微机,包括笔记本电脑,其存储量都已经足够大,用户使用时通常不必担心存储量不足的问题。这与二三十年前截然不同。表7.2给出国产计算机存储器规模的数据。这些机器包括了微型机之前的主要机型,其中没有一种机器的内存能够容得下最低精度的汉字字库(均小于218KB)。再看表9.3,其中列出美国IBM公司著名机型IBM 360的存储量数据。IBM 360是上个世纪六七十年代风靡世界的产品,是微型机之前IBM公司销量最大的产品。从表9.3可见,其中83%的机器内存小于64KB;只有22台(仅占0.12%)肯定能够放得下一个低精度汉字库;仅仅13% 的 机器的高配置放得下一个低精度汉字库。表9.2、9.3表明,在微型机之前,对国、内外的计算机,汉字字库都是沉重负担,也可以说,是无法承受之重。 表9.2 上个世纪50~70年代中国国产计算机的内存容量 年代 机器型号 字长 内存容量 (字数) 内存容量 (字节数) 1958 103 31 1024 4KB 1959 104 39 2048 10KB 1964 109 32 8192 32KB 1970 111 48 32K字 192KB 1971 709 48 32K字 192KB 1973 150 48 32K字 192KB 1974 DJS130 16 4~32K字 8~64KB 9.3 上世纪六七十年年代风靡世界的IBM 360机的内存容量 机器型号 推出年月 内存字节数KB 生产台数 所占比例 (总台数:18838) IBM360-20 1966.1 4~6 KB 7966 86% IBM360-30 1965.5 8~64 KB 8219 IBM360-40 1965.5 16~262 KB 1758 13% IBM360-44 1966.10 32~262 KB 78 IBM360-50 1965.9 64~262 KB 589 IBM360-65 1966.3 131~1024 KB 206 IBM360-75 1965.11 262~1024 KB 17 0.12 IBM360-90 1967.2 512~16384KB 5 表9.4. 上世纪80年代以来部分微型机性能* 年 型

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档