- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 三 节 汉 字 的 标 准 化
文字作为辅助语言的交际工具必须实现标准化。汉字标准化的主要内容是“四定”,就是定量、定形、
定音、定序。
一、定量
定量就是确定现代汉字的字量,包括各种专门用字的字量,实现汉字字有定量。
汉字自古至今的总字数多达数万。《康熙字典》收字 47000 多字,《汉语大字典》收字 54000 多字
年出版的《中华字海》收字 86000 多字。在这 86000 多字中,大部分是文言古语用字,只有一万多个是现代汉
字。在这一万多个现代汉字中,使用的频率并不相等,有的高有的低。据统计,按照字频由高到低排列,序号
和覆盖率的关系大致如下:
序 号:1000 2400 3800 5200 6600
覆盖率:90%90% 99% 99.9% 99.99% 99.999%999%
频率最高的 1000 字在现代白话文中的覆盖率高达 90% 。这就是说,在 100000 字的文章中大约有 90000 字,是
用这 1000 字写成的。这样的统计规律可以帮助我们实现汉字的分级定量。
(一)常用字
常用字是教学用字,包括小学、初中等几个级别的教学用字。根据汉字字频和覆盖率的关系,我们知道:
2400 个常用字覆盖率 99%,可以作为小学的识字量;3800 个常用字覆盖率是 99.9%,可以作为初中的识字量。
选定常用字要综合考虑以下四个方面因素:第一,频率高的;第二,学科分布广的;第三,构词能力和构
字能力强的;第四,日常生活中常用的。
1988 年 1 月,国家语言文字工作委员会和国家教育委员会公布的《现代汉语常用字表》,收常用字 3500
字。又分为两级:一级常用字 2500 字,二级次常用字字 1000 字。经检测,一级常用字的覆盖率是 97.97%,二
级次常用字的覆盖率是 1.51%,合计是 99.48%。
(二)通用字
通用字是印刷出版用字,是记录现代汉语一般要用到的字。从全部现代汉字中除去罕用字,得到的就是通
用字。选定通用字对于印刷出版、辞书编纂、汉字的机械处理和信息处理都有重要的作用。
中华人民共和国建立以来,政府主管语言文字的部门公布过四个通用字表。⑴1965 年 1月,文化部和中国
文字改革委员会联合公布的《印刷通用汉字字形表》,收通用字 6196 字。⑵1974 年邮电部编辑出版的《标准
电码本》,收通用字 9317 字,其中包括已经废除的繁体字、异体字、日本汉字等。 1983 年出版的《标准电码
本》(修订本),用简化字代替了繁体字,删除了异体字和生僻字,又增加了本》(修订本),用简化字代替了繁体字,删除了异体字和生僻字,又增加了 106 字,共有 7292 字。⑶1981
年 5 月,国家标准局公布的 《信息交换用汉字编码字符集·基本集》,收 6763 字,分两级:一级是常用字 3755
字,二级是次常用字 3008 字。⑷1988 年 3 月,国家语言文字工作委员会和新闻出版署公布的《现代汉语通用
字表》,收通用字 7000 字。
《现代汉语通用字表》是规范字表,它全面体现了国家关于汉字字形的规范。它显示了每个字的规范字形,
包括笔画数、结构和笔顺。
通用字内包括有常用字和非常用字。《现代汉语通用字表》的 7000 字,就包括了 3500 个常用字。
二、定形
定形就是确定现代汉字的字形,实现汉字字有定形。现代汉字的标准字形是由三个字表确定的。
(一)《第一批异体字整理表》。异体字指的是读音和意义相同而形体不同的一组组的字,如:够够、床
牀、窑窰窑。汉字中有许多异体字,给学习和使用增加了负担,所以要对异体字进行整理。整理异体字就是从
每组异体字中确定一个为标准字,其余的字作为非标准字加以淘汰,停止使用。确定标准字形的原则是从俗从
简,而不是根据传统文字学的规定。从俗就是选择群众中比较流行的,从简就是选择笔画比较简单的。 1955年
12 月 22 日,文化部和中国文字改革委员会公布了《第一批异体字整理表》,表内收异体字 810 组,每组最少
有 2 字,最多有 6 字,共有 1865 字。经过整理,每组保留一个为标准字,共保留 810 字,淘汰了 1055 字。例
如(括号内是淘汰的字):布(布)、痴(痴)、唇(唇)、雇(雇)、 管(筦)、迹(迹蹟)、杰(杰)、
巨 (钜)、泪 (涙)、犁 (犂)、猫 (猫)、升 (陞昇)
文档评论(0)