- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十三届现代数学和力学学术会议暨钱伟长诞辰 100 周年纪念大会文集
钱伟长与中文信息处理——兼谈钱伟长的科学精神
陈然
摘要:钱伟长是促进中文信息处理发展和汉字电脑化、汉字现代化的先行者之一。他始终
认为中文信息处理的现代化对中华民族教育和科学技术的振兴具有重要意义。推进汉字现代
化研究和中文信息处理,“主要是为了弘扬我们汉字的无穷威力,为 21 世纪中华民族能在世
界民族之林得到我们应有的地位。”
本文通过文献调研,阐述了钱伟长在中文信息处理发展进程中所做出的贡献,并指出钱伟
长的科学精神是他在中文信息处理处理领域中作出突出贡献的法宝。
关键词:钱伟长;中文信息处理;科学精神
一、缘起
为什么要推动中文信息处理的发展——“我并不是搞文字学的,我与文字学发生关系是
因为我受了气。……”
关于汉字编码——“我们国家的文字已有 3000 年历史了,还要让只有 300 年历史的国家
的人来帮我们,这伤了我们的自尊心。”
“我们应该大声疾呼:我们要保护我们国家的文化,从保护我们国家的文字着手。大声
疾呼,希望大家重视,希望大家研究。……”
1979 年,钱伟长曾参加一个国际会议,会议上有人公开说:“汉字是会影响你们现代化的”,
还说“你们的文字应该改为拼音文字,只有拼音文字才能拯救你们,因为你们的文字是无法
进入计算机的。”
1980 年,钱伟长率团参加了在香港举行的国际中文计算机会议,并公开表示:“中文计算
机将由中国人自己搞,我们自己将做出世界上最实用的、最优化的中文计算机来。”
“我并不是搞文字学的,我与文字学发生关系是因为我受了气。……”因为听到国际会
议上有人说:“你们的汉字进入计算机要靠我们。”胸怀拳拳爱国之心的钱伟长就是不相信
这个论断:“我们国家的文字已有 3000 年历史了,还要让只有 300 年历史的国家的人来帮我
们,这伤了我们的自尊心。”所以,在那次会议之后钱伟长一回国就四处奔波,并于 1981 年
成立了“中文信息学会”——中文信息研究会。
那到底什么是中文信息处理,汉字现代化又经历了怎样的历程呢?
(一)汉字现代化与中文信息处理
什么是汉字现代化,什么是中文信息处理?
人类信息大约 80%是以语言文字为载体的。信息化时代,人类的语言文字传播进入了前
第十三届现代数学和力学学术会议暨钱伟长诞辰 100 周年纪念大会文集
1
所未有的新时代,利用现代信息技术进行信息的收集、加工和交换,成为人类生活的必需。汉
字是我国人民在特定的单音语系环境中创造发展起来的一种特定的系统符号文字。促进汉字
现代化的根本目的是发展生产力。汉字科学在科学技术、教育乃至整个社会主义现代化建设
中都占有重要的地位。【引用】
所谓“中文信息处理”,是指计算机对汉语(包括口语和书面语)进行转换、传输、存贮、
分析等加工的科学。中文信息处理是自然语言信息处理的一个分支,是一门与计算机科学、
语言学、数学、信息学、声学等多种学科相关联的综合性学科。其中,“中文”指中国通用的
所有语言种类,包括汉语及其他少数民族的语言;但一般都是指汉语。“信息”是不确定性
的减少,是负熵。所谓“处理”,是指用计算机对信息进行各种加工,主要是图像信息和语言
信息的识别、模拟、分析和传输。中文信息处理学科是在语言文字学、计算机应用技术、人
工智能、认知心理学和数学等相关学科的基础上形成的一门新兴的边缘学科。
从 1980 年代开始,中文信息处理进入了快速发展阶段,并极大地提高了中文社会的信息
处理效率。应该说,汉字现代化是中文信息处理发展的必要环节。
(二)中文信息处理的研究沿革
在二十世纪上半页,英文打字机的普及极大的提高了文字资料的录入速度。而由于汉字
的复杂性,使中文打字机迟迟未能设计出来,再加之基础汉字的学习难度大、时间长,连鲁
迅都喊出“汉字不灭,中国必亡”。把文字改革和国家文化命运联系在一起,主张汉字拉丁
化、普及世界语,这是当时的普遍思潮。2
历史不会遗忘:上世纪 80 年代初期,外国的专家们关于“汉字无法进入计算机”的言论
还甚嚣尘上;十余年后,这些言论销声匿迹。外国一些知名的计算机公司曾宣称:“你们
文档评论(0)