湖北民族学院文与传媒学院课程论文.docVIP

湖北民族学院文与传媒学院课程论文.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
湖北民族学院文与传媒学院课程论文

湖北民族学院文学与传媒学院 《语言文字信息处理》2009级课程论文(设计) 中文信息处理应用研究报告 院系:文学与传媒学院 专业:汉语言文学 姓名:刘敏、沙木 学号:010940120、010940236 指导老师:谭宪 二〇一〇年十一月四日 目录 第一章 信息的概况 信息是构成世界的三大要素之一 信息改变了我们的观念系统 信息是控制物质和能量的重要符号 第二章 语言文字与信息处理 语言文字是人类社会最重要的信息载体 语言文字信息处理是一门新兴科学 第三章 中文信息处理 概况 范围 中文信息处理的必要性 中文信息处理的发展 中文信息处理的前景 中文信息处理的任务 中文信息处理的特点  汉字之难——被打字机抛弃的时代:在二十世纪上半叶,英文打字机的普及极大的提高了文字资料的录入速度。而由于汉字的复杂性,使中文打字机迟迟未能设计出来,再加之基础汉字的学习难度大、时间长,连鲁迅都喊出“汉字不灭,中国必亡”。之后,虽然设计出中文打字机,但要配备数千个铅字组成的大字盘,昂贵的机器成本和复杂的使用技术决定它不能普及到大众使用。毛泽东对此也深感无奈,发出了中文“要走世界共同的拼音文字道路”的慨叹。这些局限于历史条件所限而做出的言论,在中文信息处理技术发展后期仍然被经常(断章取义的)提及。汉字成了被打字机抛弃的“落后文明”,直到二十世纪八十年代PC技术推广下,中文PC系统问世,中文信息输入的问题,才有了初步解决。汉字的拉丁化问题:汉字拉丁化,是给汉字进行注音的方法,从而易于中西方交流,或者代替汉字。有些人以为将汉字改造为字母文字,希望以此在短期内大幅增加中国人民的识字率。 信息的接收包括信息的感知、信息的测量、信息的识别、信息的获取以及信息的输入等; 信息的存储就是把接收到的信息或转换、传送或发布中间的信息通过存储设备进行缓冲、保存、备份等处理; 信息转化就是把信息根据人们的特定需要进行分类、计算、分析、检索、管理和综合等处理; 信息的传送把信息通过计算机内部的指令或计算机之间构成的网络从一地传送到另外一地; 信息的发布就是把信息通过各种表示形式展示出来。 中文信息处理是指用计算机对中文的音、形、义等信息进行处理和加工。中文信息处理是自然语言信息处理的一个分支,是一门与计算机科学、语言学、数学、信息学、声学等多种学科相关联的综合性学科。信息处理技术在现代有广泛的应用,从1980年代开始,中文信息处理进入了快速发展阶段,并极大地提高了中文社会的信息处理效率。中文信息处理分为汉字信息处理与汉语信息处理两部分,具体内容包括对字、词、句、篇章的输入、存储、传输、输出、识别、转换、压缩、检索、分析、理解和生成等方面的处理技术。方的交流很早就有了,而不同的文化交流需要语言的沟通,汉字拉丁化可以实现西方人对中国的了解。 近代以前,汉字的拉丁化基本由西方人进行。近代中国遭受了一系列的变故,彻底打破了中国固有的文化自豪感。中国近代的一些思想家认为中国古代的一些历史遗留阻碍了中国的发展,包括孔子思想、礼教等,其中也包括汉字。 汉字由于其字数众多,学习比较费劲,而且由于师承不同,字的具体写法也有不同。近代科学大量引入中国,汉字在这些概念面前变得不够使用,又由于新文化运动影响,汉字改革遂成为主流的社会思想。其中刘半农、鲁迅等提倡尤甚。  基于历史、国家疆域、政治等各种问题,中文信息处理系统所需要处理的文字,有    ?? 中文信息处理 时不仅包括简体汉字、繁体汉字,也包括藏文、蒙文、壮文、维吾尔文等大量少数民族的文字,周边国家的日本假名、谚文,还包括古汉语文字、西夏文、契丹文等各种不同的文字。 中文信息处理可以从硬件及软件两方面去看,以下详述中文信息处理的发展历史、现况及未来发展等多方面的面貌。 60年代,汉字电报译码机 50年代,103、104计算机的俄汉翻译 70年代,我国才系统地研究中文信息处理 80年代,中文信息处理的基础研究蓬勃发展信息处理得到广泛应用 21世纪,中文信息处理存在挑战和机遇 中文信息处理的特点 1.大字符集。基本集(GB2312-80)6763个汉字,港台地区使用的繁体汉字13053个,CJK共20902个汉字。要实现全汉字的信息处理目标,单是字库的研制就任重道远; 2.编码方案众多:要使用字母数字键盘对汉语信息进行输入就要对汉语汉字进行编码。由于汉语汉字是音形义的结合体,采用不同的信息载

文档评论(0)

qi1920809 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档