- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《中文信息处理》课程教学大纲
课程名称:中文信息处理
课程类别:专业课程
授课对象:计算机科学与技术专业
学 分:3学分
指定教材:朱巧明等,《中文信息处理技术教程》,清华大学出版社,2005年
一、教学目的:
本课程的教学目的是使学生掌握中文信息处理的基本原理,熟悉基本“字符”层面和基于“内容”层面的研究内容、方法、技术和手段。熟练理解并掌握计算机对中文的输入、存储、输出和应用处理的过程,学习基本的机器学习理论与方法。
本课程对计算机科学与技术的学生有着承前启后的作用,综合结合运用前导课程,又为毕业设计和将来研究生学习或工作奠定扎实基础。本课程的直接前导课程有《C语言程序设计》、《面向对象程序设计》、《数据结构》和《操作系统》。
二、教学任务:
本课程主要教学任务如下:
了解中文信息处理与信息处理的关系,主要研究内容与对象,目前主流的研究技术、手段与方法;
掌握中文信息处理中的汉字代码体系,熟悉主要的中文字符编码与集合,熟悉因特网上的汉字交换码以及编码与解码技术;
深刻理解中文操作系统和中文平台的地位,掌握汉字输入码、机内码、地址码、字形码、地址码、交换码之间的关系;了解主流的中文操作系统的发展趋势
学习汉字编码的方法,理解中文输入的原理,掌握Windows上汉字键盘输入系统的实现方法,了解Linux中文输入的实现机制。
学习目前主要的三种汉字字形技术,重点掌握点阵字库的原理,压缩方法,以及显示技术。
理解汉字显示和打印的工作原理以及工作过程。
理解中文分词的意义,地位、以及主要应用,掌握交集型歧义和组合型歧义的区别,了解基本的解决歧义的方法,能够实现一种中文自动分词算法。
对中文信息检索、分类、抽取等有较深刻的认识,了解需要解决的问题,以及主流的技术方法。了解基本的机器学习理论,以及常用的数学模型。
三、教学内容
第一讲 中文信息处理概论(一)
1. 教学内容
什么是信息
信息处理
中文信息处理
中文信息处理发展简史
语料库
互联网与中文信息处理
2. 教学要点
通过本讲的学习,让学生理解信息处理和中文信息处理的概念,理解中文信息主意研究对象和研究意义,熟悉中文信息处理的发展历史,并了解中文信息处理的国际化趋势。
第二讲 中文信息处理处理概论(二)
1.教学内容
汉语的特点
自然语言处理的难点
自然语言处理的基本方法及发展方向
2. 教学要点
通过本讲的学习,让学生掌握现代汉语的特点,知道自然语言处理中的难点,初步了解自然语言处理的基本方法以及发展方向。
第三讲 汉字代码体系
1、教学内容
ASCII码及其扩展
中文信息在计算机内的表示
ISO/IEC 2022
汉字编码字符集
GB2312-80
BIG-5
Unicode和ISO10646
GBK和GB18030
2、教学要点
通过本讲的学习,学生应掌握中英文信息在计算机中的表示,以及汉字的代码体系,理解几种常用的汉字编码字符集和汉字的排序规则。理解汉字编码字符集之间的关系以及发展方向。
第四讲 因特网汉字信息交换技术
1、教学内容
汉字信息交换技术概述
二进制文件编码方法
常用Internet编码方法
Unicode实现方式
2、教学要点
通过本讲的学习,理解Internet上常用的字符编码集,理解为何需要汉字交换码,掌握常见交换码的编码与解码算法,并能够通过程序加以实现编码与解码过程。
第五讲 中文系统平台概述
1、教学内容
中文操作系统与平台概述
中文系统平台设计策略
系统平台的相关模块
中文DOS
中文Windows
中文Linux
嵌入式操作系统
2、教学要点
通过本讲的学习,让学生了解中文平台和中文操作系统的发展历史、常见中文操作系统和设计中文操作系统的通用方法;掌握系统中汉字处理模块,以及处理模块与汉字代码体系之间的关系;了解软件国际化和本地化的概念。
第六讲 汉字编码技术
1、教学内容
汉字编码的发展
汉字编码中的几个概念
汉字编码理论
数码键盘方案
编码方案的标准和规范
2、教学要点
通过本讲的学习,让学生了解汉字编码的发展和相关概念,理解汉字编码理论中的重要概念,了解当前数码设备中的键盘编码方案和国家颁布的汉字编码标准和规范。
第七讲 汉字输入技术(一)
1、教学内容
汉字输入技术的发展
汉字键盘输入技术
2、教学要点
通过本讲的学习,让学生了解汉字输入的发展历史、汉字输入的分类和应用等内容,理解汉字键盘输入的原理,掌握输入码对照表的设计,理解汉字键盘输入系统和Windows下汉字输入技术,并对Linux下的汉字输入系统有所了解。
第八讲 汉字输入技术(二)
1、教学内容
汉字键盘输入系统原理
汉字键盘智能输入技术
2、教学要点
通过本讲的学习,让学生了解汉字键盘输入在汉字输入中的地位,掌握汉字键盘输入系统的原理,学习汉字键盘智能输入的主
您可能关注的文档
最近下载
- 一种应用于后馈式抛物面反射面天线的双频段馈源.pdf VIP
- 通信核心网试题-IMS-HW-L2-202305.docx
- 新一代信息技术产业——“数字引擎”释放强劲动能.pdf VIP
- 《高等基础工程学》桩基工程专题.ppt
- Unit4ScientistsWhoChangedtheWorld单词讲义高中英语牛津译林版(2020).docx
- 2022年中考语文二轮复习之记叙文阅读.doc
- 医院医共体章程.pdf
- 2024忆“九一八”事件 强全民国防教育ppt课件(2024版).pptx
- 2024年党纪学习教育党员学习心得体会十篇.docx VIP
- 小学语文新部编版一年级上册全册教案((2024秋).doc
文档评论(0)