NJNU 第5章 数字媒体及应用 本章要点: 文本与文本处理 图像与图形 数字声音及应用 数字视频及应用 5.1 文本与文本处理 文本:基于特定字符集的、按一定格式组织起来的、具有上下文相关性的一个字符流,每个字符均使用编码表示。 1、西文字符的编码 西文字符集(拉丁字母、数字、标点等组成) 标准 ASCII 字符集 ASCII 字符集采用 7 位编码 每个 ASCII 字符以一个字节存放 扩充 ASCII 字符集:标准ASCII 码 + 扩展ASCII 码 2. 汉字的编码 汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素。 汉字的特点: 数量大(我国汉字自古至今累计已超过6万字 多个国家和地区使用:港台地区,日、韩、朝、新、马等 字形复杂,同音字多,异体字多。 我国汉字编码的国家标准: GB2312(6763个常用简体汉字和682个非汉字字符 ) GBK (20902个CJK汉字和······符号) UCS /Unicode与GB18030 (1) GB2312 – 1980 汉字编码 包括 6763 个汉字和 682 个非汉字字符 GB2312 构成: 一级常用汉字 3755 个,按汉语拼音排列 二级常用汉字 3008 个,按偏旁部首排列 非汉字字符 682 个 GB2312 构成一个二维平面,分成 9
您可能关注的文档
最近下载
- 山西省普通高级中学办学基本标准(试行).docx VIP
- 医务人员职业暴露防护技术规范(WS_T311-2025修订版,附操作指南)附解读.docx VIP
- (2025年)宁波市鄞州区辅警招聘考试试题库附完整答案.docx VIP
- 2024年辽宁省中考数学真题卷(含答案与解析)_7061.pdf VIP
- 2024年内蒙古自治区高等职业院校对口招收中等职业学校毕业生单独考试牧医类专业课综合试卷及参考答案.docx VIP
- 纺织品 甲氧基乙酸和2-甲氧基乙酸乙酯的测定 气相色谱-质谱 (GC-MS) 法编制说明.pdf VIP
- 2026年全国护士职称考试题库.docx VIP
- 2026年教案合集统编版道德与法治二年级下册全册教学设计教案新版.pdf VIP
- 子痫前期预测与预防指南(2025).pptx VIP
- 23G409 先张法预应力混凝土管桩.docx
原创力文档

文档评论(0)