文本信息加工专业知识讲座.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 一、文字及其处理技术 体验文字处理技术 字母文字 以字母拼写方法的不同表达不同的含义 象形文字 使用自身的“形”直接昭示其含义 汉字起源于象形文字,至今仍然保留了象形文字的特点。 汉字的造字法有四种:象形、指事、会意、形声。 这是一个指事字。从字体上看,就是本 字倒过来。上部为树头,下部为树梢, 在树梢上加一小横,就表示这里是树梢。 因此,末的最初的意义是树梢。 象形 指事 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 一、文字及其处理技术 体验文字处理技术 金文「明」为日月幷照之会意字。 会意 东巴文字 —— 现代活着的象形文字 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 一、文字及其处理技术 体验文字处理技术 历史上使用的文字处理技术 手写 刻字 雕版印刷 活字印刷 机械式 打字机 计算机 文字处理 计算机文字处理 只能处理英文 可处理包括象形文 字在内的任何文字 如何在计算机中处理汉字? 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 一、文字及其处理技术 汉字的编码 目前计算机上使用的汉字编码主要有三种。 输入码 (外码) 机内码 (内码) 输出码 (字型码) 用于输入汉字的编码 用于存储汉字的编码 用于输出汉字的编码 区位码 : 4860 全拼编码: xiong 五笔字型: CEXO 熊 用机内码 表示、存储 如国标码( GB )和 BIG5 码 用汉字字型 输出汉字 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 一、文字及其处理技术 汉字的编码 例:“春”字在计算机中的处理过程。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 汉字输人码 汉字的外部码 汉字的外部码简称外码,又 叫输人码,是输人汉字的一组键盘符号。 使用不同的输入方法,同一汉字的外部码 不同。用户应选用易记忆、操作简单、位 码少、重码少和输人速度快的外码。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 汉字机内码 汉字的内部码 汉字的内部码又称汉字内码 或汉字机内码。机器接收到外码后,要转 换成内码进行存储、运算和传送。用二个 字节表示汉字的内码。为了和西文符号区 分,内码的最高位设为“ 1” 。内码通常用 汉字在车库中的物理位置表示,可以是汉 字在字库中的序号,也可以是字库中的存 储位置。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 汉字输出码 汉字字形码 在显示或打印汉字时,还涉及到字形码, 又称输出码。汉字字形是指原来铅字排版汉字的大小 和形状,在计算机中指组成汉字的点阵。尽管汉字字 形有多种变化,笔画繁简不一,但都是方块字且大小 相同,都可以写在同样的方块中。把一个方块看成 m 行 n 列矩阵,共有 m × n 个点,称为汉字点阵。如 16 × 16 点阵的汉字,共有 256 个点 汉字点阵和字形的 对应关系是,有笔画处的点为 1 ,无笔画处的点为 0 。 这样,汉字的点阵可以对应若干字节长的字形码。这 种表示汉字点阵的方法称为汉字字形的数字化表示法。 16 × l6 的汉字点阵占用 32 字节, 24X24 点的汉字字形 占用 72 字节 …… 。汉字的点阵越多,打印字体越美观。 本文档所提供的信息仅供参考之用,不能作为科学依据,请勿模仿。文档如有不 当之处,请联系本人或网站删除。 实践 1 、按国际通用标准,“ A lazy youth,a lousy age” 在计算机内存储时采用的编码 是( ) A 、区位码 B 、字形码 C 、 ASCII 码 D 、 处理码 2 、使用 WORD 进行汉字处理时,伴随“输入 —— 存储 —— 打印”的过程,所 涉及的汉字编码分别是( ) A 、拼音码、机内码、交换

您可能关注的文档

文档评论(0)

sunhongz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档