计算机基础ch4数字媒体技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机基础ch4数字媒体技术.ppt

        数据量巨大 数据类型较多 数据存储容量差别大 数据处理方法不同 数据输入和输出复杂 ◆ 文本的类型 字符集:是多个字符的集合,其种类很多,且每个字符集所包含的字符个数也不相同。 标准ASCII字符集及其码表 汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素 汉字的特点 数量大;多个国家和地区使用;字形复杂,同音字多,异体字多 如何编码? 确定收入多少字、哪些字? 汉字在字符集中的排序方式 确定使用的代码结构和代码空间 GB2312汉字编码字符集 1980年颁布《信息交换用汉字编码字符集·基本集》——GB2312-1980 GB2312字符集由三个部分构成: GB2312汉字的编码 每一个GB2312汉字使用16位(2个字节)表示 每个字节的最高位均为“1” 在16位代码空间中的码位分布: GB2312汉字编码的不足之处 GB2312汉字字数太少,无法满足一些特殊应用的需要: 人名、地名; 古籍整理、古典文献研究。 没有繁体字 编码效率不高: (6763+682)/65536 与ASCII码不兼容 GB2312-80将代码表放置在94行×94列的阵列中,行号称为区号,列号称为位号。任意一个字符都用两个字节表示,第一字节(高字节)表示区号,第二字节(低字节)表示位号,分别各用7个二进位表示,这就是汉字字符集的区位码。 国家标准GB2312 汉字扩充规范 GBK 国家标准GB18030 台湾地区的标准汉字字符集CNS 11643 (BIG 5,俗称“大五码”) 日本工业标准汉字字符集JIS X 0208-90 韩国国家标准汉字字符集KSC 5601-87 文本输入计算机的方法 文本输入计算机的方法 文本输入计算机的方法 文本输入计算机的方法 汉字的键盘输入 汉字与键盘上的键无法一一对应,因此必须使用几个键来表示一个汉字,这就称为汉字的“键盘输入编码” 优秀的汉字键盘输入编码应具有的特点: 易学习、易记忆 效率高(平均击键次数较少) 重码少 容量大(可输入的汉字字数多) 超文本 文本的分类对比 文本编辑 目的:确保文本内容正确无误 操作:对字、词、句和段落进行添加、删除、修改等操作 常用的文本处理软件:Word、WPS (参考Word) 在文本的任何位置都可以插入新的文字 从文本的任何位置都可以删除不需要的文字 将一段文字从一处移动到另一处 将一段文字从一处复制到另一处 在文本中自动查找指定的词语 用一个词语自动替换文本中指定的词语 …. 什么是文本处理? 使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理。 文本处理内容: 字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换 词语排序,词语错误检测,文句语法检查 自动分词,词性标注,词义辨识,大陆/台湾术语转换 关键词提取,文摘自动生成,文本分类 文本检索(关键词检索、全文检索),文本过滤 文语转换(语音合成),文种转换(机器翻译) 篇章理解,自动问答,自动写作等 文本压缩,文本加密,文本著作权保护 关于文本检索 Web信息检索系统之1(自学) 也称为搜索引擎,例如Google、Yahoo、Alta Vista、Infoseek、新浪、天网、百度等。 系统结构: Web信息检索系统之2 (自学) 全文索引适用于检索难以查找的或主题比较模糊的信息; 目录检索有助于逐步缩小主题或者查找某个主题常见的、质量较高的信息 目的:阅读、浏览或打印文本 使用的软件:文本阅读器/文本浏览器 嵌入在文本编辑(处理)软件中,如微软的Word, 独立的软件:如Adobe公司的Acrobat Reader,微软公司的IE等 文本展现的过程: 对文本的格式描述进行解释 生成文字和图表的映像(bitmap) 传送到显示器或打印机输出 输出过程中字形的生成 过程: 先根据字符的字体确定相应的字库(font), 再按照该字符的代码从字库中取出该字符的形状描述信息 然后按形状描述信息生成字形,并按照字号大小及有关属性(粗体、斜体、下横线)将字形作必要的变换 最后将变换得到的字形放置在页面的指定位置处 2种不同的字库: 矢量图形占用的存储空间较小,打印输出和放大时图形质量较高。 矢量图形的缺点: 显示图形时计算时间较多。 无法使用廉价设备将图形输入到计算机中并且矢量化。 矢量图形目前没有统一的标准和格式,大部分矢量图形格式存在知识产权问题。 CDR格式 IA格式 DWG格式 3DS格式 SWF格式 VSD格式 WMF格式 EMF格式 SVG格式 图像 图像由像素点阵构成,也称为位图。 黑白图像中每个像素点用1位二进制数表示这种图像称为二值图像。 灰度图像中,每个像素点的亮度值用8位二进制数

文档评论(0)

2837587390 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档