- 1
- 0
- 约9.48千字
- 约 40页
- 2022-10-30 发布于重庆
- 举报
目的:使文本清晰、美观、便于阅读 操作内容:对文本中的字符、段落乃至整篇文章的格式进行设计和调整,分成3个层次: 对字符格式进行设置 对段落格式进行设置 对文档页面进行格式设置 文本排版(Typesetting ) 第三十页,共四十页。 设置字符的格式 字号(八号 → 初号, 5磅→72磅以上) 1磅相当于1/72英寸 字体(宋体、楷体、黑体、仿宋、隶书···) 字符的修饰 字符的形状(字形):正常、加粗、倾斜、加粗倾斜 字形的修饰:下划线、着重号、上下标、删除线··· 字符的颜色 字符的宽度 字符的间距 字符的效果 字符的排列方向 第三十一页,共四十页。 什么是段落?用“回车”相互隔开的一组文字 段落格式的设置: 段落的对齐方式(两端对齐、分散对齐、居中对齐、左对齐、右对齐) 段落的缩进方式(首行缩进、悬挂缩进、左缩进、右缩进) 段间距和段内行距 使用编号和项目符号 段落添加边框和底纹 首字下沉或悬挂 段落与分页的关系 设置段落的格式 第三十二页,共四十页。 控制段落的缩进 段落缩进是指段落中的文本到正文区左、右边界的距离,包括段落左缩进、右缩进和首行缩进。其缩进的距离可由水平标尺上对应的三个缩进标记来指示 左缩进标记 首行缩进标记 右缩进标记 右缩进 左缩进 首行缩进 正文区 右边界 正文区 左边界 悬挂缩进标记 第三十三页,共四十页。 页面格式的设置: 设置纸张大小和页边距 设置每页的行、列数目 设置分栏数目与格式 设置页码 设置页眉和页脚 设置页面的格式 第三十四页,共四十页。 设置页面的分栏 第三十五页,共四十页。 “所见即所得”(操作效果屏幕立即可见,打印结果与屏幕所见完全相同) 撤销(undo)和恢复(redo)操作 格式刷 多种视图(大纲视图与大纲编辑) 自动更正、自动套用格式、自动编号、自动图文集 ······ 自动保存功能和自动备份功能 样式、模板和向导(wizard)功能 宏操作(Macro) 提高Word操作效率的若干措施 第三十六页,共四十页。 使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理 文本处理举例: 字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换 词语排序,词语错误检测,文句语法检查 自动分词,词性标注,词义辨识,大陆/台湾术语转换 关键词提取,文摘自动生成,文本分类 文本检索(关键词检索、全文检索),文本过滤 文语转换(语音合成) 文种转换(机器翻译) 篇章理解,自动问答,自动写作等 文本压缩,文本加密,文本著作权保护 文本处理 第三十七页,共四十页。 例:Word 2003的文本处理功能 英文拼写检查和英语同义词检查 字数统计 自动编写摘要 中文简繁体转换和术语转换 中英词语翻译 语法和格式检查 语音识别(口授命令和听写) 文档保护(防止打开或修改文档) 第三十八页,共四十页。 谢 谢 ******* ***** * 第三十九页,共四十页。 内容总结 任务2 了解文本媒体的编码方式。同上,但还应包含用于指出“链源”和“链宿”的标记。文本的输出通常分为打印输出和屏幕输出。在计算机内部每个汉字采用2个字节来表示,并把每个字节的最高位均规定为“1”。目前PC机中GB2312汉字不论用何种方法录入,在机器内部都统一用机内码表示。方案:ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码(目前共收集了17x216=1,114,112 个) ,称为UCS/Unicode。先实现部分字符的编码(近11万个字符)。双字节存储和表示,每个字节的最高位均为“1”。小结:不同标准,不同的表示。例如: “南京大学1234ABCD”的3种表示:。将一段文字从一处移动到另一处 第四十页,共四十页。 * * * * * * * 手写汉字识别速度:每秒12字以上。可识别字数:符合GBK和国标GB18030要求,可识别简体字、繁体字、异体字、英文、数字、日文假名及各种符号近三万字。正识率:工整字95%;自由字90% 使用语音输入文本的系统也叫做“听写机”或“语音打字机”,最高目标:非特定人大词汇量的连续语音识别技术 汉字OCR识别率已达到98%,专业使用应达到0.0x %数量级。其他功能:简、繁体字混合识别;中文、西文混合识别;文字、表格混合识别 脱机手写汉字识别现状:先突破工整的楷书手写体识别 * * * * * * * * * * * * 任务2 了解文本媒体的编码方式 5.2.1 文本媒体的分类和表示 5.2.2 常用的编码方式 5.2.3 文本的编辑和处理 第一页,共四十页。 文本媒体的分类和表示 文字是一种书面语言,它由一系列字符组成,包含中文和西文。 文字信息在计算机中称为“文本”,它是计算
原创力文档

文档评论(0)