- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * 手写汉字识别速度:每秒12字以上。可识别字数:符合GBK和国标GB18030要求,可识别简体字、繁体字、异体字、英文、数字、日文假名及各种符号近三万字。正识率:工整字95%;自由字90% 使用语音输入文本的系统也叫做“听写机”或“语音打字机”,最高目标:非特定人大词汇量的连续语音识别技术 汉字OCR识别率已达到98%,专业使用应达到0.0x %数量级。其他功能:简、繁体字混合识别;中文、西文混合识别;文字、表格混合识别 脱机手写汉字识别现状:先突破工整的楷书手写体识别 * * * * * * * * * * * * * * * * * * * * * 什么是段落?用“回车”相互隔开的一组文字 段落格式的设置: 段落的对齐方式(两端对齐、分散对齐、居中对齐、左对齐、右对齐) 段落的缩进方式(首行缩进、悬挂缩进、左缩进、右缩进) 段间距和段内行距 使用编号和项目符号 段落添加边框和底纹 首字下沉或悬挂 段落与分页的关系 设置段落的格式 Demo2 控制段落的缩进 段落缩进是指段落中的文本到正文区左、右边界的距离,包括段落左缩进、右缩进和首行缩进。其缩进的距离可由水平标尺上对应的三个缩进标记来指示 左缩进标记 首行缩进标记 右缩进标记 右缩进 左缩进 首行缩进 正文区 右边界 正文区 左边界 悬挂缩进标记 页面格式的设置: 设置纸张大小和页边距 设置每页的行、列数目 设置分栏数目与格式 设置页码 设置页眉和页脚 设置页面的格式 设置页面的分栏 “所见即所得”(操作效果屏幕立即可见,打印结果与屏幕所见完全相同) 撤销(undo)和恢复(redo)操作 格式刷 多种视图(大纲视图与大纲编辑) 自动更正、自动套用格式、自动编号、自动图文集 ······ 自动保存功能和自动备份功能 样式、模板和向导(wizard)功能 宏操作(Macro) 提高Word操作效率的若干措施 文本处理初步 使用计算机对文本中的字、词、短语、句子、篇章进行识别、转换、分析、理解、压缩、加密和检索等有关的处理 文本处理举例: 字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换 词语排序,词语错误检测,文句语法检查 自动分词,词性标注,词义辨识,大陆/台湾术语转换 关键词提取,文摘自动生成,文本分类 文本检索(关键词检索、全文检索),文本过滤 文语转换(语音合成) 文种转换(机器翻译) 篇章理解,自动问答,自动写作等 文本压缩,文本加密,文本著作权保护 选讲: 什么是文本处理? 例:Word 2003的文本处理功能 英文拼写检查和英语同义词检查 字数统计 自动编写摘要 中文简繁体转换和术语转换 中英词语翻译 语法和格式检查 语音识别(口授命令和听写) 文档保护(防止打开或修改文档) 5.1.3 文本的分类 简单文本(纯文本 ) 本 书 由 南 京 大 学 出 版 社 ( P u b l i s h i n g H o u s e o f N a n j i n g U n i v e r s i t y ) 出 版 文本 没有字体、字号的变化,无图片和表格,也不能建立超链接,其文件后缀名是 .txt 在计算机中.txt文件由一串字符代码所组成,几乎不包含任何其他的格式信息和结构信息 例:本书由南京大学出版社(Publishing House of Nanjing University)出版 文本在计算机中的表示 B1 BE CA E9 D3 C9 C4 CF BE A9 B4 F3 D1 A7 B3 F6 B0 E6 C9 E7 28 50 75 62 6C 69 73 68 69 6E 67 20 48 6F 75 73 65 20 6F 66 20 4E 61 6E 6A 69 6E 67 20 55 6E 69 76 65 72 73 69
文档评论(0)