文本获取与处理教材编辑.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文本获取与处理教材编辑.ppt

* * * * * * * * * * * * * * * * * * * * * * * * * * (3)交互操作设计 指通过超文本中的菜单、按钮、超链接等机制实现检索词与文本块的链接关系以及导航功能,从而实现网状文本结构的搭建,如图2-19所示。 * 2、选择合适的字体和风格 选择合适的字体是不仅是一个技术问题,更是一个艺术创意。设计建议: ①中文字体要在考虑艺术性的基础上,考虑人的文字使用习惯,正式场合应用的文本要符合有关标准要求。 ②英文字体,应当尽量选择清晰易读的字体,避免使用难以识别的装饰型字体。 ③ 同一文本内容应采用尽可能少的字体,在必要时可利用斜体和加粗来调整显示效果;文本块的行间距要调整到令人愉悦的水平,太拥挤会给阅读带来很大困难。 ④ 文本标题应选择更显眼或者更清晰的字体,可通过改变颜色或增加背景效果等凸显标题。还可使用阴影样式。 * 3、图形文字和动画文字 图形文字和动画文字可为文字赋予更多的效果和艺术内涵,插入到文本中后可增加文本的表现力和艺术效果。处理图形化文字主要有三种途径: 1)用图象处理软件制作“艺术字”,如下图; 图2-20 图形文字举例 2)用动画制作工具设计制作相应的“动画字”或“3D字”; 3)通过图符/字体设计软件重新设计自己独特的专用图标或符号。 * 4、通用符号和图标 符号是以独立的图形为形式的浓缩文本。可以传递有意义的信息。处理超文本时,适当选择一些常见通用的符号或图标来替代文字内容,会产生比文字本身更简洁直观的作用。比如各种交通标志、禁烟标志、生活中各种注意标志等。需要说明的是,应尽量避免使用只有自己才明白的符号和图标。下表给出了几个通用图标(播放器按钮)及其对应的含义。 * 5、导航与路径 导航可由整个系统中的多层菜单组成,用户通过操作本层菜单进入下层菜单或浏览文本内容或返回上层菜单。 6、特殊字符处理 图2-21 选择特殊字符 扩展字符集中的字符无法通过键盘直接输入,比如注册符号“?”和摄氏温度符号“℃”。如果文本处理中遇到无法输入 的特殊字符,则可通过处理软件所提供的“插入字符”功能,通过打开字符集并选择所需字符来实现。 * 7、HTML文件 超文本 (HTML )文件是由一种被称为超文本标记语言(HTML)的标准文件格式来存储的。 在HTML文件中,可以通过标记符(tag)对文件中的文本进行标记,以便规定字样、大小、颜色以及其他属性。 当使用浏览器阅读该html文件时,浏览器就会将这些标记符之中的文字按照各自的标记符所代表的含义进行处理,显示出正确的效果。在HTML语言中,还有很多描述超文本页面排版的各种标记符,比如定义超链接、定义表格、嵌入其它媒体(声音、图片、视频、动画)等。 * 2.4 HTML超文本标记语言 2.4.1 相关概念 ① HTTP:英文全称为Hypertext Transfer Protocol(超文本传送协议),用来定义www网的资源访问方式。 ② URL:英文全称为Uniform Resource Locator(统一资源定位器),用来指定网上信息资源的地址,其具体格式为:协议://主机地址:端口/路径/文件名。例如: /china/index.htm ③ HyperLink:超级链接,用于按URL格式链接www网络资源。 ④ HTML版本:目前使用比较普遍的HTML版本是4.0版,可支持不同种类的语言,为信息检索工具提供更有效的检索及更高的网页质量。 * 2.4.2 HTML文件 1、文件元素和标签的概念 一个HTML文档通常由文档头(head)、文档名(title)、表格(table)、段落(paragraph)和列表(list)等成分构成,通常把这些成分称为文件元素(element),它们是超文本文件的基本构件,并且使用超文本标记语言规定的标签(tag)来标识。 每个HTML标签分开始和结束两种,开始标签由3部分组成:左尖括号“”,“标签名称”和右尖括号“”,结束标签是在开始标签的“”后添加符号“/”。开始标签和结束标签通常是配对出现的。 某些文件元素还可以包含相应的属性(attribute)。 * 2、HTML文档的结构 从文本角度看:HTML文档本身是一种无格式的文档,也称为ASCII文件,可以使用任何一种文本编辑器来编写。 从HTML的语法看:每个HTML文件都是由标签HTML开始,以标签/HTML结束。每个HTML文件都由两部分组成:文档头(head)和正文(body),并分别用HEAD … /HEAD和BODY … /BOD

文档评论(0)

youngyu0301 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档