第三章数字出版信息处理研.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 数字出版信息处理 3.1 文献化处理 3.1.1 文献类型 一次文献 是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。大部分期刊上发表的文章和在科技会议上发表的论文均属一次文献 文献类型 二次文献 是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。检索工具书和网上检索引擎是典型的二次文献 三次文献 指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。如大百科全书、辞典等 3.1.2 文献检索 将文献信息按一定的方式组织和储存起来,并能根据用户的需要取出所需特定信息的整个过程,文献检索分为 数据检索:以文献中的数据为对象的一种检索。如某公式、某化学分子式等 事实检索:以文献中的事实为对象,检索某一事物发生的时间、地点或过程 文献检索:以文献为对象,查找某个课题的有关文献的一种检索 3.1.3 文献检索与数字出版 数字出版的标准化 增强功能 检索 资源重用 多种形式发布 资源管理 交换与共享 出版内容文献化加工 3.1.4 全文数据的标引 概念 标引,就是标出著作中具有情报检索价值和分析价值的知识项,并以此为基础,建立各种索引,从而为读者提供用以检索的入口,即所谓检索点 标引方式 自动标引,西方拼音文字比较适合,汉字(分词)有一定困难 人工标引 半自动标引 标引 其他相关概念 人名﹑地名﹑文献名﹑年代﹑关键字等具有重要检索价值的数据项可以加上相关属性,如人名加属性“N”,文献名加属性“D”等,这叫做“属性标引” 很多代词或类似词汇是与上下文相关的,如:他﹑同年﹑次日﹑其父等,标引时应明确标识出其所指,这种标引叫“加注标引” 文章中可能出现大量同义词,如孙中山﹑孙文﹑孙逸仙等,着可用所谓“后控词表”来解决,即“孙中山”后带有孙文等,表示是同义词 单汉字处理模式,每一个汉字均做为检索点 注意,标引不是正文中原有的内容,在显示正文时不应出现,所以标引应以区别于正文的形式加入,或者干脆另建一文件,表明与原文件相对位置的关系(索引) 3.2 例——高等教育出版社 从出版物转变到做数字化的内容 从内容生产转变到资源集成 从出版商变成服务商 出版业要转变为数字化内容的服务业 数字出版基本信息系统分三类 协作创造平台 生产内容管理平台 内容服务和运营平台 内容结构化 传统出版内容非结构化 内容跟版式捆绑在一起 做别的产品(如网络、移动阅读),必须重做 结构化内容与版式分离 内容可以通过不同的版式生成不同的产品和服务 如结构化的内容SXM格式套用模板会生成PDF格式文件变成电子书,同样SXM的格式的内容用另外一个模板就有可能生成网络文件 以XML语言为内容结构化,XML鼓励各行业根据自己行业的特点来制定自己的内容结构化标准(DTD) 3.2.2 内容加工和标注 内容加工和元数据标注 编辑在XML的编辑器上进行文档加工,加工过程与处理WORD文档一样 标签都可以隐去,编辑就可以继续改动 二审、三审人员都可以在线在XML编辑器上进行审稿 基于XML内容加工的优点 协同加工 一本图书尤其是大型的工具书由多个编辑进行加工 每个编辑从已经存在内容管理系统中的书稿文档中剪出自己的章节,别的工作人员可以看到团队每个人所做改动的情况 不负责这一章节,不能对别人所复制的章节进行改动,但能看到别人的改动 内容更改跟踪、各版本记录 每个编辑做的删改在系统中都做记录,谁在什么时间做了哪些改动 基于XML内容加工的优点 内容加工和重用单元标注同步进行 加工过程中,对精彩的段落、片断可以拆分出来,对于他的属性通过元数据进行标注 多种媒体的集成 做一本书的时候,可以插入多媒体的素材,但多媒体的素材对于它的元数据标注时可以标注为在生成一本图书的时候不出现,但在网络发布的时候又出现,一旦书本做完之后,在网站上就可以同步发布。发布出去的产品,在图书上可能会插入很多多媒体的资源 基于XML内容加工的优点 灵活的工作流设置 考虑目前实际情况,内容管理系统设计了纸面加工和内容标注分开进行的流程 内容元数据标注 有重用价值的内容,如例题、习题、案例进行元数据标注,以便这些内容更方便准确的检索,建立知识之间的关联 通过元数据标注可以准确搜索 进行知识之间的关联,也就是说一旦一本书中的内容进行标注之后,一个读者在读别的作品时,想要浏览跟那本书中的知识点相关的内容资源,这本书的内容就可以跟他进行关联。也就是说,一位读者在读我这本书的时候,有一个内容是不能理解的,这个内容恰恰不是这本书所要讲的内容,只要别的书做了内容元数据的标注,那本可能讲这一数据最权威的书就会关联到这位读者所读的内容 内容

文档评论(0)

xuchangbin + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档