数码诗库技术分析及实现-analysis and implementation of digital poetry database technology.docxVIP

数码诗库技术分析及实现-analysis and implementation of digital poetry database technology.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数码诗库技术分析及实现-analysis and implementation of digital poetry database technology

工程硕士学位论文 工程硕士学位论文 目 录 要 I ABSTRACT II 第1章 绪 论 1 1. 1 项目背景及意义 1 1. 2 国内外图书数字化历史与现状 1 1. 2. 1 国外数字图书馆发展历史 1 1. 2. 2 国内发展状况 2 1. 3 本文研究内容 3 第2章 《数码诗库》关键技术分析及总体设计 4 2. 1 数据编码的选择 5 2. 2 OCR 汉字识别 6 2. 3 全文检索 6 HYPERLINK \l _TOC_250003 4 SDSB(Single Data/Single Binary) 8 2. 5 《数码诗库》体系结构设计 8 2. 5. 1 基于后台数据库的 C/ S 体系结构 9 2. 5. 2 基于自主服务器的 C/ S 体系结构 10 2. 6 小 结 12 第3章 UNI CODE 与诗词数字化 13 HYPERLINK \l _TOC_250002 1 UNI CODE 简介 13 3. 2 UNI CODE 对诗词数字化的重要意义 15 3. 2. 1 UNI CODE 拥有充足的汉字编码 15 3. 2. 2 UNI CODE 能同时处理多国文字 15 3. 2. 3 UNI CODE 使诗词库为全球共享 15 3. 3 历代诗词数字化的跨平台展现 15 3. 3. 1 UNICODE 标准下字符存储 16 3. 3. 2 UNICODE 标准下字符的显示 16 3. 3. 3 UNICODE 标准下字符的输入 17 3. 3. 4 UNI CODE 语料的全文检索 18 3. 4 小结 18 第 4 章 OCR 相关技术在诗词数字化中的应用 19 4. 1 通用版面分析软件的原理和实现 20 HYPERLINK \l _TOC_250001 1. 1 Uni Segment at i on 的原理 21 4. 1. 2 Uni Segment at i on 的流程及算法 22 4. 2 校对 24 4. 2. 1 传统校对方式与弊端 24 4. 2. 2 OCR 流程中的校对步骤 25 4. 2. 3 对照校对 25 4. 2. 4 版面校对 26 第 5 章 结合采用 XML 与 Dubl i n Cor e 标准的技术应用 29 HYPERLINK \l _TOC_250000 5. 1 XML 简介 29 5. 1. 1 XML 是元标记语言 30 5. 1. 2 XML 描述的是结构和语义 30 5. 1. 3 XML 的特性 31 5. 2 XML 对于诗词数字化的意义 34 5. 2. 1 用 XML 可以便于处理数据 34 5. 2. 2 XML 便于显示和使用数据 34 5. 3 元数据( Met adat a) 的数字化 35 5. 3. 1 传统的 MARC 格式 35 5. 3. 2 用 Dubl i n Cor e 和 XML 结合来表示元数据 36 数码诗库技术研究及实现 数码诗库技术研究及实现 5. 3. 3 两种方式的比较和分析 38 第6章 全文检索及诗韵检索 40 6. 1 全文检索简介 40 6. 2 全文检索引擎的实现 41 6. 2. 1 全文检索引擎的设计思想 41 6. 2. 1. 1 基于 UNI CODE 的数据 41 6. 2. 1. 2 基于词表的索引库结构 41 6. 2. 1. 3 词间的关联 42 6. 2. 1. 4 词表的建设 42 6. 2. 1. 5 词表的组织 42 6. 2. 1. 6 分词的策略 43 6. 2. 2 检索功能的实现 44 6. 2. 2. 1 词组的检索 44 6. 2. 2. 2 高级检索 45 6. 3 全文检索和数据库的结合构成了一个准确高效的搜索引擎 47 6. 3. 1 分类检索 47 6. 3. 2 两种检索请求 47 工程硕士学位论文 工程硕士学位论文 6. 3. 3 对 Sear ch 请求的处理 48 6. 2. 4 处理 Sear ch 请求的流程 49 6. 2. 5 对 Get Resul t 请求的优化处理 49 6. 3. 6 处理 Get Resul t 请求的流程图 50 6. 4 诗韵检索 50 6. 4. 1 韵律简介 50 6. 4. 2 新编诗韵( 部分) 51 6. 4. 3 诗韵检索工具的实现 52 第7章 版权保护及网络注册的实现 59 7. 1 常见的软件保护方式 59 7. 1. 1 常见的软件保护方式 59 7. 1. 2 基于用户硬

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档