略论中华寻根网文献资源构架-中国国家图书馆.PDFVIP

略论中华寻根网文献资源构架-中国国家图书馆.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
略论中华寻根网文献资源构架-中国国家图书馆

古籍数字化推广 略论中华寻根网文献资源构架 王昭 对数字资源系统而言,资源构架是资源的总体设计,即资源系统中包含哪些 资源、资源的类型、粒度、各类资源间的关系以及资源生产、资源积累、资源消 耗、资源更新等。中华寻根网作为以家谱文献资源为核心的数字资源系统,其文 献资源构架模拟一个文献解构的过程,将家谱文献分解为卷、篇、叶,再分解为 语义块、信息点、字组、单个文字。通过上述解构过程,产生不同粒度的数据, 提供不同的检索、显示等应用方式。换言之,读者使用家谱文献时,大多数情况 下也只对家谱中的一部分内容感兴趣,而真正有用的信息可能更少。家谱数字资 源能够提供多种类型的检索和显示方式,提高家谱文献使用的效率。 1.中华寻根网概述 为推进中华谱牒文化的发展,继承、弘扬传统文化,促进中华民族的团结, 国家图书馆与澳门基金会合作建设“中华寻根网”(以下简称“寻根网”)。寻根 网的项目策划始于 2008 年,经过项目设计、资源规划、软件平台设计、总体设 计论证、专家论证等,2009 年底完成原型系统,通过专家评审后,开始系统内 测和大规模数字资源建设。2010 年 10 月,寻根网开始线上测试,并于 2011 年 3 月 5 日正式开通上线,提供服务。 1.1 项目宗旨 寻根网项目是建立在广泛合作基础上的全球家谱数字化服务、教育和研究项 目,以保存人类文明的共同记忆为最终目标[1]。作为一个开放型项目,希望各 国各地的图书馆、档案馆、学术机构、宗乡会、家谱编委会等组织和个人加入, 使之成为全球华人寻根问祖的家园,团结全球华人的文化平台,宣扬中华民族悠 久历史文化的窗口,提供珍贵家谱馆藏的服务通道,专业家谱信息咨询的必备参 考,家族文化寻根的规划助手。通过五到十年的努力,最终将寻根网建成一个全 球化的华人寻根中心、家谱资料中心、家谱服务中心和家谱研究中心。   49 文津流觞第 52 期 1.2 项目现状 寻根网项目建设已经取得了阶段性成果,建立了寻根网的系统模型、数据 模型和软件系统。系统建设分解为八个模块,包括家谱目录系统、家谱全文系统、 寻根百科系统、寻根导航系统、用户咨询系统、用户互动系统和后台管理系统。 每个模块能够实现一个或多个功能,各个模块既相对独立,又相互联系,共同构 成寻根网。 软件系统的总体架构设计采用了 MVC 模式与 J2EE 相结合的 STRUCTS 框 架,辅之以缓存系统、数据持久层、AJAX 页面交互、VELOCITY 模板生成等技 术框架。系统前台的业务展示功能组件分为门户引擎和扩展接口,后台的应用支 撑组件和系统管理组件分为安全认证体系、平台监控及日志管理、资源体系管理、 系统管理、社区空间管理和应用组件引擎。这样的系统架构是一个多层次、分布 式的应用模型,具有强大的伸缩性、开放性和安全性。 系统检索模块支持每秒并发 2000 以上的访问能力,响应时间平均少于3 秒, 最长不超过 5 秒;对象文件调阅和全文数据版式还原模块支持每秒并发 1000 以 上的访问能力,响应时间平均少于 3 秒,最长不超过 6 秒;数据分析模块支持每 秒并发 500 以上的访问能力,响应时间平均少于5 秒,最长不超过 8 秒。 目前,寻根网已上线姓氏数据500 余条、家谱书目数据 30000 余条,家谱 图像数据 2300 余种约 250 万叶家谱的扫描,同时发布与家谱相关的文献 6000 余种约 300 万叶[2]。 2.寻根网文献资源构架 寻根网文献资源构架由目录、索引、图像、文本等构成,目录数据用于描述 家谱文献的外部特征,并对文献内容进行整体性的揭示。索引数据用于信息点的 揭示,提高图像数据的可用性。图像数据用于反映家谱文献的原貌,配合目录和 索引数据使用。文本数据用于提供全文检索。 2.1 目录 目录数据作为元数据的重要组成部分,应用最为广泛,发展也比较成熟。国 内早期的目录数据主要采用CNMARC 格式(China Machine—Readable Catalogue, 中国机读目录),强调描述文献的外部特征,格式也较为复杂。以《新安苏氏族

文档评论(0)

sunshaoying + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档