- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
略论中华寻根网文献资源构架-中国国家图书馆
古籍数字化推广
略论中华寻根网文献资源构架
王昭
对数字资源系统而言,资源构架是资源的总体设计,即资源系统中包含哪些
资源、资源的类型、粒度、各类资源间的关系以及资源生产、资源积累、资源消
耗、资源更新等。中华寻根网作为以家谱文献资源为核心的数字资源系统,其文
献资源构架模拟一个文献解构的过程,将家谱文献分解为卷、篇、叶,再分解为
语义块、信息点、字组、单个文字。通过上述解构过程,产生不同粒度的数据,
提供不同的检索、显示等应用方式。换言之,读者使用家谱文献时,大多数情况
下也只对家谱中的一部分内容感兴趣,而真正有用的信息可能更少。家谱数字资
源能够提供多种类型的检索和显示方式,提高家谱文献使用的效率。
1.中华寻根网概述
为推进中华谱牒文化的发展,继承、弘扬传统文化,促进中华民族的团结,
国家图书馆与澳门基金会合作建设“中华寻根网”(以下简称“寻根网”)。寻根
网的项目策划始于 2008 年,经过项目设计、资源规划、软件平台设计、总体设
计论证、专家论证等,2009 年底完成原型系统,通过专家评审后,开始系统内
测和大规模数字资源建设。2010 年 10 月,寻根网开始线上测试,并于 2011 年 3
月 5 日正式开通上线,提供服务。
1.1 项目宗旨
寻根网项目是建立在广泛合作基础上的全球家谱数字化服务、教育和研究项
目,以保存人类文明的共同记忆为最终目标[1]。作为一个开放型项目,希望各
国各地的图书馆、档案馆、学术机构、宗乡会、家谱编委会等组织和个人加入,
使之成为全球华人寻根问祖的家园,团结全球华人的文化平台,宣扬中华民族悠
久历史文化的窗口,提供珍贵家谱馆藏的服务通道,专业家谱信息咨询的必备参
考,家族文化寻根的规划助手。通过五到十年的努力,最终将寻根网建成一个全
球化的华人寻根中心、家谱资料中心、家谱服务中心和家谱研究中心。
49
文津流觞第 52 期
1.2 项目现状
寻根网项目建设已经取得了阶段性成果,建立了寻根网的系统模型、数据
模型和软件系统。系统建设分解为八个模块,包括家谱目录系统、家谱全文系统、
寻根百科系统、寻根导航系统、用户咨询系统、用户互动系统和后台管理系统。
每个模块能够实现一个或多个功能,各个模块既相对独立,又相互联系,共同构
成寻根网。
软件系统的总体架构设计采用了 MVC 模式与 J2EE 相结合的 STRUCTS 框
架,辅之以缓存系统、数据持久层、AJAX 页面交互、VELOCITY 模板生成等技
术框架。系统前台的业务展示功能组件分为门户引擎和扩展接口,后台的应用支
撑组件和系统管理组件分为安全认证体系、平台监控及日志管理、资源体系管理、
系统管理、社区空间管理和应用组件引擎。这样的系统架构是一个多层次、分布
式的应用模型,具有强大的伸缩性、开放性和安全性。
系统检索模块支持每秒并发 2000 以上的访问能力,响应时间平均少于3 秒,
最长不超过 5 秒;对象文件调阅和全文数据版式还原模块支持每秒并发 1000 以
上的访问能力,响应时间平均少于 3 秒,最长不超过 6 秒;数据分析模块支持每
秒并发 500 以上的访问能力,响应时间平均少于5 秒,最长不超过 8 秒。
目前,寻根网已上线姓氏数据500 余条、家谱书目数据 30000 余条,家谱
图像数据 2300 余种约 250 万叶家谱的扫描,同时发布与家谱相关的文献 6000
余种约 300 万叶[2]。
2.寻根网文献资源构架
寻根网文献资源构架由目录、索引、图像、文本等构成,目录数据用于描述
家谱文献的外部特征,并对文献内容进行整体性的揭示。索引数据用于信息点的
揭示,提高图像数据的可用性。图像数据用于反映家谱文献的原貌,配合目录和
索引数据使用。文本数据用于提供全文检索。
2.1 目录
目录数据作为元数据的重要组成部分,应用最为广泛,发展也比较成熟。国
内早期的目录数据主要采用CNMARC 格式(China Machine—Readable Catalogue,
中国机读目录),强调描述文献的外部特征,格式也较为复杂。以《新安苏氏族
文档评论(0)