从中医古籍数据库建设看中医古籍数字化的论文.docVIP

从中医古籍数据库建设看中医古籍数字化的论文.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从中医古籍数据库建设看中医古籍数字化的论文.doc

  从中医古籍数据库建设看中医古籍数字化的论文 作者:李兵,刘国正,符永驰,裘俭,张伟娜 【关键词】 中医古籍;数字化;古籍数据库 中医古籍是中医药学传承和发展的载体,既具有重要的学术价值,又具有相当的文物价值。最新出版的《中国中医古籍总目》共收录中医古籍13 455种,基本上反映了当前我国中医古籍的存世和分布现状。如何在保护的基础上更好地利用这些珍贵的中医药资源是中医药研究人员的历史使命。通过数字化处理,既实现了对中医古籍的永久保存,又可为方便、快捷、无损地开发和利用这些宝贵资源搭建起研究平台。中国中医科学院中医药信息研究所自2002年始,对馆藏中医典籍进行了数字化再生性保护和利用研究,目前,已建成“中医药珍善本古籍多媒体数据库”、“中医药古籍资源数据库”,实现了部分中医古籍的数字化保护与利用。   1 “中医药古籍资源数据库”建设   1.1 研究背景 中医古籍是中华民族几千年来防病治病宝贵经验的结晶,是中华民族的优秀文化遗产。中医药古籍文献中所收载的理法方药、养生保健知识是取之不尽、用之不竭的宝库,具有极高的实用价值。古籍属于不可再生的文化资源,近年来,尽管我国加大了对于古籍的保护力度,使古籍的保存环境得到改善,但随着历史的推进,古籍还是会悄无声息、不可避免地出现损毁,乃至消亡。.cOm中医古籍整体保存环境较差,各藏馆保存条件良莠不一,中医古籍保护和传承令人担忧。 鉴于此,用数字化手段对中医古籍进行处理,既可以使中医古籍的原图原貌永久保存,又可以通过数据库和网络广泛利用,避免阅读原书对古籍造成的损伤。因此,中医古籍数字化是中医古籍保护和利用的理想方式。中国中医科学院图书馆所藏中医古籍占存世中医古籍数量的一半以上,其中中医珍善本古籍就达2万余册。中国中医科学院中医药信息研究所利用该资源优势,构建了“中医药古籍资源数据库”,现已收录1 500种中医古籍的元数据信息和其中的850种中医古籍的原文图像,已经可以通过中医古籍阅览系统实现电子阅览,为中医古籍数字化保护和利用开辟了途径。   1.2 “中医药古籍资源数据库”建库流程   1.2.1 中医古籍书目的选取   根据中医古籍的年代、版本价值、文献价值、保护等级等确定收录标准,对破损严重的珍善本古籍优先进行数字化处理。   1.2.2 数据库结构设计   考虑到对古籍的再生性保护,我们 以古籍原文图像作为主要数据来源,部分古籍实现全文本化。由于图像要求的存储空间较大,我们采用支持多媒体数据的oracle 9i数据库系统,并对系统结构进行优化,基本解决了运行速度问题。   1.2.3 元数据加工   根据古籍文献的特点,按中医古籍的分类、题名、责任者、出版年代、出版者、版本项、版式、卷数、馆藏地、书籍特征、保存状况、复制状况等进行著录,著录规则参见“我国数字图书馆标准规范建设”项目研究成果——古籍元数据著录规则(cdls-s05-014),对收录古籍撰写提要,力求建立完整的古籍书目数据库。   1.2.4 数字化处理   包括古籍的扫描、质检、图像处理、文本录入等。为实现保存和利用双重目的,扫描时采用全彩模式,300 dpi,jpeg格式保存,按页码顺序重命名,对扫描后图像的顺序、偏斜度、完整性、清晰度进行检查,并进行纠偏、去污、裁边等处理。对部分古籍进行文本录入,实现图文对照。   1.2.5 古籍原文图像标引   采用自主开发的古籍编辑器对文中有效的检索点进行抽取和xml格式标引,如病证方药的名称、索引信息、各级标题等,力求实现图像的全文检索,避免标引过繁或过简,影响检索效果。对标引后数据进行审核。   1.2.6 数据发布   将图像数据、元数据、标引数据、文本数据合成、入库,形成中医古籍电子书,发布到阅览系统后进行数据库测试,实现中医古籍的数字化保护与利用。   1.3 采用技术 数据库采用oracle 9i,数据搜索采用oracle text技术。整个系统采用基于java的vc设计模式,构建了高内聚、弱藕合、可维护和可扩展的中医古籍数字化系统[1]。   2 中医古籍数字化存在的障碍   2.1 中医古籍中生僻汉字的处理 汉字从产生至今经历了漫长的演变过程,由此也产生了大量的繁简字、异体字、古今字、通假字等。中医古籍数字化过程中遇到的字体障碍有两个方面,一个是对字体的认知障碍,生僻汉字的准确录入需要很深的中医文献学功底,而对于一般的操作人员很难办到;一个是技术障碍,unicode字符集虽然可以解决字库问题,但是很多软件不支持,常用的输入法和搜索引擎不支持大字符集,很多生僻字仍不能正确显示和检索。用造字的方法费时费力,而且很难共享和检索,生僻汉字的处理仍是中医古籍数字化过程中的一大障碍。   2.2 全国古籍数字化标准尚待建立 目前,虽然参与中医古籍数字化

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档