中医古籍文本本分析系统关键技术研究与实现.docxVIP

中医古籍文本本分析系统关键技术研究与实现.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 25 摘 要 中国古籍是中国优秀国家的文化遗产,传统中药理论在长期的医疗实践中积累了大量数据,挖掘其中的宝贵经验是一项十分宝贵的研究工作。数据挖掘可以发现古代中药书籍中隐藏的潜在知识。相关规则是数据挖掘的主要研究领域。这是目前主流的研究方向,专注于找出特定领域的数据与更好的应用之间的依赖关系。。 在这篇文章中,我们将聚焦于相关路由挖掘算法的研究。基于Apriori相关算法,对古书Typhoid Ninety进行数据挖掘。首先,对收集的古代文本数据进行预处理。其次,设计相关规则算法。古代中药的文本数据挖掘和相关规则结果的分析表明,挖掘结果遵循传统中药的相关理论,具有良好的临床标准。 关键词:伤寒九十论;关联算法;Apriori 绪论 课题研究的背景和意义 研究背景 随着互联时代的快速发展,传统医书文本的数字化建设、数字化产品,以及网络化服务,将成为现代发展的主流趋势。中医古籍上起周秦,下至清代,历时2000余年,具有数量庞大、专业性强、形式多样、内容杂糅、实用性强、价值巨大等特点,记载着古代人民创造出来的丰富知识,是珍贵的历史数据和具有重要价值的文化遗迹。对中医古籍的整理研究,是对传统医学的继承发展,早在西汉成帝年间就有侍医李柱国校方技,北宋嘉佑年间林亿等校正医书等,正是这些历代学者对古籍的不断整理研究,才能使很多中医古籍能够流传至今。然而,中医古籍的客观现状却不容乐观, 很多已年代湮远,有些甚至已成为孤本、善本,使得很多中医古籍只能束之高阁;另中医古籍因古籍的特殊性,不能以普通书籍印刷、传阅等传播方式广泛流传,这大大降低了中医古籍资源的使用价值。如何客观、合理地发掘遗产,发扬学术,做到“古为今用”,又能很好的保护这些不可复制的古籍文本,是图书馆古籍利用和文献保护工作中的一大难题。 在计算机网络技术还未发展之时,传统中医古籍的整理与研究,从版本考证、编目、校勘、训诂以及专科研究都用手工作业的方式,使得效率进展都很低。在互联新时代进行古籍整理工作已成为古籍整理得主流。古籍数字化最早开始于20世纪70到80年代,人们对古籍数字化一直不断探索,中医古籍的整理与研究发生了翻天覆地的变化。 2002年以后,古籍数字化的探讨更多集中在理论层次, 而且不断向深度研究层次和高效化运用转变。伴随着相关领域的不断配套完善,古籍的数字化处理也必将加快进程,人们对中医古籍的整理与研究必然会更加深入。 研究价值 (1)古代中医文本系统开发的必要性 古代的书是属于珍贵的文化遗物,每次读各种程度的损伤引起,因此通常的书一样,不能广泛流通的,古代的书的资源保护和使用反映古代的书的价值大幅减少资源的使用古代的书的矛盾,为了保护它们,它们的文化历史资料的价值是很难实现的。古代书籍和文书的保护和利用常常看起来是不可能达成的,通过古代书籍资源的数字化,这个矛盾得到了很好的解决。 (2)古代中国文本系统开发的紧迫性 现在大家都很重视古代的书籍,但是古代书籍的保管环境非常严格,保管的温度、湿度、空气、光线都会影响古代书籍的寿命。根据古代书籍的文化遗产特性,它们的安全性和对老鼠和昆虫的防治不能忽视。但是,即使保存环境艰苦,古书一旦遭遇不幸灾害,就会遭到毁灭性的打击。古书、资料的资源是不可更新的,旧书的纸张每秒钟都会变旧,而且数量还在不断减少,所以古书、资料的数字化是当务之急。 (3)古代中国文字系统开发的便利性 现有的数字存储技术内容和形式丰富,几乎不占地方,可以长期保存,提高了搜索速度,让用户搜索变得容易。有了网络,可以随时随地获得必要的古书信息,以多面、多面、多形式的服务,飞跃性地提高了古书研究的便利性。图像扫描技术简单快速,保存方便,这些优点促进了对古代文献资源的保护和研究。共享旧书资源,也有助于学术研究。古书分散在全国各地,古书研究者使用特定的古书非常不方便。古书资料的数码化,这个不便被解除,不懈地寻找急忙宝贵的古书,而是必要的古书,可以随时随地获取信息相关的古书学者之间通过网络,可以互相讨论,研究资源利用率远高于传统的纸的古代文件中被使用。 国内外研究现状 1.2.1国内研究情况 根据《中国古代中药综合目录》,1949年以前在中国出版的中医书籍有13455种。韩医学文献庞大,整理调查大量古代韩医学书籍十分困难。20世纪90年代,一些科研单位和一些大型图书馆开始尝试建立古代书志,并取得了惊人的成果。古书文献目录的数码化的同时,稀有图书、古籍等电子化也,例如,1996年在上海图书馆从古文献稀有图书和古书选出全文光盘制作,稀有图书和古书构筑了检索系统。随着中国计算机和网络技术的进步,古代书籍的数字化已经具体化。1990年代后半期以后,在中国古代书籍的数字化急速发展。这一时期,一些人的出版部门、学术机构、商业公司开始介入古代书籍的数字化进程,使古代书籍的

文档评论(0)

文章交流借鉴 + 关注
实名认证
文档贡献者

妙笔如花

1亿VIP精品文档

相关文档