中医药“知识密集型”数据的研究思路.docVIP

中医药“知识密集型”数据的研究思路.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中医药“知识密集型”数据的研究思路

中医药“知识密集型”数据的研究思路   摘要:中医药数据主要来源于中医药工作者在长期的医疗实践和科学研究过程中所产生的知识和经验的系统总结,其中蕴含着丰富的中医药知识,因此被称为“知识密集型”数据。本文分析中医药“知识密集型”数据的内涵和特点,讨论中医药“知识密集型”数据处理方法学研究的思路。   关键词:中医药;“知识密集型”数据;大数据   中医药科学数据建设是中医药信息化事业中的一项核心工作。中医药行业的数据库建设起源于20世纪80年代,经过30余年的努力,现已建成了覆盖中医疾病、中药、方剂、中药化学成分、古籍、医案、针灸等主要学科门类的中医药科学数据库群。这些数据资源中蕴含着丰富的中医药知识遗产以及相关科学知识,面向知识百科、知识检索、知识地图等知识服务系统提供数据支持,为中医药知识传承、临床实践和科学研究做出了重要贡献。   近年来,随着各领域数据的大量积累,以及数据处理分析技术的发展和创新,人类已经进入了“大数据”时代。大数据不仅是信息技术的变革,也是生活、工作与思维的变革。“大数据”时代的来临,为进一步推进中医药科学数据建设,提升中医药数据的质量和利用价值,发展基于数据的中医药科学研究,提供了重要的机遇。为此,有必要进一步思考中医药数据的本质,利用“大数据”的最新理念和技术来革新中医药数据分析处理方法。   1.中医药“知识密集型”数据的内涵   中医药科学数据主要包括中医经典、医案、科技文献、临床指南、文献型数据库以及结构性数据库等,它们都是中医药知识的载体。中医药科学数据明显不同于交易记录、网站访问记录、聊天记录、卫星图像等数据。相比之下,中医药科学数据的数据量不是很大,但数据中蕴含的知识量却很大,数据的“知识密集度”很高。因此,中医药科学数据可被称为“知识密集型”数据。   1.1中医药“知识密集型”数据的来源分析   中医药数据的“知识密集型”特征由中医药数据的来源和获取方式决定。在很多领域,大量的数据产生于人类所发明的观测工具(如天文望远镜、显微镜、传感器等)和信息系统(如电子商务、社交网站等)。在“大数据”时代,随着数据传输和数据存储能力不断增强,以及数据分析效率不断提高,人们有能力将各种数据实时、动态地整合在一起以供人类进行数据分析和知识发现,显著增强人类对世界的理解能力。   中医药数据主要是知识表达的产物,并非观测得来的数据。中医药数据主要来源于中医药工作者在长期的医疗实践和科学研究过程中所产生的知识和经验的系统总结。中医药数据也反映中医及其所发明的工具对世界进行观测的结果,如中医对四诊的描述、舌象、脉象以及舌诊仪和脉诊仪观测的数据。但这些观测结果一般都经过中医的认识、理解和解释后,才形成了中医领域常见的数据(如中医经典、医案等)。这种数据体现的是经过人类理性加工、处理之后的客观信息,是客观信息与中医的经验性知识叠加起来之后形成的。中医药数据因其根源于中医观察和实践而仍保有其客观性,但主要是人类认知和思维的产物。   1.2中医药文献资源属于“知识密集型”数据   中医药“知识密集型”数据的典型案例是浩如烟海的中医药文献资源,包括数字化文献、纸质文献以及其他载体上的文献。中医药文献是历代医家在临床诊治中的心得体会,是科研学者对实验结果和科学探索成果的系统总结,是中医智慧的集中体现。出于文献管理、文献检索和快速阅览等目的,已出现了对文献的元数据、摘要和主题内容进行系统管理的文献性数据库,它们可被视为文献资源的衍生产品,同样也属于“知识密集型”数据。   1.3中医药结构型数据库主要属于“知识密集型”数据   中医药领域的另一类重要的数据资源是“结构型数据库”。中医药工作者将各种文献中关于中药、方剂、中药化学成分等各方面的知识分别搜集起来,进行系统整理,构建了中药库、方剂库、中药化学库、中医病案库等数据库。针对中医药数据库的调研表明,这些数据库的主体内容并非观测得来的数据,而是知识表达的产物。例如,中医病案库是对中医专家的经验性知识的总结;中药库、方剂库、中药化学库等也都是各领域知识的系统性记载。当然,中医药数据中也包括一些“非知识型”数据,如诊断仪器产生的数据,信息系统的技术性元数据等,但其主体部分仍是“知识密集型”数据。   1.4中医药“知识密集型”数据的特点   中医药“知识密集型”数据具有4个特点。(1)数据多为定性,缺少量化表达,不利于现有计算机程序直接处理;(2)非结构化数据较多,结构化难度较大,给数据分析造成困难;(3)数据内容体现人文科学与自然科学的结合,不利于逻辑推理与一般数据分析工具的应用;(4)数据具有的高维小样本及个性化特征,需要进行特殊处理。为处理中医药“知识密集型”数据,不能照搬一般的“大数据”方法,需要建立适合中医药领域特点的方法学体系

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档