网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘技术在中医诊断与应用.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在中医诊断中的应用 胡广芹1,陆小左2 (1天津中医药大学天津1000193;2天津中医药大学医疗系系主任天津1000193) 摘要:本文概述了数据挖掘技术在中医诊断中的应用进展;详细介绍了数据挖掘技术在中医 诊断中应用的基本要求及基本分析、归纳方法阐明了数据挖掘技术在中医诊断中的应用价值。 在中医“整体”观与“辨证”思想指导下,应用数据挖掘工具,探索中医证候度量化指标与 机体生理病理变化的表象指标之间的关联规则,建立个性化中医检查基础数据库,整合出针 对不同健康状态可个性化的健康于预诊断指标有重要意义。 关键词:数据挖掘;串医诊断;中医证候度量化 数据挖掘(DataMining)就是通过采用自动或半自动的手段,在从海量的、不完全的、 有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有 用的信息和知识的过程…。 中医诊断过程主要是对证的判定。如何处理海量的数据,从中找出规律性的东西.确立 切合临床实际的证候判别标准是我们目前亟待解决的问题。数据挖掘则可能完成帮助我们完 成证的规范化研究,也可辅助临床医生对病人进行证的判定。 一、数据挖掘技术在中医诊断中的应用进展 朱文锋拉1等,基于Cach6数据库的中医诊断数据挖掘应用研究的基本思路与方法,表达 了以证素辨证研究为切入点,开展“证候一证素一证型辨证统一体系”中医诊断研究的可达到 的目标。通过建立通用病历信息文件结构,整合数据挖掘工具,搭建了一个用于开展中医诊 断研究的数据挖掘科研平台,为科学深入地开展中医诊断研究提供了一种途径。 陈明等B1尝试运用关联规则发现诊断模式,他把《伤寒论》中的病名、症状、舌脉分别 作为数据表建立数据库,挖掘得出规则:发热、恶寒、脉浮太阳病(支持度65%,置信度5%), 可以认为发热,恶寒的确是太阳病的诊断依据。 秦中广等¨1运用粗糙集进行中医类风湿证候的诊断,共收集了224个病例,每个病例有 81个属性,并从这224个病例中随机抽取学习样本180例,进行预测诊断44例。他们利用 属性约简得到寒湿阻络、湿热阻络、痰瘀阻络、气阴两虚、寒热错杂5种证的必定规则和可 能规则。在44例预测诊断中,诊断正确率达到90%以上,高于传统的模糊数学方法,并认为 粗糙集有可能是中医诊断研究的动态理想工具。 二、数据挖掘技术在中医诊断中应Hj的基本要求 (1)数据采集标准化 数据采集是基础数据库的基础,各种数据采集的格式要严格按照国家标准制定,同时还 考虑自定义指标字段、自定义采集界面、自定义数据字典等功能。根据中医行业数据的特点, 确定数据分类编码及数据命名标准、数据质量控制标准、数据的核心元数据标准等规范,运 用标准化原理,结合数据库建设对标准的总需求,从总体上形成一个较为完整的数据采集标 准体系。这是基础数据库设计的前提。 (2)数据预处理 在数据挖掘之前,必须对这些信息进行清理和过滤.以确保数据的一致性和确定性,并 将其转换成适合挖掘的形式。针对本研究样本数据特征多的特点,将Roughsat应用于中医体 检临床资料数据挖掘的预处理阶段,在不影响分类精度的前提下,对样本数据进行属性约简, 这样经过约简以后的样本在样本训练阶段可以明显地提高训练速度。 (3)进行信息溶合 中医诊察的信息是由文字、数据、波形信号、图像、以及少量的语音和视频信号组成的。 对这些不同物理属性的医疗数据,应采用不同的技术和措施进行处理,使其在属性上趋同或 者一致,再对处理的结果进行综合。中医信息的多源性、时序性和非时序性数据共存、数字 型数据和非数字型数据共存的特点,加大了信息融合的难度。 (4)挖掘算法的容错性和鲁棒性 医疗数据库是一个涉及面广、信息量大的信息库。要在这样庞大的数据库中提取知识, 必须考虑医疗数据挖掘的效率问题。由于医疗数据库的类型较多,并且又是动态变化的,所 以要求挖掘算法具有一定的容错性和鲁棒性。 (5)连续属性确定 在中医专家的指导一F,收集和整理中医样本,分析出这些连续属性值的分布规律,为每 个连续属性确定一个区间值,在这个区间中的连续值均认为是正常值,用预设定的数字表示。 (6)可靠性判定 医疗数据挖掘的主要目的是为医疗活动和管理提供科学的决策,因此如何降低医疗数据 挖掘过程中的风险,提高挖掘结果的准确性和新颖性,并能对其进行医学

文档评论(0)

ygeorcgdw + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档