- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在中医诊断中的应用
胡广芹1,陆小左2
(1天津中医药大学天津1000193;2天津中医药大学医疗系系主任天津1000193)
摘要:本文概述了数据挖掘技术在中医诊断中的应用进展;详细介绍了数据挖掘技术在中医
诊断中应用的基本要求及基本分析、归纳方法阐明了数据挖掘技术在中医诊断中的应用价值。
在中医“整体”观与“辨证”思想指导下,应用数据挖掘工具,探索中医证候度量化指标与
机体生理病理变化的表象指标之间的关联规则,建立个性化中医检查基础数据库,整合出针
对不同健康状态可个性化的健康于预诊断指标有重要意义。
关键词:数据挖掘;串医诊断;中医证候度量化
数据挖掘(DataMining)就是通过采用自动或半自动的手段,在从海量的、不完全的、
有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有
用的信息和知识的过程…。
中医诊断过程主要是对证的判定。如何处理海量的数据,从中找出规律性的东西.确立
切合临床实际的证候判别标准是我们目前亟待解决的问题。数据挖掘则可能完成帮助我们完
成证的规范化研究,也可辅助临床医生对病人进行证的判定。
一、数据挖掘技术在中医诊断中的应用进展
朱文锋拉1等,基于Cach6数据库的中医诊断数据挖掘应用研究的基本思路与方法,表达
了以证素辨证研究为切入点,开展“证候一证素一证型辨证统一体系”中医诊断研究的可达到
的目标。通过建立通用病历信息文件结构,整合数据挖掘工具,搭建了一个用于开展中医诊
断研究的数据挖掘科研平台,为科学深入地开展中医诊断研究提供了一种途径。
陈明等B1尝试运用关联规则发现诊断模式,他把《伤寒论》中的病名、症状、舌脉分别
作为数据表建立数据库,挖掘得出规则:发热、恶寒、脉浮太阳病(支持度65%,置信度5%),
可以认为发热,恶寒的确是太阳病的诊断依据。
秦中广等¨1运用粗糙集进行中医类风湿证候的诊断,共收集了224个病例,每个病例有
81个属性,并从这224个病例中随机抽取学习样本180例,进行预测诊断44例。他们利用
属性约简得到寒湿阻络、湿热阻络、痰瘀阻络、气阴两虚、寒热错杂5种证的必定规则和可
能规则。在44例预测诊断中,诊断正确率达到90%以上,高于传统的模糊数学方法,并认为
粗糙集有可能是中医诊断研究的动态理想工具。
二、数据挖掘技术在中医诊断中应Hj的基本要求
(1)数据采集标准化
数据采集是基础数据库的基础,各种数据采集的格式要严格按照国家标准制定,同时还
考虑自定义指标字段、自定义采集界面、自定义数据字典等功能。根据中医行业数据的特点,
确定数据分类编码及数据命名标准、数据质量控制标准、数据的核心元数据标准等规范,运
用标准化原理,结合数据库建设对标准的总需求,从总体上形成一个较为完整的数据采集标
准体系。这是基础数据库设计的前提。
(2)数据预处理
在数据挖掘之前,必须对这些信息进行清理和过滤.以确保数据的一致性和确定性,并
将其转换成适合挖掘的形式。针对本研究样本数据特征多的特点,将Roughsat应用于中医体
检临床资料数据挖掘的预处理阶段,在不影响分类精度的前提下,对样本数据进行属性约简,
这样经过约简以后的样本在样本训练阶段可以明显地提高训练速度。
(3)进行信息溶合
中医诊察的信息是由文字、数据、波形信号、图像、以及少量的语音和视频信号组成的。
对这些不同物理属性的医疗数据,应采用不同的技术和措施进行处理,使其在属性上趋同或
者一致,再对处理的结果进行综合。中医信息的多源性、时序性和非时序性数据共存、数字
型数据和非数字型数据共存的特点,加大了信息融合的难度。
(4)挖掘算法的容错性和鲁棒性
医疗数据库是一个涉及面广、信息量大的信息库。要在这样庞大的数据库中提取知识,
必须考虑医疗数据挖掘的效率问题。由于医疗数据库的类型较多,并且又是动态变化的,所
以要求挖掘算法具有一定的容错性和鲁棒性。
(5)连续属性确定
在中医专家的指导一F,收集和整理中医样本,分析出这些连续属性值的分布规律,为每
个连续属性确定一个区间值,在这个区间中的连续值均认为是正常值,用预设定的数字表示。
(6)可靠性判定
医疗数据挖掘的主要目的是为医疗活动和管理提供科学的决策,因此如何降低医疗数据
挖掘过程中的风险,提高挖掘结果的准确性和新颖性,并能对其进行医学
您可能关注的文档
- 神经网络在机床优化设计与应用.pdf
- 渗透气化技术在燃料乙醇生产与应用.pdf
- 渗透软化剂在化机浆生产与应用与研究.pdf
- 生命周期评价方法及其应用.pdf
- 生命周期评价在电子废物拆解与应用.pdf
- 生漆改性树脂在工业重防腐领域与应用.pdf
- 生漆改性与应用.pdf
- 生态服务价值在土地利用规划环境影响评价与应用及方法研究.pdf
- 生态型企业生态经营绩效评价体系构建与应用——基于生态效益外部性及嵌入式列报视角.pdf
- 生物技术在疫苗领域与应用.pdf
- 量子计算技术对量子计算产业市场需求的预测与分析报告.docx
- 难点详解冀教版8年级下册期末试卷附完整答案详解【历年真题】.docx
- 农村电商物流配送体系在2025年物流配送服务质量提升与优化策略研究报告.docx
- 文化产业发展专项资金政策解读与应用报告2025.docx
- 难点详解冀教版8年级下册期末试卷附完整答案详解(各地真题).docx
- 文化创意产业园区建设项目文化创意产业公共服务平台建设报告.docx
- 智能化升级2025:智慧公交系统建设与运营管理智能调度系统应用报告.docx
- 2025年精神心理健康医疗服务人才培养与职业发展规划报告.docx
- 物流行业2025年节能减排与绿色物流产业链升级报告.docx
- 难点详解冀教版8年级下册期末试卷附参考答案详解(研优卷).docx
文档评论(0)