- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
常见数据挖掘方法在中医诊断领域的应用概况
关键词:中医诊断;数据挖掘;综述
中图分类号:R2-03 文献标识码:A 文章编号:1005-5304(2013)04-0103-05
由于中医诊断主要根据医生的经验来决定,因此,在临床施治过程中存在较大的主观性和不确定性等问题。在中医诊断领域引进数据挖掘技术,不但符合现在多学科交叉发展的潮流,在解决实际问题上,无疑也是中医客观化进程中的又一催化剂。作为一门融合人工智能、机器学习和数理统计等方法的新型学科技术,数据挖掘在克服人类本身认知和思维长度的基础上,充分利用海量临床数据,通过模拟临床诊断推理过程来挖掘临床诊断数据中繁杂的证、症关系,对寻求中医专家的辨证规律有重要价值。目前,在该领域涉及到的数据挖掘方法较多,主要有贝叶斯网络、人工神经网络、粗糙集理论、关联分析、决策树、聚类分析、判别分析、支持向量机、多标记学习、随机森林等。笔者现对这些方法的相关应用综述如下。
1 常见数据挖掘方法
1.1 贝叶斯网络
贝叶斯网络是通过简明的图形方式结合统计理论来定性表示变量间复杂因果或概率关系的一种数据分析方法,包括网络集和概率集两部分。该方法具强大的执行高效推理任务的功能,能充分利用先验知识,而使其在诊断领域的应用价值极大。在解决中医定量诊断问题上,其体现出的功能主要表现在:揭示众多症症之间以及症与证间的复杂关系,探究证候的主要症状和次要症状,定量确定其诊断价值,这有助于确定证候诊断的标准和规范,而且建立的证候诊断模型以概率形式给出诊断结果,能有效辅助专家作出决策。因此,该方法对促进中医诊断学发展所做的贡献不可忽视。张氏等[1]对255例肺癌患者证候以症状之间的关联性及关联强度为基础,利用贝叶斯网络概括出了肺癌的证候要素,包括病机要素9个、病位要素5个及病机要素之主要症状与次要症状。曲氏等[2]对611例抑郁症患者的中医证候进行了研究,采用贝叶斯网络对抑郁症中医症状进行评定,发现拟定的中医证型包含了抑郁症的核心症状和周边症状的不同组合方式,体现了抑郁症临床多变的证候特点。范氏等[3]对收集到的1512例类风湿关节炎(RA)患者的临床数据采用基于聚类的贝叶斯网络模型,提取出了RA的7项主特征及4型的类特征,为中医辨证分型及RA中医诊断标准提供了临床依据。龚氏等[4]对2501例2型糖尿病的临床数据运用该方法分析,发现空腹血糖异常患者及糖化血红蛋白异常患者均以阴虚热盛多见,而餐后2 h血糖异常患者则以阴虚多见。王氏等[5]应用此方法通过分析474例血瘀证临床诊断数据进行血瘀证定量诊断,发现了血瘀证的7个关键症状,并与此同时建立“是否血瘀证”的分类器模型,经交叉验证发现此分类器诊断准确率达96.6%。郭氏等[6]认为,证候的复杂性表现为证候各因素之间的高维高阶性,他们运用贝叶斯网络技术对肺系疾病证候构成因素之间关联形式进行了研究,发现各因素间的联结形式是线性相关与非线性相关并存的,它们相互交织,形成复杂的网络结构,表现出典型的非线性特征。
1.2 人工神经网络
人工神经网络是在对人脑神经网络结构认识理解的基础上人工构造的新型信息处理系统。目前的神经网络模型有:用于分类、预测和模式识别的前馈式神经网络模型,用于联想记忆和优化计算的反馈式神经网络模型,以及用于聚类的自组织映射方法。其中前馈式神经网络模型是目前应用最广泛的神经网络之一。对于将其应用于中医诊断领域,陈氏[7]认为,中医学辨证施治本质上就是对众多数据信息进行处理并提取规律的过程,而人工神经网络恰恰具备较好获得数据规律的能力。人工神经网络模型的优势主要体现于其黑箱结构,这赋予人工神经网络强大的非线性拟合能力,使其能够任意精度逼近非线性函数。
但不足的是,在中医研究中,人工神经网络不能进行变量筛选,对其得到的结果也只是局部最优而非全局最优。如李氏等[8]对142例脾气虚弱及肺脾气虚证HIV/AIDS患者的主要实验指标、四诊信息的主要症状和舌象运用Clementine中的特征选择节点进行筛选,建立脾气虚弱和肺脾气虚的人工神经网络模型,发现该模型能较好地诊断艾滋病患者脾气虚弱和肺脾气虚证型,其样本模型训练集诊断的正确率和测试集诊断的正确率分别为87.25%和80.00%。傅氏等[9]认为,运用数据驱动模式建立中风人工神经网络模型,将为进行繁杂多变的中风证候的动态研究、掌握证候的动态演变规律及在不同时点进行疗效评价提供一个新的探索方向。许氏等[10]通过对心血管疾病中医临床信息数据库中的临床信息和证候类别之间的关系进行分析,发现人工神经网络尤其是OCON网络对该病常见的中医证型的识别率最高,其中心气虚证和心阳虚证分别高达92.4%、82.9%。有研究运用人工神经网络分析RA、糖尿病肾病(DN)
文档评论(0)