- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中风病证候诊断及治法相关性探究
中风病证候诊断及治法相关性探究 [关键词]中风病;证候;治法;关联挖掘
[中图分类号]R255.2[文献标识码]C[文章编号]1673-7210(2007)02(b)-081-03
目前中医中风病的证候诊断,是根据医生对患者望、闻、问、切的四诊信息,按照国家中医药管理局全国中医脑病急症科研协作组制定的《中风病辨证诊断标准》(1994年)所规定的中风病证候诊断标准量化评分表(以下简称证候量表)给以评分,给出包括风证、火热证、痰证、血瘀证、气虚证、阴虚阳亢证6个主要证候的分值进行判断的。而对每个患者的施治原则则根据医生的经验对患者整体的症状进行判断后给出[1]。
近年来,数据挖掘技术在医疗领域得到广泛应用。关联分析是数据挖掘研究的一个十分重要的方面,对关联规则进行挖掘能够发现大量数据属性之间有趣的关联关系,例如,在医疗数据分析中,使用关联挖掘可以发现心脏疾病诊断数据集中的规则[4];在中医疾病证候诊断中,使用关联挖掘可以实现对隐含在《伤寒论》等文献中的诊断知识的学习[5];在中药方剂的研究中,使用关联规则可以确定方剂中的药对药组[6]。但是就作者所掌握的资料而言,关联挖掘用于中医中风病证候的诊断与治法相关性的研究,尚未见报道。
本文使用关联挖掘的方法,发现了大量有趣的中医中风病证候与治法之间的关联规则,得出了某些证候和治法之间相关性的评价,且结论与临床情况相符,可为中风病的中医诊疗规律的研究及治疗方案的形成提供数据支持。
1 问题描述
1.1 一般资料
数据来源于2003年11月~2006年3月在北京中医药大学东直门医院、中国中医科学院西苑医院、广安门医院、首都医科大学朝阳医院住院治疗的急性缺血性中风患者的数据库资料。选取在发病72 h内入院的423例患者的数据,并分别提取这些患者在入院0~1 d、2~3 d、6~8 d、12~16 d四个时间段中记录完整的中医六证证候量表分值和治法类别的数据,共621例次。
表1为中风病中医证候诊疗数据库中的数据实例片段。其中,各证候列为患者的证候得分;治法ID列为医生记录的治法大类,如11代表理血法、14代表补益法、17为治风法、18为祛痰法等。
表1中医中风病证候诊疗数据实例片段
1.2 问题提出
若视一个患者某一天的记录为一个交易样本,而患者的各证候量表分值或治法类别为此样本的一个数据项,包含621例次患者数据的数据库即可视为一个包含621次交易的交易数据库,那么证候和治法之间的相关性问题,就等同于数据挖掘中经典的购物篮分析问题,可根据每个患者各项的数据记录而发现不同项之间所存在的关联知识,用以帮助分析其规律性。
2 相关性研究
2.1 关联挖掘介绍[2]
关联规则挖掘就是从大量数据中挖掘出有价值的描述数据项之间相互联系的有关知识。
设I={i1,i2,…,im}为数据项集合;设D为与任务相关的数据集合,也就是一个交易数据库;其中的每个交易T是一个数据项子集,即 。设A为一个数据项集合,当且仅当时就称交易T包含A。一个关联规则就是具有“A=B”形式的蕴含式;其中有A I,B I且A∩B=Φ。规则“A=B”在交易数据集D中成立,且具有s支持度和c信任度。这也就意味着交易数据集D中有s比例的交易T包含A∪B数据项;且交易数据集D中有c比例的交易T满足“若包含A就包含B条件”。具体描述就是:
Support(A=B)=P(AB)
Confidence(A=B)=P(B/A)
关联规则的支持度(support)和信任度(confidence)是两个度量有关规则趣味性的方法。它们分别描述了一个被挖掘出的关联规则的有用性和确定性。满足最小支持度阈值和最小信任度阈值的关联规则就称为强规则。
一个数据项的集合就称为项集;一个包含k个数据项的项集就称为k-项集。满足最小支持阈值的项集就称为频繁项集(frequent itemset)。那么挖掘关联规则主要包含以下两个步骤:①发现所有的频繁项集,根据定义这些项集至少满足最小支持度阈值;②根据所获得的频繁项集,产生相应的强关联规则。根据定义,这些规则必须满足最小信任度阈值。
但是,上述基于“支持度-信任度”框架理论的关联规则挖掘方法存在这样的情况,对于某些规则,从数据库中直接取A的时候,概率可能大于在规则中取到A的概率。为了略去这样的规则,引入兴趣度(correlation, 或称相关度)的概念,具体的公式如下:
兴趣度反映了规则“A=B”中A和B的密切程度。只有当兴趣度大于1时,A和B才是正相关的,规则是有趣的强规则;兴趣度等于1或小于1时,则A和B是相互独立或者负相关的,规则无趣,应丢弃。
若在中风病中医证候诊断数据中,挖掘出类
文档评论(0)