- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
名老中医电子病案数据的挖掘
摘要:运用统计软件分析挖掘名老中医的临床病案,能更好地学习和传承名老中医的临床经验。按照电子病案数据分析挖掘的过程顺序,从名老中医病案的特点入手,介绍了电子病案的数据导出与清洗、电子病案的数据筛选、信息表的构建、数据分析挖掘方法及临床判读的具体内容及注意事项,其中数据分析挖掘部分,具体介绍了描述性统计量的分析、回归分析、聚类分析、关联规则分析、分类预测(决策树、人工神经网络)以及时间序列数据挖掘的具体应用,每一部分都介绍了相关的中医病案数据挖掘的实际案例以及相关软件,使读者对名老中医电子病案的数据分析挖掘过程有更深刻地了解,能根据文章内容做一些简单的数据分析挖掘工作。
临床病案是传承名老中医学术经验的重要载体,是学习名老中医临床经验的重要工具。随着各个医院的电子病案系统的逐步推广,名老中医门诊电子病案数据分析挖掘工作也得以推进,并在学术经验思想传承工作中显示了其重要性。然而一些复杂深奥的统计学方法,非简单的学习就能掌握,在没有专业的数据分析人员的帮助下,医务人员进行数据分析挖掘受到了很大的限制。文章中介绍了利用Microsoft Office Excel、Microsoft Office Access、SPSS、SPSS Modeler这些软件,进行数据分析挖掘。1 数据准备1.1 病案数据导出电子病历的导出一般需要由医疗机构的病案管理部门或信息中心等机构操作。病案信息导出时,力求信息完整,包含尽可能多的内容,数据可以采用Microsoft Office Excel软件表格。另外信息导出时,信息分类越细,越有利于后期的统计分析。特别注意中药处方信息的导出,最好是包含患者ID号及处方中每味中药的名称、剂量的独立数据表。1.2 数据清洗数据清洗包括检查数据一致性、处理无效数据和缺失数据等。一致性检查是为了发现病案数据中超出正常范围、逻辑上不合理或者相互矛盾的数据。例如,在数据导出时,可能也导出一些既往的中医诊断,导致疾病或证候的不一致,此时就需要对数据进行删改。病案中还可能存在缺失数据的情况,如果缺失的对象相对整个数据集比例较小,可以考虑直接删除,如果比例较大,则需要进行数据补充。研究人员可以依据情况用平均值、中位数、或出现频率最高的值来填充。另外有些数据分析挖掘方法,对于数据缺失具有很好的适应、控制和处理能力,可以自动对缺失数据进行处理,然后再对数据进行分析挖掘。1.3 病案筛选⑴获得病案信息后,先确定分析挖掘的目的。通过分析文献显示研究热点问题,分为单独某位名老中医治疗某个疾病的数据分析挖掘2 病案信息名词的标准化2.1 中医名词的标准化中医症状名词的标准化,可以参照《中医临床常见症状术语规范》2.2 中药药名的标准化电子病案中的中药药名一般已经实现了标准化,主要是有一些药物有不同的炮制方法,导致不同的药名,例如半夏涉及到姜半夏、法半夏、生半夏、清半夏等不同品种,需要根据实际的分析目的决定是否都按“半夏”进行分析。3 数据分析挖掘3.1 描述性统计量的分析常用的描述性统计量:⑴描述集中趋势的统计量,如:均值、众数等;⑵描述离散程度的统计量,如:样本标准差等;⑶频数分析。均值是最基本、最常用的一种指标。例如:可以通过均值了解名老中医使用某个药物平均剂量。众数是指样本中出现次数(频数)最多的数值,例如:可以了解名老中医使用某个药物常用剂量。样本标准差,可以反映名老中医使用某个药物时其药物剂量是否比较集中于某个剂量,还是剂量比较分散。在名老中医病案分析中,通过频数分析,可以了解名老中医治疗某个疾病时各种药物的使用频数,某个药物各种剂量的使用频数,某个疾病辨证时各种证候、症状出现的频数等,能够很好地反映名老中医辨证用药的一些基本规律。可以应用Microsoft Office Excel中数据-数据分析-描述统计,就可以方便地统计分析出算术平均值、众数、样本标准差。绝对频数可以用EXCEL的数据-分类汇总统计出,相对频数可以由绝对频数和总数计算得出。3.3 聚类分析聚类分析是以事物的基本特征为基础,按照一定的标准对研究对象进行分类的分析方法。在名老中医病案分析中,可以使用聚类分析,分析名老中医对于某个疾病的辨证分型,例如,采用聚类分析“心悸”的患者,对患者的症状及用药情况进行聚类,可以大体了解名老中医对于“心悸”的各种辨证分型及治疗情况。应用SPSS可以做聚类分析,SPSS中聚类方法有二阶聚类、K-均值聚类和层次聚类。3.4 关联规则分析关联规则分析是反映一个事物与其他事物之间的相互依存性和关联性的一种分析方法。实际应用时可以用关联规则分析同时出现次数多的药物组成,分析某个中医证候与哪些中药同时出现频率多,或者某个中医疾病与哪些
原创力文档


文档评论(0)