- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HITON―PC算法医院病案首页数据挖掘
基于HITON―PC算法医院病案首页数据挖掘
摘 要:使用HITON-PC算法分析某甲级医院2015年住院首案中记录的非胰岛素依赖型糖尿病及其它协同疾病之间是否存在因果性。HITON-PC算法是一种运用条件独立性检验处理高维数据的因果分析算法,将其应用于医学数据挖掘中,能高效得出变量之间的因果关系。非胰岛素依赖型糖尿病与冠状动脉粥样硬化、高血脂、高血压、高血压II期和高血压III期之间有着因果关系。通过因果关系分析,可以很好地从大量临床数据中发现疾病间的潜在因果性,为相关疾病的临床诊断提供辅助,具有很强的实用性。
关键词:数据挖掘;HITON-PC;因果关系
DOI:10.11907/rjdk.172708
中图分类号:TP391
文献标识码:A 文章编号:1672-7800(2018)004-0188-03
Abstract:HITON-PC is an algorithm of causal analysis, and it is used to analyze the causal relationship between non-insulin dependent diabetes mellitus(NIDDM) and its cooperative diseases in the medical record data; it is also an algorithm of causal analysis which conducts high-dimensional data employed conditional independence test. HITON-PC is applied in medical data mining and it can effectively determine the causality between variables in medical data mining. There are a lot of causal relationships among NIDDM, hyperlipidemia and hypertension. Causality analysis is a good way to detect the potential causality between diseases from a large amount of clinical data.It can provide an auxiliary method for the clinical diagnosis of related diseases and plays a practical role in medical data mining.
Key Words:data mining; HITON-PC; causal relationship
0 引言
近年?恚?大数据已成为科技界和企业界关注的热点,其可对数量巨大的数据作搜索、比较、聚类和分类等分析归纳,找出数据之间的关联性。相关分析的目的是找出数据集里隐藏的相互关系网(关联网),一般用支持度、可信度和兴趣度等参数反映相关性[1]。大数据分析具有较高的容错性,其目的在于发现整体数据中某些指标之间的相关性,然后用分析结论改善因果关系分析的前提假设,并运用大数据分析具有的预测功能解决现实社会中的实际应用问题[2]。
因果关系阐释了事物间的本质联系,在日常生活中,人们更多依靠经验判定事物间的因果关系,比如抽烟会导致肺癌。虽然目前因果关系还没有一个能被广泛接受的严格定义,对其到底是客观世界本身的属性,还是人的意识为理解世界而创造出来的主观概念,人们还未达成共识。但随着大数据时代的来临,人们依然希望能从已有数据中客观分析事物间的因果关系[3]。如何利用已有信息判定事物间的因果关系是科学领域的一个基本问题,
HITON-PC即是一个经典的因果分析方法,它能高效地分析高维数据的因果性[4]。
1 HITON-PC
1.1 HITON-PC算法概念
HITON-PC基于因果马尔可夫假设发现变量间的因果关系,应用条件独立性测试识别出变量间的强关联与持久关联。该算法可靠性的关键在于完全覆盖条件独立性测试,使持续的关联性可以被正确识别。然而,进行所有条件独立测试通常是不可行的,因为其运算量较大、效率低。因此,约束算法设计的一个主要目标就是减少条件独立性测试数量,同时生成可靠结果。HITON-PC即作为一种约束算法被提出,该算法可运用队列的方法减少条件独立性测试数量[5]。
1.2 HITON-PC算法实现步骤
HITON-PC算法步骤如下:
原创力文档


文档评论(0)