某些体检指标与冠心病相关性分析.docVIP

某些体检指标与冠心病相关性分析.doc

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
某些体检指标与冠心病相关性分析

某些体检指标与冠心病相关性分析   摘要:文章通过对得到的医院体检数据、门诊数据进行分析,将体检和诊断冠心病建立联系,并改进数据挖掘算法Apriori算法来进行关联分析。   关键字:数据挖掘;冠心病;Apriori算法;python   1.问题的提出   冠心病是冠状动脉粥样硬化性心脏病的简称,冠状动脉供应心脏自身血液,冠状动脉发生粥样硬化或者痉挛,使得冠状动脉变得狭窄甚至是鼻塞,导致心肌缺血缺氧的一种心脏病。冠心病由于其发病率高,死亡率高,严重危害着人类的身体健康,从而被称作是“人类的第一杀手”。所以对于冠心病患者的相关性分析成为近几年的热点,如何从已经得到的患者的数据中,找到与冠心病相关的数据,并进一步研究分析,或者与冠心病可能导致成因的数据加以分析,成为人们研究的重点。   据了解目前国内外研究冠心病发病相关因素主要停留在访谈法、A型行为量表测试收集资料法、问卷调查、病历分析等人工统计、分析阶段,鲜有相关资料证明是基于数据挖掘方面的冠心病发病相关因素研究分析的。随着计算机、网络技术的发展,获得有关资料已经变得简单易行。但是对于数量较大、涉及面广的数据,仅仅依靠简单地汇总,按照固定的模式进行分析统计是无法完成这一任务的,甚至是效率低下,得不到相应的结果,所以,一种智能化的,综合应用各种统计方法、数据库等的技术应运而生,这就是目前较为流行的数据挖掘。   数据挖掘又被称为数据库知识发现,是一种交叉学科,包括统计学、机器学习、数据库、模式识别等等,它是利用各种方法从海量的凌乱的有噪声的数据中提取隐含在其中的事先未知的有价值的模式或者规律的复杂过程,其过程包括对于数据库的建立和管理、提取数据、数据预处理、建立模型、模型评估等一系列过程。在海量数据、高维数据的现在,要注重从数据本身的特征出发,发现数据中隐藏的价值。   冠心病的确诊一般最常见的是心电图,再就是64排CT检查,通过检查血管狭窄的情况,来判断是否患病,且一般没有预测。之前的研究是基于检查以及确诊以及治疗的,没有对于体检后是否可以由某些体检数据得到与冠心病相关列的指标,本文将对冠心病与体检数据进行关联分析,本文的数据是由医院记录的多年的体检数据,以及体检后病人在此医院就诊的数据,对得到的数据进行分析,看冠心病与哪些体检指标有关联,希望获得一些对人类有贡献的知识。   2.国内外研究进展   冠心病是一种严重危害人类健康的常见疾病、多发病症,已经成为在不同国家和地区发病和死亡的最常见病症之一。在大多数发展中国家,包括我国在近几十年对于冠心病之死亡率也大幅度上升,预计到2020年,冠心病将成为全球人口死亡和残疾的最主要的元凶[1]。   其研究的内容是基于医学理论的,有脂肪浸润学说,血小板活化、聚集和血栓形成学说、肉皮损伤学说、炎症学说等等,大部分研究的是冠心病的发病机制,以及药物对于冠心病治疗的研究,当然也有对于单项发病因素进行研究的案例,例如血浆载脂蛋白与冠心病的相关性研究[2][3] 。   大部分的研究是在医学领域,对于病理的研究与分析。研究冠心病患者的冠心病危险因素的特点以及临床表现,探讨冠心病病变的相关性。通过对患者各项指标的测量,得到了冠心病的危险因素,包括高敏括高敏C-反应蛋白hs-CRP水平、左心室射血分数等[4]。目前对于揭示冠心病特征的变化规律,揭示冠心病症候特征的变化规律等[5]。   3.本文研究分析   本文将对从医院获得的上万条病人的体检数据以及病人的门诊确诊数据进行研究分析。病人的体检数据中有很多数据,比如有血、血浆、血清、尿等检测项目,进一步对于各项又有小的检测项目,比如光是血清又有两百多项项目,有HIV,ALD、类风湿因子等等,对于如此巨大的数据量,想要获得需要的信息,就需要对数据进行处理。   将导出的数据、各种量表及病人的相关数据整理,建立病人的原始资料数据表。此表中包含医院给出的所有数据,包括冗余数据,无效数据等。进一步需要对得到的数据进行处理。各个表格数据类型不尽相同,且不是对应于每个病人或者体检者有相应的检查数据、诊断数据以及住院数据,但是体检流水号是唯一的,所以对于各个表格进行连接靠着体检流水号的唯一性进行的。经过对数据的清洗,去重等操作,再进一步查找与冠心病有关的体检项目。   最终得到患冠心病的患者大部分都检查了血浆、学液等几项指标,对于得到的指标,并不是每个病人都检查了此项内容,再对其中的每一小项进行研究,得到了血浆中与冠心病有关的七个小项,进一步分析得到此项指标比正常人高出两倍。   4.本文研究方法与步骤   4.1问题的确定   对于从医院获得的数据,建立数据库ceshi,将得到的体检数据、门诊数据以及住院数据分别建立表tj_jy,tj_mz以及tj_zy;由于获取的数据是

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档