网站大量收购独家精品文档,联系QQ:2885784924

一种识别多种慢性病患者数据集中隐藏模式的方法.docx

一种识别多种慢性病患者数据集中隐藏模式的方法.docx

此“医疗卫生”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
L.A. Demidova et al. / Procedia Computer Science 186 (2021) 620–627 PAGE 627 PAGE 626 L.A. Demidova et al. / Procedia Computer Science 186 (2021) 620–627 一种识别多种慢性病患者数据集中隐藏模式的方法 摘要 本文考虑了揭示多种慢性病患者数据集中隐藏模式的问题,提出了一种搜索关联规则数据库的方法,该方法具有给定的置信度阈值和规则左右部分的预定定量组成。分析了数据集中特征的初步处理结果,特别是患者年龄等特征对揭示隐藏模式问题最终解决方案的影响。已经给出了识别多种慢性病患者的数据集中的关联规则的例子,包括识别二型糖尿病糖尿病患者的模式的例子。 关键词:多种慢性病;联想规则;支持;自信;提升;定罪;先验的;遗传算法 1。 介绍 现代医疗信息系统(MIS)允许积累大量的统计信息,这些信息反映了关于某种类型疾病的数量、康复指标、死亡率以及研究结果(监测数据、数字化图像)等的数据。在大多数情况下,MISs允许生成关于疾病动态、恢复等的最简单的统计报告。然而,当处理可以从MISs中提取的医学数据集(项目集)时,相当令人感兴趣的是识别隐藏在这些数据集中的模式的问题的解决方案。这些问题就是数据挖掘问题,例如,可能涉及智能数据分类器的开发[1,2],回归模型的构建[3,4],判别分析[5,6],序列模式的形成[7,8],关联规则的识别[9,10]等。不幸的是,通常情况下,州医疗机构(MI)中的MISs没有配备高级数据挖掘和医疗决策支持模块。 近年来,由肥胖和人口老龄化引起的多种慢性疾病患者的数量在各种心肌梗死中有所增加。此外,重要的是确定疾病在患者整体MCD结构形成中的决定性作用。目前,对二型糖尿病糖尿病(T2DM)患者的MCD结构的分析受到了特别关注。然而,T2DM在MCD结构形成中的作用仍知之甚少,尽管某些事实证实了在糖尿病(包括新冠肺炎病)存在的情况下,各种疾病的病程更为严重。 为了识别隐藏模式,分析关于MCD患者的医学数据集的最明显的方法是涉及识别关联规则的方法[9-20]。 识别ARs的工具包最初是为基于交易的市场篮子分析而提出的[10-13]。然而,后来这个工具包的范围被大大扩展了,它被非常成功地用于解决数据挖掘的各种问题。在贸易领域,ARs被用于解决诸如根据顾客的购物行为来划分顾客等问题;顾客偏好分析;超市商品的选址规划;交叉销售;促销材料的定向邮寄。此外,ARs还成功应用于以下问题:网页访问量分析(网页挖掘)[14];文本分析(文本挖掘)[15];人口普查数据的分析[16];电信设备故障分析[17]等。 在医学数据的智能分析问题上,在应用识别急性呼吸道感染的工具包方面取得了某些成功。作者试图获得指示对患者执行的程序和报告的诊断之间的关系的关联规则[18],试图从病历中发现疾病、疾病和症状[19]、疾病和药物之间的相关性,试图除了分类和数字属性的组合之外还涉及医学图像特征的决策[20]。 识别ARs的算法出现的第一个先决条件出现在皮亚特斯基·夏皮罗的工作中。[9]1991年,它们在阿格拉瓦尔的作品中得到了进一步发展。[10-13]在1993-1997年.目前,Apriori [11]、ECLAT(等价类变换)[21]、FP-Growth(频繁模式增长)[22]等关联规则搜索算法广为人知,应用积极。这些算法允许为大型数据库构建ARs,放弃了对所有可能选项的彻底搜索[23]。由于对数据库进行了相应的索引,ECLAT实现了更快的支持索引计算,这使得它比Apriori更快。FP-Growth建议放弃支持Apriori和ECLAT的候选一代。因此,它不是从候选项的组合,而是从事务本身来实现前缀树在内存中的存储。这允许提高算法的速度并减少所需的内存量。上述算法的各种修改也被积极用于改善其特性。例如,AprioriDP (Apriori动态规划)[24]允许在特殊数据结构中存储一个支持索引,而FP盆景[25]是带有修剪树修剪的FP-Growth的改进版本。 可以假设,在为患有MCDs的患者分析数据集的问题中,使用用于识别ARs的工具包是非常合理的。在这种情况下,考虑到患者年龄的MCDs结构形成的揭示模式可能会引起相当大的兴趣。在这方面,建议开发用于识别具有相似MCDs结构的患者年龄组的方法,该方法由具有规则质量主要指标(置信度、支持度、提升度等)的预定阈值的关联规则来描述。显然,在确定患者的年龄组时,人们将不得不面临确定最佳组数和确定组范围边界的最佳值的问题。在最简单的情况下,可以通过网格搜索方法获得这个问题的解决方案。此外,可以使用一种或另一种进化优化算法,例如遗传算

文档评论(0)

真情无限 + 关注
实名认证
内容提供者

我喜欢上网,喜欢上原创力文档分享一些有价值的资源。

1亿VIP精品文档

相关文档