数据挖掘技术对IgA肾病数据资料初步探索性研究.pdfVIP

数据挖掘技术对IgA肾病数据资料初步探索性研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
gA肾病数据资料的初步探索性研究 A_97数据挖掘技术对l 李靖徐冰高菁北京中医药大学东直门医院100700 摘要:数据挖掘可以从海量的数据中抽取有价值的知识和信息。关联规则挖掘是数据挖掘中的 一种,它可以从大量的数据中挖掘出有价值的数据项之间相互联系。本文通过关联规则分析201例 Igh肾病患者辨证分型与临床症状、肾穿病理检查结果等临床资料的规律,探讨Igh肾病中医证候 与临床及病理的相关性,更好的判断预后及指导临床治疗。 主题词:Igh肾病:数据挖掘:关联规则 Igh肾病是一种常见的肾小球疾病,诊断依靠肾脏病理诊断疾病,其主要病理表现为肾小球系膜 增生、基质增多伴沉积,是我国发病率最高的肾小球疾病,在我国约占原发性肾小球疾病26%-34%, 是导致终末期肾衰竭最常见的原因之一,不少学者从不同角度对IgA肾病的病因病机、辨证分型 及治疗等方面进行了火量的研究,但对其有效合理的治疗方法还没有定论。随着数字化信息时代的 发展和中医药研究的现代化,数据挖掘技术这种能够从海量的信息中快速寻找有价值知识的方法, 被逐渐应用到中医药研究领域上来,本研究拟通过数据挖掘技术中的关联规则,对201例IgA患者的 辨证分型与临床症状、肾穿病理检查结果等临床资料进行研究,探讨Igh肾病中医证候与临床及病理 的相关性,更好的判断预后及指导临床治疗。首先将本研究中用到的数据挖掘技术中关联规则的相 关知识简介如下: 1.数据挖掘的相关知识 1.1数据挖掘(DataMining)主要是指从大量的、不完全的、有噪声的、模糊的、随机的数据集 中识别有效的、新颖的、潜在有用的以及最终可理解模式的过程。它可以发现隐含在数据当中,可 以为人们所用的知识。数据挖掘所能发现的知识有如下几种:①广义型知识,反映同类事物共同性质 的知识②特征型知识,反映事物各方面的特征知识③差异型知识,反映不同事物之间属性差别的知 识④关联型知识,反映事物之间依赖或关联的知识⑤预测型知识,根据历史的和当前的数据推测未 来数据⑥偏离型知识,揭示事物偏离常规的异常现象。 1.2从挖掘任务和挖掘方法的角度看,有数据抽取、分类、聚类和关联规则等。 1.3数据挖掘过程一般可分为5个步骤:①问题定义:了解相关领域的背景和知识,明确用户要 求和任务。②数据提取:根据要求从数据库或数据仓库等数据源中提取相关数据。③数据预处理: 包括数据清理、数据集成、数据规约和数据变换,主要任务是对数据进行再加工,检查数据的完整 性及一致性,对其中的噪音数据进行处理,对丢失的数据进行填补。④数据挖掘:运用选定的知识 发现算法,从数据中提取出用户所需要的知识。⑤知识评估:将发现的知识以用户能理解的方式呈 现,并根据需要对知识发现过程中的某些处理阶段进行优化,直到满足要求…。见下图: 逻辑数 极选挣 段处理 被转按 被抽取 妓l·a化 据库 的数据 的投挺 的彳=息 躬姒识 后的救 据 选择l l预处理 l l转换 l I挖掘 l 1分析和同化 2.关联规则 关联规则挖掘作为数据挖掘技术中的一种常用方法,已被广泛的应用于各种领域,目前已初步 涉足于中医药方面的研究。它的本质是一种对条件概率、联合概率的方法的简化,并在这个简化过 程中注意了对数据库扫描次数和效率的改进,从而使算法更加实用化。 2.IX联规则中的相关概念 一个关联规则包括9部分:规则编号、前件、后件、最小支持度、实际支持度、最小置信度、实 际置信度、规则类编码、源样本量。支持度(sup)是对关联规则重要性的衡量,表示了规则的频度, 反映关联是否是普遍存在的规律。“=”之前称为前件, “=”之后的称为后件,支持度用于度量 一个项集的出现频率。置信度(conf)是对关联规则准确度的衡量,或者说表示了该规则的强度,反 映了关联规则前件成立的条件下结果成功的概率。其中,最小支持度和最小置信度是指为输出规则 结果所设定的支持度和置信度阈值;实际支持度是指规则前件发生的概率;实际置信度是指在规则 前件己发生的前提下规则后件发生的概率。规则类编码是对规则的特征化数字

文档评论(0)

gubeiren_001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档