医学数据挖掘预测型知识专家讲座.pptx

医学数据挖掘预测型知识专家讲座.pptx

  1. 1、本文档共104页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于临床数据发觉预测型知识;例1从某单位1999年职员体检资料中取得101名正常成年女子血清总胆固醇(mmol/L)测量结果;例;表212只大白鼠进食量与体重增加量;预测型知识;预测型知识挖掘;挖掘预测型知识;目标:作出以多个自变量预计应变量多元线性回归方程。

资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少许定性或等级指标需作转换。

用途:解释和预报。

意义:因为事物间联络经常是多方面,一个应变量改变可能受到其它多个自变量影响,如糖尿病人血糖改变可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等各种生化指标影响。;表1多元线性回归分析数据结构

试验对象yX1X2X3….XP

1y1a11a12a13…a1p

2y2a21a22a23…a2p

3y3a31a32a33…a3p

nynan1an2an3…anp

━━━━━━━━━━━━━━━━━━

其中:y取值是服从正态分布;表27名糖尿病人血糖及相关变量测量结果;缺失值及处理;;线性回归;直线回归方程普通表示式;X;回归直线特征;直线回归统计推断;;应用条件(line):

线性(linear)

独立性(independence)

残差e服从正态分布(0,?)(normality)

等方差性(equityofvariance);非线性处理:结合专业知识,考虑回归方程中加入变量屡次方项。

?=a1+b1x1+b2x12

对变量数据进行转换

对数变换、log变换

;;医学数据挖掘预测型知识;Matlab实现线性回归;表27名糖尿病人血糖及相关变量测量结果;Matlab实现线性回归;Matlab实现线性回归;;挖掘预测型知识;Cox百分比风险回归模型;;生存数据;随访方式;随访方式;Cox百分比风险回归模型;

;Cox回归模型应用条件;Cox百分比风险回归模型;设不存在原因X1、X2、Xp影响下,病人t时刻死亡风险率为h0(t),

存在原因X1、X2、Xpt影响下,t时刻死亡风险率为h(t)。;Cox百分比风险回归模型;Cox百分比风险回归模型;风险函数(风险率);表示全部协变量Xi均为0时危险率,普通是未知。

基础风险率是未知数,但它和风险函数呈百分比。

H0(t)与时间相关任意函??,其分布和形状无明确假定,是非参数部分。;;;Cox回归模型检验;Cox模型中回归系数检验;原因筛选和最正确模型建立;相对危险度;

变量xj暴露珠平时风险率与非暴露珠平时风险率之比称为风险比HR(hazardratio)

hr=eβi;COX回归应用;;;Matlab实现cox回归;Matlab实现cox回归;Matlab实现cox回归;;生存分析总流程;几个率概念;生存概率、生存率;生存率(survivalrate);例:某病病人术后生存率;生存曲线;生存曲线;生存率预计方法;乘主动限法(Product-LimitMethod);;;;;寿命表法(LifeTableMethod);寿命表法预计生存率步骤以下:

1.将观察例数按时间段(年)0-,1-,2-,划分,分别计数期初例数,死亡,失访,截尾例数列入表22.21-5列。实际上,从第二个时间段开始,期初人数ni系由下式算得:

ni=ni-1-di-ui-wi

比如第二行,即时间段1-,有

n2=126-47-4-15=60

2.计算各时间段期初实际观察例数,(亦称有效例数)ni

ni=ni-ui/2-wi/2

上式表明该时间段期初例数中失访,及截尾例数只计其半时,即得有效例数。

如第一行,n1=126-4/2-15/2=116.5

3.分别用(22.5)(22.6)(22.7)式计算条件生存率^S(ti/ti-1),累积生存率s(ti)及其标准误。

计算结果已列于表22.2中,第7,8,11列,表中9,10二列系用于第11列计算。

比如时间段0--中

^S(ti/ti-1)=(116.5-47)/116.5=0.5966

^S(ti)=1×0.5966=0.5

文档评论(0)

159****4221 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档