- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六讲 生存分析 ——以员工离职管理为例 一、生存分析与生存数据 生存分析应用于生物医学、工业、社会科学等领域,比如肿瘤患者治疗后生存时间、电子设备的寿命、婚姻持续时间、员工工作时间等等; 生存数据特点:在研究期间结束时在某些个体身上还没有发生,如果所观测的数据含有事件称为删失数据。比如,员工在企业的工作时间就是生存数据,把员工加入企业看作“出生”,离职看作“死亡”,工作时间就是看作“生存时间”; 二、生存时间函数 生存函数(累积生存率) 概率密度函数 危险率函数(风险函数) 三、Cox回归模型 比例风险模型(Cox模型) 其中 是一个同X无关的基准风险函数。 它是等比例风险模型,这是因为 极大似然估计 参数估计 Cox模型允许基准风险 的函数形式任意,不需要为基准风险设定函数形式,可以照常估计回归系数 估计方法 极大似然估计 统计学推断 四、生命表分析 生命表用来概括在特定的时期里特定人口的死亡情况,是一种非参数分析方法 实验研究饮食与肿瘤之间的关系,对90只老鼠分成3组,在相同环境下,分别给予低脂饮食、饱和饮食和不饱和饮食,注射等量的肿瘤细胞,观测200天,做出不同喂养方式下的生存时间表,比较不同喂养方式下生存的时间是否有显著性差异。 五、KM分析(Kaplan-Meier分析) 时间变量是数值型 状态变量是二分变量或分类变量 发生的事件可以用一个正数值或用某个范围的连续数值表示 假设:事件发生的概率仅依赖于时间 案例:根据某医院对58例肾上腺样瘤病人在不同治疗中的数据,分析在切除或不切除肾脏条件下两种治疗方案的结果是否有显著差异。 六、Cox Regression 风险比例模型分析 因变量:生存时间,时间变量是数值型,状态变量可以是分类或连续型变量; 自变量:与生存时间有关的一组变量; 比例风险假设:从一个事件到另一个事件的风险比例不随时间而变化 一般来说,使用向后消去法可以减少漏掉潜在的有价值的预测因子 实例 根据一组137位肺癌患者生存时间的数据,辨认预测因素 七、以员工离职管理为例 背景介绍 企业如何留住自己的员工 数据说明 数据来源:国内某大型商业银行人力资源部门,1300个样本 因变量: Y:员工在职时间 C:是否已经离职 解释变量 X1:户籍 X2:性别 X3:年龄 描述分析 1.整体的描述分析 员工的平均在职时间有多长? 均值?中位数? 2.对比分析 分户籍生存函数 分性别生存函数 分年龄生存函数 模型分析 KM分析 实际操作 生存函数 对比分析 Cox等比例风险模型分析 参数估计结果 Cox模型的优劣 缺点: 不好懂 优点: 对模型设定要求较弱 应用广泛 课后习题 癌症临床试验数据研究 1.研究目的:对比评估某新治疗方案的疗效; 2.数据介绍: 因变量是病人的生存时间和生存状态, 自变量是不同治疗方案、癌细胞类型、临床打分、病人年龄; 3.作业要求:做完整的生存数据回归分析,包括参数估计、假设检验,以及预测评估。 * id 患者编号 diagtime 诊断到治疗时间 time 生存时间 prior 治疗前处理 0 经过处理 1 未经处理 therapy 治疗方案 1 标准方法 2 实验方法 status 病人状态 0 死亡 1 删失数据 cell 1 鳞癌 2 小细胞肺癌 3 腺癌 4大细胞肺癌 kps 判断标准 《30住院 30—60住院和家庭治疗 》60家庭治疗 *
文档评论(0)