临床医学大数据分析与挖掘—基于Python的机器学习与临床决策 配套课件.ppt

临床医学大数据分析与挖掘—基于Python的机器学习与临床决策 配套课件.ppt

  1. 1、本文档共632页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本课件是临床医学大数据分析与挖掘—基于Python的机器学习与临床决策配套课件

拟定调查问卷表并形成原始指标表,如图所示。 数据获取 定义纳入标准与排除标准,如表所示。 数据获取 标准 详细信息 纳入标准 (1)病理诊断为乳腺癌。 (2)病历完整,能提供既往接受检查、治疗等相关信息,包括发病年龄、月经状态、原发肿瘤大小、区域淋巴结状态、组织学类型、组织学分级、P53表达、VEGF表达等,作为临床病理及肿瘤生物学的特征指标。 (3)没有精神类疾病,能自主回答问卷调查者。 排除标准 (1)本研究中临床、病理、肿瘤生物学指标不齐全者。 (2)存在第二肿瘤(非乳腺癌转移)。 (3)精神病患者或不能自主回答问卷调查者。 (4)不愿意参加本次调查者或中途退出本次调查者。 (5)填写的资料无法根据诊疗标准进行分析者。 将收集回来的问卷表整理成的部分数据,如图所示。 数据获取 收回的问卷中,存在无效的问卷,为了便于模型分析,需要对其进行清洗处理。问卷调查根据纳入标准与排除标准的有效性条件筛选后,数据量变化情况如图所示。 数据清洗 变换结果如表所示。 特征变换 投保人编号 所属时间段 半年保费覆盖额 半年账单金额 半年支付金额 半年支付笔数 年龄 女 男 MCD MCQ MCbuy RegularMedicare Undocumented 伤残险 老年保障险 0 11200010435 2H 1240200 1254890 1225159 30 27 0 1 0 0 0 1 0 1 0 1 11600010648 1H 1051400 1065577 1039617 24 27 0 1 0 0 0 1 0 1 0 2 11700010743 1H 247800 250520 245811 4 49 0 1 0 0 0 1 0 1 0 3 11700010743 2H 785400 797520 776217 21 28 0 1 0 0 0 1 0 1 0 4 11800010877 1H 43800 44633 43172 1 92 1 0 0 0 0 1 0 1 0 5 11800010877 2H 823300 831500 814066 20 45 0 1 0 0 0 1 0 1 0 6 11900010939 2H 519800 525405 514391 13 61 1 0 0 0 0 1 0 1 0 7 12000011044 1H 634400 641222 624589 17 45 1 0 0 0 0 1 0 1 0 特征变换 投保人编号 所属时间段 半年保费覆盖额 半年账单金额 半年支付金额 半年支付笔数 年龄 女 男 MCD MCQ MCbuy RegularMedicare Undocumented 伤残险 老年保障险 7 12000011044 1H 634400 641222 624589 17 45 1 0 0 0 0 1 0 1 0 8 12000011044 2H 27400 27653 26477 1 55 1 0 0 0 0 1 0 1 0 9 12100011136 1H 2515600 2547452 2482790 66 90 1 0 0 1 0 0 0 1 0 10 12300011316 1H 1608700 1630068 1588060 44 90 1 0 0 1 0 0 0 1 0 11 12300011316 2H 2270200 2296306 2243225 52 67 0 1 0 0 0 1 0 1 0 12 12600011444 1H 1927500 1954878 1898355 57 67 0 1 0 0 0 1 0 1 0 13 12600011444 2H 209000 210953 207689 4 65 1 0 0 0 1 0 0 1 0 14 12800011526 1H 802900 814300 796480 19 22 0 1 0 0 0 1 0 1 0 15 12900011570 1H 186100 187962 183431 4 22 0 1 0 0 0 1 0 1 0 医疗机构特征变换过程与投保人特征变换过程操作类似,同样数据都对时间进行划分,具体特征变换过程如下3点。 先根据索赔信息表中投保人的住院开始时间特征划分为上半年(1H)和下半年(2H)两个部分。 接着按医疗机构编号和所属时间段进行分组,统计投保人数和处理过程数量;选取索赔订单中保费覆盖额、账单金额、支付金额的特征,分布按上、下半年时间进行统计,分别得到半年保费覆盖额、半年账单金额、半年支付金额、半年支付笔数。再选取医疗机构信息表中医疗机构大类(ProviderType)、医疗机构细(ProviderSpecialty)、位置编码(Location

文档评论(0)

教育课件资源 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档