(实验报告)基于SPSS-Modeler的药物研究数据挖掘与建模评估.pdf

下载文档

27
0
约5.64千字
约 11页
2023-10-31 发布于湖北
举报
版权申诉
保障服务

(实验报告)基于SPSS-Modeler的药物研究数据挖掘与建模评估.pdf

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

实验报告小组成员姓名学号一、实验名称：基于 SPSS Modeler 的药物研究数据挖掘与建模评估二、实验目的： 1、在所选案例的具体分析中，通过数据挖掘考察影响病人治疗的各个变量的数据分布特征，并对病人的药物选择的考虑因素建立决策树模型并进行预测精度评价。 2、通过本案例的实验操作，理解和掌握基于 SPSS Modeler 的数据挖掘辅助决策过程。三、实验数据：本实验研究的案例数据是SPSS Modeler 软件自带的一组药物研究的数据（详见 GRUG.txt ），描述如下：根据统计，许多患有同种疾病的不同病人，服用5 种药物中的一种（Drug，分为 drugA、drugB、drugC、drugX、drugY ）之后都取得了同样的治疗效果；随机挑选部分病人服用药物前的基本临床数据，包括：血压（BP，分为高血压 HIGH、正常 NORMAL、低血压 LOW）、胆固醇（Cholesterol ，分为正常 NORMAL 和高胆固醇 HIGH）、唾液中钠元素（Na）和钾元素（K）含量、病人年龄（Age ）、性别（Sex ，包括男 M 和女 F）等。四、实验方法： 1 / 11 运用 SPSS Modeler 软件（本实验使用版本为 18.0）进行数据挖掘发现以往药物处方适用的规律，给出不同临床特征的病人更适合服用哪种药物的建议，为医生开具处方提供参考；同时，建立药物选择的决策树模型，并对所建的模型进行预测精度的分析评价。五、实验步骤： 1、将数据读入到 Modeler 中。在【源】选项卡中选择【变量文件】节点，并设置节点参数。在【文件】选项中制定从文件 DRUG.txt 中读入数据。如下图： 2、浏览数据内容。在【输出】选项卡中选择【表格】节点，添加到数据流中，运行该节点生成数据表。如下图： 2 / 11 3、观察各变量的数据分布特征。在【输出】选项卡中选择【表格】节点，添加到数据流中，运行该节点生成数据表。如下图：图形显示：该组数据共有 200 个样本，Age 、Na、K 为数值型变量。软件的 3 / 11 【数据审核】功能自动计算出了最小值、最大值、均值、标准差、偏度等基本描述统计量；数据显示，病人的年龄最大值和最小值的差距比较大。同时，软件的【数据审核】功能还输出了数值型变量的直方图和分类型变量的柱形图；图形表明，病人的Age 、BP、Cholesterol 水平的分布比较均匀，总体差异不大，但服用药物 drugY 的病人明显多于服用其他药物的人数。 4 、观察服用不同药物的病人唾液中钠元素和钾元素的含量。以散点图为例：在【图形】选项卡中选择【散点图】节点，添加到数据流中，并设置节点参数，指定 Na 为 x 轴、K 为 y 轴，服用不同药物的病人数据表示为不同颜色的点。运行节点生成图形文件，如下图：