数模集训第一次论研读报告.docVIP

  • 6
  • 0
  • 约1.66千字
  • 约 5页
  • 2017-03-25 发布于贵州
  • 举报
艾滋病疗法评价及疗效的预测模型 第一篇: 对于所给的样本数据中有缺少的部分,本篇论文并没像第四篇中的那样采用拉格朗日线性插值法对数据进行补全,不过根据模型最后所得到的结果,就第一篇所用的方法似乎个别数据的不完整性不影响最后的回归结果。 1、首先,应用SPSS回归出CD4浓度随着时间t的二次变化曲线变化: 大致结果如下 模型描述 模型名称 MOD_2 因变量 1 CD4Count 方程 1 二次 自变量 CD4Date 常数 包含 其值在图中标记为观测值的变量 未指定 用于在方程中输入项的容差 .0001 个案处理摘要 N 个案总数 1665 已排除的个案a 3 已预测的个案 0 新创建的个案 0 a. 从分析中排除任何变量中带有缺失值的个案。 变量处理摘要 变量 因变量 自变量 CD4Count CD4Date 正值数 1624 1325 零的个数 38 336 负值数 0 1 缺失值数 用户自定义缺失 0 0 系统缺失 3 3 模型汇总和参数估计值 因变量:CD4Count 方程 模型汇总 参数估计值 R 方 F df1 df2 Sig. 常数 b1 b2 二次 .093 84.749 2 1659 .000 99.256 6.114 -.104 自变量为 CD4Date。 对于,CD4的SPSS运行结果,回归检验数F值为84.749,拟合优度0.93,P值为0,表示模型还是可行的,显著性通过。根据题意也可得:CD4的浓度是随着在一开始是随着时间的增加而增多的,而当超过了一定的时间之后,将会由于HIV的浓度的增加,CD4的浓度渐渐减小,符合二次抛物线模型。 下面就HIV与时间T的关系进行一个二次回归: 模型汇总和参数估计值 因变量:VLoad 方程 模型汇总 参数估计值 R 方 F df1 df2 Sig. 常数 b1 b2 二次 .238 245.047 2 1569 .000 4.396 -.162 .003 自变量为 RIVDate。 对于HIV的浓度变化的数据回归,可以看出F值为245.047。 回归方程为: 利用MATLAB可得最值,也即最佳停药时间为: syms x df diff 0.03*x^2-1.62*x+4.396 df 3/50*x-81/50 f inline 0.03*x^2-1.62*x+4.396 f Inline function: f x 0.03*x^2-1.62*x+4.396 X solve df X 27 把CD4和HIV分开讨论作为评价和预测的标准不是很合理,停药的标准应该是CD4达到最高开始下降的同时HIV达到最低开始上升,而非单独考虑其中之一的单性发展。 第二篇: 就是建立了一个完全二次多项式回归模型,对于编者按里所提到的把服药前CD4和HIV的浓度作为初始变量放入回归模型中的做法可以提高回归精度的原理,我并没有觉得是典型的特点吧,个人觉得第一篇第一问应该也有这样用,只不过它为了好处理,统一都取了对数。本文最大的特点应该是采用了逐步回归的方法,以及定义了较好的评价指标,即它定义了疗效CH m*C t /H t 作为疗效的评价标准。 首先,画出CD4的逐步回归图。 F值接近300,P值很小,说明逐步回归的效果还是相对可行的,然后从图中能看出C 0 ,H(0),t,,H 0 *t,对模型的影响较为显著。这里与原文有差误,原文中逐步回归出来的显著性因素中,没有这一项,产生的原因可能是由于在剔除数据的过程中,我的处理方式是直接将空缺的数值去掉。 所以有 F值为144.922,P值为3.20514e-146,非常小,由此可见回归模型的相对正确性,从图中看出,t,,,,,对因变量的显著性回归较为明显。 定义疗效,即越大,越小时,疗效越明显,画出CH的图像后,可得抛物线的顶点为最佳停止治疗的时间。

文档评论(0)

1亿VIP精品文档

相关文档