数据采集与统计分析.docVIP

  • 36
  • 0
  • 约1.94千字
  • 约 9页
  • 2017-09-20 发布于河北
  • 举报
数据采集与统计分析.doc

习题8.4 对28个人,调查他们乘车还是骑车上班,得数据如下表所示,其中y=1表示乘车上班,age表示年龄,income表示月收入,gender表示性别,gender=1表示男性,gender=0表示女性。对于表中数据,设某位男士年龄50岁,月收入2000元,用最大概率判别法判断它是否乘车。 程序如下: data ybs; input gender age income y; cards; 0 18 850 0 0 21 1200 0 0 23 850 1 0 23 950 1 0 28 1200 1 0 31 850 0 0 36 1500 1 0 42 1000 1 0 46 950 1 0 48 1200 0 0 55 1800 1 0 56 2100 1 0 58 1800 1 1 18 850 0 1 20 1000 0 1 25 1200 0 1 27 1300 0 1 28 1500 0 1 30 950 1 1 32 1000 0 1 33 1800 0 1 33 1000 0 1 38 1200 0 1 41 1500 0 1 45 1800 1 1 48 1000 0 1 52 1500 1 1 56 1800 1 1 50 2000 . ; proc print data=ybs; run; proc discrim data=ybs outstat=info method=normal list; class y; var gender age income; run; 以上是线性判别函数表,判为第i类的线性判别函数分别是(i=1,2): L1(X)=1.84952gender+0.10027age+0.00662income-6.07096, L2(X)=-0.53451gender+0.18397age+0.00758income-9.11691. 答:由上表可看出,这位年龄50岁,月收入2000元的男士乘车上班。 以上是回代误判情况分析。 习题9.1 用乙醇水溶液分离某种废弃农作物中的木质素,考察了三个因素(溶剂浓度、温度和时间)对木质素得率的影响,因素水平如下表所示,将因素A,B,C依次安排在正交表()的1,2,3列,不考虑因素间的交互作用。九个试验结果y(得率/%%℃ 保温时间(C)/h 1 2 3 60 80 100 140 160 180 3 2 1 习题9.2 在啤酒生产的某项工艺试验中,选取了底水量(A)和吸氨时间(B)两个因素,都取了8个水平,进行均匀实验设计,因素水平如下表所示,试验指标为吸氨量,越大越好,选用均匀表()安排实验,8个实验结果(吸氨量/g)依次为5.8,6.3,4.9,5.4,4.0,4.5,3.0,3.6。已知试验指标与两因素指标之间成二元线性关系,试用回归分析法找出较好的工艺条件,并预测该条件下相应的吸氨量。 水平号 底水量x1/min 吸氨时间x2/min 1 2 3 4 5 6 7 8 136.5 137.0 137.5 138.0 138.5 139.0 139.5 140.0 170 180 190 200 210 220 230 240 运行结果: y=96.52583-0.69667X1+0.02183X2? 由上式可知,X1的系数为负,X2的系数为正,说明试验指标随因素X1的增加而减小,随因素X2的增加而增加,所以确定最优方案时,因素X1的取值应偏下限,即X1=136.5;因素X2的取值应偏上限,即X2=240.? 故最好工艺条件:X1=136.5?X2=240.预测值Y=6.67(g)? 补充题: 解:用均匀表构造初始单纯形。指标以大为好。 顶点号 因素1 因素2 因素3 指标y 最坏点 单纯形点集(优-劣) 推移过程 A 1 2 4 16 B 2 4 3 23 C 4 3 1 18 D 3 1 2 20 A B,D,C,A 反射(α=1)E=2/3[B+C+D]-A E 5 10/3 0 74/3 反射成功 反射点E的坐标为(5,10/3,0) (i)下一步推移名称:扩大,α1 (ii)下一步推移名称:内部收缩,α0; (iii)下一步推移名称:收缩,0α1 (3)要对单纯形进行“整体收缩”,即以原单纯形中最好的试验点B为基点,由基点到各试验点距离之一半为新点,构成新单纯形.所以A`(3/2,3,7/2),C`(3,7/2,2),D`(5/2,5/2,5/2).新单纯形为BA`C`D`.

文档评论(0)

1亿VIP精品文档

相关文档