- 36
- 0
- 约1.94千字
- 约 9页
- 2017-09-20 发布于河北
- 举报
数据采集与统计分析.doc
习题8.4
对28个人,调查他们乘车还是骑车上班,得数据如下表所示,其中y=1表示乘车上班,age表示年龄,income表示月收入,gender表示性别,gender=1表示男性,gender=0表示女性。对于表中数据,设某位男士年龄50岁,月收入2000元,用最大概率判别法判断它是否乘车。
程序如下:
data ybs;
input gender age income y;
cards;
0 18 850 0
0 21 1200 0
0 23 850 1
0 23 950 1
0 28 1200 1
0 31 850 0
0 36 1500 1
0 42 1000 1
0 46 950 1
0 48 1200 0
0 55 1800 1
0 56 2100 1
0 58 1800 1
1 18 850 0
1 20 1000 0
1 25 1200 0
1 27 1300 0
1 28 1500 0
1 30 950 1
1 32 1000 0
1 33 1800 0
1 33 1000 0
1 38 1200 0
1 41 1500 0
1 45 1800 1
1 48 1000 0
1 52 1500 1
1 56 1800 1
1 50 2000 .
;
proc print data=ybs;
run;
proc discrim data=ybs outstat=info method=normal list;
class y;
var gender age income;
run;
以上是线性判别函数表,判为第i类的线性判别函数分别是(i=1,2):
L1(X)=1.84952gender+0.10027age+0.00662income-6.07096,
L2(X)=-0.53451gender+0.18397age+0.00758income-9.11691.
答:由上表可看出,这位年龄50岁,月收入2000元的男士乘车上班。
以上是回代误判情况分析。
习题9.1
用乙醇水溶液分离某种废弃农作物中的木质素,考察了三个因素(溶剂浓度、温度和时间)对木质素得率的影响,因素水平如下表所示,将因素A,B,C依次安排在正交表()的1,2,3列,不考虑因素间的交互作用。九个试验结果y(得率/%%℃ 保温时间(C)/h 1
2
3 60
80
100 140
160
180 3
2
1
习题9.2
在啤酒生产的某项工艺试验中,选取了底水量(A)和吸氨时间(B)两个因素,都取了8个水平,进行均匀实验设计,因素水平如下表所示,试验指标为吸氨量,越大越好,选用均匀表()安排实验,8个实验结果(吸氨量/g)依次为5.8,6.3,4.9,5.4,4.0,4.5,3.0,3.6。已知试验指标与两因素指标之间成二元线性关系,试用回归分析法找出较好的工艺条件,并预测该条件下相应的吸氨量。
水平号 底水量x1/min 吸氨时间x2/min 1
2
3
4
5
6
7
8 136.5
137.0
137.5
138.0
138.5
139.0
139.5
140.0 170
180
190
200
210
220
230
240 运行结果:
y=96.52583-0.69667X1+0.02183X2?
由上式可知,X1的系数为负,X2的系数为正,说明试验指标随因素X1的增加而减小,随因素X2的增加而增加,所以确定最优方案时,因素X1的取值应偏下限,即X1=136.5;因素X2的取值应偏上限,即X2=240.?
故最好工艺条件:X1=136.5?X2=240.预测值Y=6.67(g)?
补充题:
解:用均匀表构造初始单纯形。指标以大为好。
顶点号 因素1 因素2 因素3 指标y 最坏点 单纯形点集(优-劣) 推移过程 A 1 2 4 16 B 2 4 3 23 C 4 3 1 18 D 3 1 2 20 A B,D,C,A 反射(α=1)E=2/3[B+C+D]-A E 5 10/3 0 74/3 反射成功 反射点E的坐标为(5,10/3,0)
(i)下一步推移名称:扩大,α1
(ii)下一步推移名称:内部收缩,α0;
(iii)下一步推移名称:收缩,0α1
(3)要对单纯形进行“整体收缩”,即以原单纯形中最好的试验点B为基点,由基点到各试验点距离之一半为新点,构成新单纯形.所以A`(3/2,3,7/2),C`(3,7/2,2),D`(5/2,5/2,5/2).新单纯形为BA`C`D`.
原创力文档

文档评论(0)