- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS04__SAS基本统计分析功能.ppt
分析: 由输出得Kendall Tau-b统计量值为0.217,渐近标准误差(ASE)为0.061,用统计量值加减两倍标准误差作为Kendall Tau-b的95%置信区间,可算得(0.095,0.339)在零点左边,所以可认为奶牛患病程度与种群大小有正的关联。 事实上,我们从列联表中实际频数与期望频数的对比也可以看出,小的种群患病比期望值轻,大的种群患病比期望值重,即患病程度与种群大小有正的关联。 作业:教材P161 18 补充:某公司准备抽出一个新品牌的矿泉水,现已万事俱备,就是在新产品的名称上几位董事意见尚未统一。董事屡议不决之后,最终决定进行抽样调查。在受访的200人中,52人更喜欢名称A, 61人更喜欢名称B,87人更喜欢名称C。请问A、B、C三种名称受欢迎程度有无差异? 掌握自学方法 事半功倍 返回 说明: (1)如果要自动挑选最优变量,可在model语句中增加选项 ‘selection=选择方法’,选择方法有none (全用,默认)、forward(逐步引入法)、backward(逐步剔除法)、stepwise(逐步筛选法)等。 如 model weight=height age /selection=stepwise ; run; (2)要输出其它结果可以print语句,如 Print cli Run; 说明: (3)若是一元线性回归,可以在因变量和自变量的散点图上加上回归直线和均值置信界限,程序如下: proc reg data=sasuser.class; model weight=height; plot weight*height/conf95; run; (4)若是要输出多元线性回归中残差对预测值诊断图,可用如下语句: plot residual.*predicted.; run; 4.3.2非线性回归 许多情况下变量间呈曲线关系,求解变量间的曲线关系的方程,可以直接拟合所选择的曲线方程式,但有时也可以变量代换成直线方程,再应用直线回归的方法求解。 【例2】某地大气中氰化物测定结果如下: 散点图分析表明 Y和X间呈现指数 函数关系案 ,现求回归方程。 距离污染物距离X(m) 50 100 150 200 250 300 400 500 氰化物浓度Y (mg /m3) 0.687 0.398 0.2 0.121 0.09 0.05 0.02 0.01 方法一: 分析:logy与x间的直线回归方程为: 代入logy=log10y,得指数方程为: 方法二: 分析:指数方程为 4.3.3二分类变量的Logistic回归(Logistic过程) 模型简介:设P为某事件发生的概率,取值范围为0~1,1-p为事件不发生的概率,将比数p/(1-p)取自然对数得ln(p/(1-p)),即Logit变换,记为Logit P。则Logit P的取值范围为-∞到+∞。以Logit P为因变量,建立线性回归模型为: 记 ,则模型变形为 数据要求:因变量为二分类变量,自变量可以是分类变量或等间隔测度的变量。 【例8.3】数据集data09-02.sav是乳腺癌患者的数据。变量包括:age(年龄)、time(患病时间)、pathscat(肿瘤扩散等级)、pathsize(肿瘤大小)、histgrad(肿瘤史)、ln-yesno(癌变部位的淋巴结是否含有癌细胞)。建立一个Logistic模型,并预测一个肿瘤大小为1cm, 肿瘤史为1年,肿瘤扩散等级2cm患病时间为1个月的60岁人癌变部位的淋巴结是否含有癌细胞。给定显著性水平α=0.05 结果分析: 结论: Logistic回归模型拟合结果为: 则 故该病人癌变部位的淋巴结会含有癌细胞。 作业:P150 16补充:某调查中收集了350大学生的数据信息,研究恋爱与否(变量V)与年龄(age)、地区(Location),各科平均成绩(score)、性别(sex)及身高(height)等变量的关系。各变量定义如下: 恋爱与否 (变量V) 年龄 (age) 地区 (Location) 平均成绩 (score) 性别 (sex) 身高 (height) 0:未恋爱 单位:岁 0:农村 单位:分 0:女 单位:厘米 1:已恋爱 1:城市 1:男 假设收集数据如下表,试建立Logistic模型,并分析22岁农村男生、身高170cm
文档评论(0)