实验一、简单统计分析和简单线性回归.docVIP

实验一、简单统计分析和简单线性回归.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验一、简单统计分析 1 实验目的 初步了解EXCEL和主要统计软件(SAS)的分析环境,掌握连续变量和离散变量的样本资料简单统计分析的方法。 2 实验原理 2.1连续变量的统计分析方法 样本统计量的计算: 样本均值,样本方差,样本标准误 均值检验 一尾检验 二尾检验 检验假设 H0: ( = (0 H1: ( (0 (或 ( (0) H0: ( = (0 H1: ( ( (0 检验统计量 否定区域 (或) 总体均值的()置信区间计算: 方差检验 一尾检验 二尾检验 检验假设 H0: H1:或 () H0: H1: 检验统计量 否定区域 (或) 或 总体方差的()置信区间计算: 2.2离散变量的分析方法 样本统计量的计算: 样本频率,样本频率方差,样本频率标准差 均值检验 一尾检验 二尾检验 检验假设 H0: p = p0 H1: p p0 (或 p p0 ) H0: p = p0 H1: p ( p0 检验统计量 否定区域 (或) 总体频率p的()置信区间计算: 3 实验资料 B1遗传群体(样本数n =200)的分子标记数据和株高表现型值,储存在“SimuQTL.XLS”文件中。 4 实验分析软件 采用Excel软件整理数据及简单统计分析,采用SAS对样本资料进行简单统计分析和两个样本之间的平均数差异检验。 5 实验步骤 5.1连续变量的统计分析 用EXCEL和SAS分别计算年份1中三个时期株高性状的样本均值、样本方差、标准误。 EXCEL:工具 → 数据分析 → 描述统计 SAS: 创建数据集 data rice1; Input ph6y1 ph7y1 ph8y1; Cards; 数据略 ; 调用模块分析计算 proc means mean var stderr; Var ph6y1 ph7y1 ph8y1; Run; 用SAS分析年份1和年份2中对应时期株高性状的平均数差异(假设为两个独立样本),分析相同年份中三个时期之间的平均数差异(假设为相关样本)。 独立样本:创建数据集 data rice2; Input year ph6 ph7 ph8; Cards; 数据略 (将两年份的数据进行合并,以year这个分组变量来区分) ; 数据分析:Solution → Assist → data analysis → ANOVA → t tests → Compare two group means → [table]选用数据集work.rice2; [dependent]分别选变量ph6, ph7和ph8; [classification]选变量year → run 相关样本:创建数据集 data rice3; Input ph6y1 ph7y1 ph8y1; Cards; 数据略 ; 数据分析:Solution → Assist → data analysis → ANOVA → t tests → paired comparisons → [table]选用数据集work.rice3; [paired column]分别选ph6y1, ph7y1, ph8y1中的两个 5.2离散变量的统计分析 用EXCEL计算B1群体分子标记的样本频率和样本频率方差的估计值。 用1替换A,0替换B → 用count(数据区域)命令计算样本个数(n) → 用sum(数据区域)命令计算分子标记表现型为“1”的样本个数(np) → 计算分子标记表现为“1”型的发生概率p = np /n → (1-p)即为分子标记表现为“0”型的概率 → 计算样本频率方差 6 实验作业 6.1连续变量的统计分析 计算株高性状的总体均值及方差的95%置信区间。检验年份1和年份2对应时期株高性状的平均数差异(给出时期1的检验结果);检验相同年份中三个时期之间的平均数差异(给出年份1的检验结果)。 6.2离散变量的统计分析 计算B1群体分子标记总体频率的95%置信区间,检验各项分子标记是否符合1:1的分离比例。(每位同学任选其中的5个分子标记报告结果) 实验二、方差分析 1 实验目的 掌握基于线性模型的方差分析方法。 2 实验原理 2.1单因素方差分析方法 回归模型: 单因素方差分析表 变异原因 自由度 平方和 均方 期望均方 (固定模型) 期望均方 (随机模型) 处理 t-1 SST MST 残差 r(t-1) SSE MSE 总和 rt-1 SSTO 固定模型F检验: 原假设,备

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档