- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
西南科技大学生命科学与工程学院周海廷制作 为什么要学习统计? 在当今这个信息时代,我们将随时随地成为信息的接收者,我们也随时需要处理身边和工作中的信息和数据.如此众多繁乱的信息,我们该如何”借来一双慧眼”,看个清楚明白呢? 桑普拉斯说:统计分析让一切假象原形毕露。但是,统计中也有不少陷阱,蹩脚的数据分析师总是披着统计的外衣有意或无意地制造假象,许多年前的一本著作《How to lie with statistics》就对此有过幽默而深刻的描述,最近出版了中译本名为《统计陷阱》,达莱尔.哈夫著,廖颖林译,有兴趣的朋友不妨一睹为快。 对于任何一个成功的应用项目来说,一个真正的统计学家和数据分析专家是必不可少的,他会指引你绕过礁石和旋涡,到达成功的彼岸。 几个统计故事 1.1936年美国杂志文学文摘预测在总统大选中哪位候选人会胜出? 2.中国知识分子的寿命比正常人寿命少10年? 3.学历越高,收入越多,上网时间越长? 有限总体(finite population):总体中包含的个体数目有限,这种总体称为有限总体。 观察值(observation):每一个体的某一个性状、特性的测定数值叫做观察值。 参数(parameter):由总体的全部观察值而算得的总体特征数,如总体平均数,称为参数。 样本(sample):从总体中抽出的一部分个体的集合。 估计值(estimate):由样本函数确定的总体相应参数的函数值。 随机样本(random sample):从总体中随机抽取的样本,满足随机性和等可能性。 样本容量(sample size):样本中包含的个体数,用n表示。 2.1 数据资料的性质与分类 一、数量性状资料 数量性状(quantitative trait)的度量有计数与量测两种方式。 1、不连续或间断性变量(discontinuous or discrete variable):指用计数方法获得的数据。 2、连续性变量(continuous variable):指称量、度量或测量方法得到的数据。 2.2 数据频数或频率分布表 一、间断性变量资料的整理 1、100个麦穗每穗小穗数的次数(频数)分布表 2、200个稻穗每穗粒数的次数(频数)分布表 二、连续性变量资料的整理 对于此类情况,一般的处理步骤是: 1、数据排序(sort) 2、求极差(range) R=Max(1…n)-Min (1…n) 3、确定组数和组距(class interval) 组距=R/组数 因而必须先确定组数。组数的确定,可参照以下的因素: (1)观察值个数的多少;(2)极差的大小;(3)便于计算;(4)能反应出资料的真实面貌。 以140行水稻试验的产量为例,(数据略。)其中极差:R=254-75=179g 观察值的个数为140,可分8-16组,假定分为12组,则组距=179/12=14.9,为方便起见,组距定为15g。 数据分组频数统计表如下: 三、属性变量资料的整理 把资料按各种质量性状进行分类,分类数等于组数,然后根据各个体在质量属性上的具体表现,分别归入相应的组中,即可得到属性分布的规律性认识。下表是某水稻杂种二代植株米粒的分离情况: 2.3 数据频数或频率分布图 一、方柱形图(直方图) 方柱形图(histogram)适用于表示连续性变量的次数分布。 横轴为分组数列,纵轴为分布频数。横坐标与纵坐标的长度要有合适的比例(一般为5:4或6:5为好),绘成的图形才能明显表明频数分布情况。 二、多边形图 多边形图(polygon),以每组中点值为横坐标,以频数为纵坐标。 三、条形图 条形图(bar diagram)适用于间断性变量和属性变量资料。一般横坐标表示间断的中点值或分类性状,纵坐标表示频数。 四、饼图 饼图(pie diagram)适用于间断性和属性资料,用以表示这些变量中各种属性或各种间断性数据观察值在总观察值个数中的百分比。 利用Excel作图 利用Excel可以方便的作出各种数据资料的分布图形。 3.1.1 平均数的意义和种类 一、平均数的意义 平均数(average)是数据的代表性,表示资料中观察值的中心位置,并且可以资料的代表而于另一组资料相比较,借以明确两者之间相差的情况。 二、平均数的种类 1、算术平均数(arithmetic mean):一个数量资料中各个观察值的总和除以观察值的个数所得的商,记作 2、中位数(median):将资料内所有观察值从大到小排列,居中间位置的观察值称为中位数,记作Md 例如: 1、2、3、4、5 的中位数是3 1、2、3、4、5、6 的中位数是: (3+4)/2=3.5 3、众数(
您可能关注的文档
- 2.1.2离散型随机变量的分布列 课件(人教A版选修2-3) - 副本教学.ppt
- 2.1-3 化学键分析.doc
- 2.1Linuxshell编程教学.ppt
- 2.1人体的新陈代谢教学.ppt
- 2.2 串口设备数据的接收和处理教学.ppt
- 2.2 管理我的资料教学.ppt
- 2.2 通过激素的调节 上课版教学.ppt
- 2.2 通过激素的调节1教学.ppt
- 2.2.2人体的激素调节_20121012090122702分析.doc
- 2.2_通过激素调节教学.ppt
- 2024年学校党总支巡察整改专题民主生活会个人对照检查材料3.docx
- 2025年民主生活会个人对照检查发言材料(四个带头).docx
- 县委常委班子2025年专题生活会带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”对照检查材料四个带头:.docx
- 巡察整改专题民主生活会个人对照检查材料5.docx
- 2024年度围绕带头增强党性、严守纪律、砥砺作风方面等“四个方面”自我对照(问题、措施)7.docx
- 2025年度民主生活会领导班子对照检查材料(“四个带头”).docx
- 国企党委书记2025年度民主生活会个人对照检查材料(五个带头).docx
- 带头严守政治纪律和政治规矩,维护党的团结统一等(四个方面)存在的问题整改发言提纲.docx
- 党委书记党组书记2025年带头增强党性、严守纪律、砥砺作风方面等“四个带头”个人对照检查发言材料.docx
- 2025年巡视巡察专题民主生活会对照检查材料.docx
最近下载
- 2024年度公司领导班子民主生活会对照检查材料3篇.docx VIP
- JTGD60—2015公路桥涵设计通用规范.pdf VIP
- 技术部薪酬及岗位制度.doc
- 马工程教材《组织行为学》课件 第四章 团队.pptx
- 标准规范文件:DL/T 5424-2009 水电水利工程锚杆无损检测规程.pdf
- 广东省广州市八年级上学期物理期末试卷四套(附参考答案).doc VIP
- 2019-2020年高一英语人教版必修1专项训练:语法填空Word版含答案.docx VIP
- 第19课《大雁归来》教学设计 统编版语文七年级上册(2024年).docx VIP
- 2022水电工程移动式集运鱼系统设计规范.docx
- 2024年6月英语四级真题(全3套).pdf
文档评论(0)