《SPSS数据分析教程-4概率论初步》-公开课件.ppt

《SPSS数据分析教程-4概率论初步》-公开课件.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS数据分析教程 —《SPSS数据分析教程》 第4章 概率论初步 目录 4.1 离散型随机变量的仿真 4.1.1 均匀分布的随机数 4.1.2 正态分布的随机数 4.2 理论分布 4.2.1 二项分布的分布函数和概率 4.2.2 连续分布的随机变量—正态分布 4.3 经验分布 4.4 抽样分布 4.5 置信区间 本章学习目标 用仿真方法从总体中抽取随机样本:生成服从某种分布的随机数; 得到观测值的理论分布、经验分布; 理解抽样分布的形状; 掌握如何求置信区间; 学习如何从数据集中选择符合条件的个案。 4.1 离散型随机变量的仿真 4.1.1 均匀分布的随机数 假设我们有一个正方形,它被均匀的分为4个相同大小的小正方形。现在从正方形的中心上方随机地投掷一颗玉米粒1?000次,假设每次投掷的玉米粒都等可能的落在4个小正方形中的一个之中。 问题是:落在1号、2号、3号和4号正方形中的情况如何呢? 模拟投掷的过程 (1) 第1步:设置随机数种子 选择【转换】→【随机数字生成器】,勾选“设置起点”,并在“固定值”下的“值”中输入一个用户给定的数值。 第2步:生成均匀分布的随机数,等可能的产生1,2,3和4这四个数共计1?000个. 选择【转换】→【计算变量】,在“目标变量”框中输入变量名?“Spinn”,在“数字表达式”框中输入TRUNC(RV.UNIFORM(1,5)),然后单击【确定】按钮. 模拟投掷的过程 (2) 第3步:然后分析这四个数出现的次数和相对频率。 选择【分析】→【描述统计】→【频率】 随机数分析(1) 随机数分析(2) 4.1.2 正态分布的随机数 正态分布的随机变量是连续型随机变量,它的可能取值是所有实数。数据分析的许多模型和理论都要求数据服从正态分布,因此正态分布的随机数在模拟中有广泛的应用。 一、生成正态分布的随机数 第1步:设置随机数种子为123456 第2步:选择【转换】→【计算变量】, 应用函数RV.Normal(0,1)。 生成随机数示意图 二、分析这些正态随机数的性质 绘制随机数的序列图,有几种方法 方法1:选择【图形】→【图表构建程序】,选择“条” 方法2:选择【分析】→【预测】→【序列图】 方法3:选择【图形】→【旧对话框】→【线图】 该样本数据的确是从正态分布的总体中随机抽取的呢? 绘制随机数的带有正态曲线的直方图 4.2 理 论 分 布 除4.1中的均匀分布和正态分布外,常见的分布还有二项分布、负二项分布、泊松分布、指数分布、t分布等。SPSS软件中提供了这些常见分布的分布函数、概率分布函数和概率密度函数。 SPSS的PDF与非中心PDF函数族提供了相关分布的概率分布函数或者概率密度函数,CDF与非中心CDF函数族提供了相关分布的累积概率分布函数(或简称分布函数)。而逆DF函数族则给出了相应分布的分位数。 4.2.1 二项分布的分布函数和概率 如果随机试验只有两个可能的结果,设该试验中成功的概率为p。如果将该试验独立地重复进行次n次,这一串重复的独立试验称为重n贝努力试验。如果用X表示在这次试验中成功的次数,则随机变量X服从二项分布,其分布函数为 CDF.BINOM(x,10,0.25),该函数用于计算出x所对应的累计概率,即: (1) 这里[x]表示不大于的最大整数。。 PDF.BINOM(x,10,0.25)计算而X取某个特定值i的概率为: (2) 由上面(1)式计算出的为分布函数的值;如果是离散随机变量,(2)式给出的为概率值,它是随机变量X取各个离散值0,1,2,…,10的概率 。 函数CDF.BINOM(x,10,0.25)用于计算n=10,p=0.25的二项分布下x的分布函数值或者称为累计概率。 二项分布的概率分布图 4.2.2 连续分布的随机变量—正态分布 连续型随机变量的任何两个可能取值之间都有无限多个可能的取值,因此所有可能取值是不能列举的,也不能给随机变量的某可能取值赋给一个唯一的概率值。 一般考虑连续型随机变量的分布函数(即累积概率函数(Probability Cumulative Function,CDF)和密度函数(Probabilitty Density Function,PDF)。 SPSS的CDF函数族给出的就是分布函数的值。 CDF.NORMAL(x,0,1)是给出均值为0,标准差为1的正态分布变量x的累计概率分布函数值。 PDF.NORMAL(x,0,1)是给出均值为0,标准差为1的正态分布变量

文档评论(0)

saodishenseng2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档