- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计量经济学的统计学基础 ——复习数理统计学 第一节 总体、样本和随机变量 总体、样本与随机变量 总体和个体 样本和样本容量 随机变量 总体(集合)和个体(构成集合的元素) 研究对象的全体称为总体或母体,组成总体的每个基本单位称为个体。注意: 总体中个体的数目称为总体容量,用N或T表示。N可以是有限数也可无限,分别称为有限总体和无限总体。 样本和样本容量 总体中抽出若干个个体组成的集体称为样本。样本中包含的个体的个数称为样本的容量,又称为样本的大小。 根据样本信息来推测总体的情况,并给出这个推测的可靠程度,称为推断统计。推断统计要求抽样是按随机原则选取的,即总体中每个个体有同样的机会被选入样本。 重复抽样和不重复抽样。 随机变量 按一定的概率取不同数值的变量称为随机变量(Random Variable)。 注意: (1)一个随机变量具有下列特性:RV可以取许多不同的数值,取这些数值的概率为p,p满足:0=p=1。 (2)随机变量以一定的概率取到各种可能值,按其取值情况随机变量可分为两类:离散型随机变量和连续型随机变量。离散型随机变量的取值最多可列多个;连续型随机变量的取值充满整个数轴或者某个区间。 (3)本书中,随机变量用x、y、?、?等符号表示 离散型随机变量与连续型随机变量 总体、随机变量、样本间的联系 总体就是一个随机变量,所谓样本就是n个(样本容量n)相互独立且与总体有相同分布的随机变量x1,……,xn。 每一次具体抽样所得的数据,就是n元随机变量的一个观察值,记为(X1,……,Xn)。 通过总体的分布可以把总体和样本连接起来。 总体分布是总体和样本的连接点 所谓分布,它是从全局而言的。通俗地说,分布就是某个对象在什么地方,堆积了多少。 任何一个随机变量都有自己的分布,这个什么地方就是在数轴上取什么值,堆积多少就是在那里占有的比例是多少或者概率有多大。 总体可以表示为随机变量,并具有自身的分布。 样本则是相互独立与总体具有相同分布的n元随机变量。因此,总体分布是总体和样本的连接点。从而,可以通过对样本特征的研究达到对总体进行研究的目的。因为它们具有相同的分布。 须知,如果对于一个随机变量完全掌握了它的分布规律,就完全明白无误了。 样本与总体之间的关系 样本是总体的一部分,是对 总体随机抽样后得到的集合。 对观察者而言,总体是不 了解的,了解的只是样本 的具体情况。我们所要做 的就是通过对这些具体样 本的情况的研究,来推知整 个总体的情况。 第二节随机变量的分布 (一)离散型随机变量的分布 定义:如果随机变量?只取有限个或可列多个可能值,而且?以确定的概率取这些值,则称?为离散型随机变量。 通常用分布列表示离散型随机变量: ?的概率分布也可用一系列等式表示: P( ? =xi)=pi (i=1,2,……)称为?的概率函数。注意这里xi只出现一次。 显然满足概率的定义: 离散型随机变量的分布就是指它的分布列或概率函数。 离散型随机变量举例1 例1 一批产品的废品率为5%,从中任取一个进行检验,以随机变量来描述这一试验并写出的分布。 以X=0表示“产品为合格产品”,X=1表示“产品为废品”,那么分布列如下: 其概率函数p(X=0)=0.95, p(X=1)=0.05, 离散型随机变量举例2 用随机变量X描述掷一颗骰子的试验。 分布的概率函数为: P(X=i)= 1/6(i=1,2,3,4,5,6) (二)随机变量的分布函数 定义:若X是一个随机变量(可以是离散的,也可以是非离散的),对任何实数x,令F(x)=P(X=x),称F(x)为随机变量X的分布函数。 F(x),即事件“X=x”的概率,是一个实函数。 对任意实数x1x2,有 P(x1Xx2)=P(X=x2)- P(X=x1)=F(x2)- F(x1) 由此可知,若已知X的分布函数,就知道X在任何区间上取值的概率。所以,分布函数完整的描述了随机变量的变化情况。 分布函数F(x)的性质 (三)连续型随机变量的分布 定义:对于任何实数x,如果随机变量X的分布函数 F(x)可以写成 概率分布密度函数的性质: (四)分布函数、概率函数、密度函数三者的关系 分布函数既适用于离散型也适用于连续型,是描述各种类型随机变量最一般的共同形式。但是,它不够直观。 概率函数对于离散型的描述很直观。 概率密度函数的大小能够反映X在x附近取值的概率的大小,从而比分布函数更直观。 所以,在实际应用中我们分别用概率函数和密度函数对离散型和连续型随机变量进行描述。 (五)多元随机变量 n元随机变量的定义:每次试验同时处理n个随机变量(X1,X2,……,Xn),它们的取值随试验的进行而变化。如果对任何一组实数(x1,x2,……,xn),事件“X1?x1,X2?x2,……,
文档评论(0)