- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
预备知识
§0.1 随机变量的概率分布和数字特征
用以描述随机变量的概率分布的工具有分布函数、概率密度函数和分布列.这些知识都已在概率论中学过了阶原点矩:
阶中心矩:
变异系数: ,其中是取正值的随机变量。
分位数、中位数
设随机变量的分布函数为.给定,称满足 的数为的下分位数.称满足的数为的上分位数.
本课程中均使用下分位数,并把下分位数简称为分位数.易见分位数完全取于的分布,故分位数常叫做某某分布的分位数,比如标准正态的分位数,标准正态分布的分位数记为,即满足,由标准正态的对称性可和.
按以上分位数的定义,可能会出现出分位数不唯一或不存在的情况,这时分位数的定义需作技术处理,但我们常用的分布的分位数是存在的且是唯一的.
的分位数叫做中位数. 的分位数叫做第一四分位数;的分位数叫做第三四分位数;中位数也称为第二四分位数.
偏度系数、峰度系数.
偏度系数:
它实际上的标准化随机变量的3阶矩,即
偏度系数描述分布偏离对称性程度的一个特征数.当的概率密度函数关于其期望对称时,偏度.当偏度系数时,该分布称为偏态分布,偏态分布常有不对称的两个尾部,重尾在右侧时必导致,故称为右偏分布;重尾在左侧时必导致,故称为左偏分布.
峰度系数:
易见
峰度系数描述分布尖峭程度或尾部粗细的一个特征数.当服从正态分布时,其峰度.而当时,表示该随机变量的标准化随机变量的分布比标准正态分布更尖峭和(或)尾部更粗(厚).比如金融数据中的对数收益率的峰度很大,常说对数收益率具有“尖峰厚尾性”.
偏度和峰度都是描述分布形状的特征数.它们的设置都是以正态分布为基准.对于正态分布,其偏度和峰度都是零.
多维随机变量的期望与方差
设为维随机变量,的期望是一个维实向量
.的协方差矩阵是一个阶对称矩阵.的协方差矩阵也称为的方差,记为,即
容易证明随机向量的协方差矩阵是半正定的。
关于随机向量的期望、方差有以下运算性质。
设为的实矩阵,为维实向量,为维随机变量.令,则为维随机变量,其期望和方差分别为
下面介绍求随机变量函数的期望、方差的近似方法,这种方法常称为方法.
在很多应用中,仅仅知道随机变量的前两阶矩(也许是利用样本数据得到的估计),完整的概率分布并不知道.而我们可能对的函数的前两阶矩感兴趣(这里函数是已知函数).当是线性函数时,由的期望、方差可以得到的期望、方差.而在不是线性函数时我们无法计算出的期望、方差,此时我们希望能近似地计算的期望、方差.
利用泰勒公式
于是我们得
当然,这种近似计算是否合适以及近似的精度如何是需要条件的,在此我们不去讨论了.这种近似方法可推广至多个随机变量的函数的情形.
§0.2 常用分布族
在概率论中,我们已经学过一些常用分布:两点分布,二项分布,泊松分布,均匀分布,指数分布,一维正态分布.此处不去重复了。本节我们先简单地介绍一下多维正态分布,然后介绍数理统计中常用的其他一些分布:超几何分布族,几何分布族,负二项分布族,伽马分布族,贝塔分布族,以及由正态分布导出的三大分布:分布,分布,分布.
1.多维正态分布.
若维随机向量的特征函数为
其中,为维实向量,为阶半正定矩阵,则称服从维正态分布.记为~.
关于正态分布有如下讨论.
(1)这里并没有要求满秩,若满秩,则称为非奇异正态分布;若不满秩,则称为奇异正态分布.
(2)若~,则.
(3)若~,则相互独立的充要条件是它们两两不相关,即为对角阵.
(4) 若~,设,则
~.
特别地的任意边缘分布都是正态分布.
(5) ~对,且,有~.
2.超几何分布族
考虑概率模型:某个总体由个元素组成,其中有个元素属于某一类(记为A类)个元素,取出的元素中属于类元素的个数记为,那么的概率质量函数为
我们称这种分布为超几何分布,记为~.
关于超几何分布有以下讨论:
(1)若~,则
,,
(2)如果把“不放回”改为“放回”,则~,其中.
(3)当时,超几何分布近似于二项分布.
3.多项分布族
多项分布是很重要的离散分布,当一个总体按某种属性分成有限类时就会涉及这个分布.它产生于以下的次独立重复试验模型.
每次试验可能的结果有种:,并且.
上述试验独立地重复次,所得结果可用某些组成的长为的序列表示.
在上述次独立重复试验中,以表示结果出现的次数(),则维向量的概率质量函数(即分布列)为
,,.
这种分布称为项分布,记为.当时,它就是二项分布.
关于多项分布有以下讨论:
(1)多项分布的边际分布仍是多项分布.
(2)由于,因此下面分布也称为项分布
,,诸.
4.Gamma分布族
若随机变量的概率密度函数为
其中为两个正参数,称为形状参数,
文档评论(0)