数理统计第零章课程.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
预备知识 §0.1 随机变量的概率分布和数字特征 用以描述随机变量的概率分布的工具有分布函数、概率密度函数和分布列.这些知识都已在概率论中学过了阶原点矩: 阶中心矩: 变异系数: ,其中是取正值的随机变量。 分位数、中位数 设随机变量的分布函数为.给定,称满足 的数为的下分位数.称满足的数为的上分位数. 本课程中均使用下分位数,并把下分位数简称为分位数.易见分位数完全取于的分布,故分位数常叫做某某分布的分位数,比如标准正态的分位数,标准正态分布的分位数记为,即满足,由标准正态的对称性可和. 按以上分位数的定义,可能会出现出分位数不唯一或不存在的情况,这时分位数的定义需作技术处理,但我们常用的分布的分位数是存在的且是唯一的. 的分位数叫做中位数. 的分位数叫做第一四分位数;的分位数叫做第三四分位数;中位数也称为第二四分位数. 偏度系数、峰度系数. 偏度系数: 它实际上的标准化随机变量的3阶矩,即 偏度系数描述分布偏离对称性程度的一个特征数.当的概率密度函数关于其期望对称时,偏度.当偏度系数时,该分布称为偏态分布,偏态分布常有不对称的两个尾部,重尾在右侧时必导致,故称为右偏分布;重尾在左侧时必导致,故称为左偏分布. 峰度系数: 易见 峰度系数描述分布尖峭程度或尾部粗细的一个特征数.当服从正态分布时,其峰度.而当时,表示该随机变量的标准化随机变量的分布比标准正态分布更尖峭和(或)尾部更粗(厚).比如金融数据中的对数收益率的峰度很大,常说对数收益率具有“尖峰厚尾性”. 偏度和峰度都是描述分布形状的特征数.它们的设置都是以正态分布为基准.对于正态分布,其偏度和峰度都是零. 多维随机变量的期望与方差 设为维随机变量,的期望是一个维实向量 .的协方差矩阵是一个阶对称矩阵.的协方差矩阵也称为的方差,记为,即 容易证明随机向量的协方差矩阵是半正定的。 关于随机向量的期望、方差有以下运算性质。 设为的实矩阵,为维实向量,为维随机变量.令,则为维随机变量,其期望和方差分别为 下面介绍求随机变量函数的期望、方差的近似方法,这种方法常称为方法. 在很多应用中,仅仅知道随机变量的前两阶矩(也许是利用样本数据得到的估计),完整的概率分布并不知道.而我们可能对的函数的前两阶矩感兴趣(这里函数是已知函数).当是线性函数时,由的期望、方差可以得到的期望、方差.而在不是线性函数时我们无法计算出的期望、方差,此时我们希望能近似地计算的期望、方差. 利用泰勒公式 于是我们得 当然,这种近似计算是否合适以及近似的精度如何是需要条件的,在此我们不去讨论了.这种近似方法可推广至多个随机变量的函数的情形. §0.2 常用分布族 在概率论中,我们已经学过一些常用分布:两点分布,二项分布,泊松分布,均匀分布,指数分布,一维正态分布.此处不去重复了。本节我们先简单地介绍一下多维正态分布,然后介绍数理统计中常用的其他一些分布:超几何分布族,几何分布族,负二项分布族,伽马分布族,贝塔分布族,以及由正态分布导出的三大分布:分布,分布,分布. 1.多维正态分布. 若维随机向量的特征函数为 其中,为维实向量,为阶半正定矩阵,则称服从维正态分布.记为~. 关于正态分布有如下讨论. (1)这里并没有要求满秩,若满秩,则称为非奇异正态分布;若不满秩,则称为奇异正态分布. (2)若~,则. (3)若~,则相互独立的充要条件是它们两两不相关,即为对角阵. (4) 若~,设,则 ~. 特别地的任意边缘分布都是正态分布. (5) ~对,且,有~. 2.超几何分布族 考虑概率模型:某个总体由个元素组成,其中有个元素属于某一类(记为A类)个元素,取出的元素中属于类元素的个数记为,那么的概率质量函数为 我们称这种分布为超几何分布,记为~. 关于超几何分布有以下讨论: (1)若~,则 ,, (2)如果把“不放回”改为“放回”,则~,其中. (3)当时,超几何分布近似于二项分布. 3.多项分布族 多项分布是很重要的离散分布,当一个总体按某种属性分成有限类时就会涉及这个分布.它产生于以下的次独立重复试验模型. 每次试验可能的结果有种:,并且. 上述试验独立地重复次,所得结果可用某些组成的长为的序列表示. 在上述次独立重复试验中,以表示结果出现的次数(),则维向量的概率质量函数(即分布列)为 ,,. 这种分布称为项分布,记为.当时,它就是二项分布. 关于多项分布有以下讨论: (1)多项分布的边际分布仍是多项分布. (2)由于,因此下面分布也称为项分布 ,,诸. 4.Gamma分布族 若随机变量的概率密度函数为 其中为两个正参数,称为形状参数,

文档评论(0)

贪玩蓝月 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档