网站大量收购独家精品文档,联系QQ:2885784924

概率统计模型讲座2012.ppt

  1. 1、本文档共91页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
概率统计模型讲座2012

概率统计模型讲座 主讲:吕 佳 数学与计算机科学学院 一、电梯问题 二、聪明的保险公司 人寿保险问题的数学模型 关于中心极限定理 在客观实际中有这样一种随机变量,它们是由大量的相互独立的随机因素的综合影响所形成的。而其中每一个别因素在总的影响中所起的作用都是微小的。这种随机变量往往近似地服从正态分布,这种现象就是中心极限定理的客观背景。 关于中心极限定理 正态分布在随机变量的各种分布中,占有特别重要的地位.在某些条件下,即使原来并不服从正态分布的一些独立的随机变量,它们的和的分布,当随机变量的个数无限增加时,也是趋于正态分布的. 在概率论里,把研究在什么条件下,大量独立随机变量和的分布以正态分布为极限这一类定理称为中心极限定理. 关于中心极限定理 关于中心极限定理 关于中心极限定理 三、社会收入分配公平吗? 洛伦兹曲线 洛伦兹曲线 基尼(Gini)系数 评价 四、生命线越长寿命越长? 生命线越长寿命越长? 生命线越长寿命越长? 生命线越长寿命越长? 生命线越长寿命越长? 相关分析和回归分析 相关分析和回归分析 具有相关关系的变量虽然不具有确定的函数关系,但是可以借助函数关系来表示它们之间的统计规律。这种近似地表示它们之间的相关关系的函数被称为回归函数。 最简单的情形是由两个变量形成的关系。考虑用下列模型表示: 但是由于两个变量之间不存在确定的函数关系,因此,必须把随即波动考虑进去,故引入模型如下: 相关分析和回归分析 回归分析就是根据已得的试验结果以及以往的经验来建立统计模型,并研究变量间的相关关系,建立起变量之间的近似表达式,并由此对相应的变量进行预测和控制。 相关分析和回归分析 五、你身体的血液总量有多少? 湖中有多少条鱼? 数学解释 数学解释 数学解释 敏感问题的概念 敏感问题(sensitive problem)是指涉及个人(或单位)的隐私或利益的问题,以及大多数人认为不便在公开场合表态或陈述的问题,在某些情况下,还包括一些违法或犯罪的行为。 例如:在统计学研究中,经常会遇到一些不受被调查者欢迎、或感到尴尬的所谓敏感问题:如一群人中参加赌博的比率?吸毒人的比率?经营中偷税漏税人的比率?学生中考试作弊的人的比率?婚前有无性行为?推销药品是否给回扣?各种类型的额外消费、公款吃喝、同性恋及类似的为社会所不赞成的各种事件等问题。 敏感问题的分类 敏感问题的分类 按答案特征可分两大类 属性特征敏感问题 也称分类特征敏感问题,它被用于了解被调查者是否具有敏感问题的特征,并估计具有敏感问题特征的人在总体中所占比重,例如是否有吸毒行为?是否有婚外情? 数量特征敏感问题 数量敏感问题是指被调查者具有敏感问题数额大小的特征,一般是估计敏感问题数值的均数,也可称为敏感性均值问题,例如“你有几个婚外性伴侣?”“你每月的工资外收入有多少?” 七、概率论与数理统计的应用综述 1、参数估计方法 2、假设检验方法 3、相关分析方法 4、回归分析方法 5、方差分析方法 6、随机过程应用 假设检验 方差分析 相关软件 MATLAB EXCEL 参考书推荐 《数学模型》姜启源 《数学建模方法及其应用》韩中庚 《概率论与数理统计教程》茆诗松 《概率论与数理统计教程》魏宗舒 随机抽取了100名大学生,所用随机化装置为一装有60个卡片的盒子。盒子中有45张卡片上写有问题 “在上一个月你是否至少饮酒1250毫升?”(问题 A),剩余的15张卡片上写有问题“在上一个月内你是否饮酒少于1250毫升?” 调查时,在没有调查员观察的情况下,被调查者把盒子中的卡片摇匀后从中随机抽取一张,而后根据所抽到的卡片上的问题如实地回答“是”或“不是”。调查结果为:有28个人回答了“是”,72个人回答“不是”。 写有敏感问题A的卡片占全部卡片的比例为 p=0.75, 回答“是”的人数占总人数的比例 =n1/n=0.28 有:n=100,n1=28,p=0.75,因此有: =0.008145 =[0.28-0.25]/0.5=0.06 这样应用第一种统计方法估计对问题一回答“是”的比例为:6%。标准差的估计值为: 即0.09。 也即有6%的人是酗酒者。根据 沃纳的方法虽然比直接提出敏感性问题要好,但所提的两个问题都还具有敏感性。而且,该方法中回答A的人数比例不能为1/2。1967年西蒙斯对沃纳模型进行了改进。 西蒙斯模型(Simmons model) 他所建立的模型与沃纳模型最大的不同点:在于调查人员提出的随机化

您可能关注的文档

文档评论(0)

kabudou + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档