建筑数学–概率4–参数估计与回归分析166607806.pptVIP

下载本文档

2
0
约4.09千字
约 35页
2017-05-13 发布于四川
举报
版权申诉

建筑数学–概率4–参数估计与回归分析166607806.ppt

1、本文档共35页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

建筑数学–概率4–参数估计与回归分析166607806

整理得到：由第3式，得：代入第1，2式，消去β0得：其中：解得：例1：某公司的商品在15地区销量y和人口数x1、户均总收入x2资料见表。试求销量对人口数、户均总收入的回归方程。按计算公式所求回归方程：西安机场航空客运量与国民生产的总值和旅游游客量二元回归。根据1980-1994年陕西省的GNP（X1）和旅游游客量（X2）的数据，与西安机场年旅客吞吐量（y），作二元回归，得到回归方程。再了解了陕西省人大制定的十年经济发展计划和旅游事业规划的数据，预测未来10年的航空客运量。年旅客吞吐量 y 与GNP指数x1和旅游游客量指数x2的二元回归方程：根据1980~1993年的实际数据（样本数据），求算回归系数：β0 β1 β2 上述二元相关分析的航空客运量的实际值与计算值和预测值如下表所列：得到二元的回归方程其中X1是GNP指数，X2是旅客量指数。复相关系数 r = 0.981 1994年做10年预测，用四种方法预测后取整：2005年西安机场旅客年吞吐量预测值是800万。现在2005年已经过去，西安机场2005年实际的旅客年吞吐量是：794万。谢谢 LOGO 清华大学建筑学院参数估计与回归分析参数估计对于许多要研究的对象（总体）不可能“穷尽”地一一调查测量，只能随机地抽取一部分“样本”，根据样本的数据来估计总体的“真值”。有的情况是知道（分析出）随机变量的分布形态：泊松分布，正态分布等，如何根据样本数据，“估计”出该分布的参数，如泊松分布的λ，正态分布的μ和σ 例：设某炸药厂一天中发生着火现象的次数X服从对于泊松分布，只有一个参数λ要估计。λ的估计值就是样本平均数：验证一下： k=0 样本计算 p=75/250=0.3；公式计算：0.295 k=1 样本计算 p=90/250=0.36；公式计算：0.360 k=2 样本计算 p=54/250=0.216；公式计算：0.220 k=3 样本计算 p=22/250=0.088；公式计算：0.089 e－λ = e－1.22 = 0.29523 对于正态分布，有两个参数μ和σ要估计。μ的估计值就是样本平均数，σ的估计值就是样本方差的平方根：这在讲概率分布时已经提到。对于二项分布有一个参数 p 要估计： p 的估计值就是样本平均数： “十年一遇”，就是根据历史记录，发生该现象的统计平均是 p = 0.1 区间估计上面讨论的参数估计，是用样本的数值来估计总体的参数。但是，每一次样本试验得到的参数估计值是不同的。例如我们可以认定某个年龄段（10岁）儿童（男童或女童）的身高（作为总体）满足正态分布，参数均值μ的估计值可以通过100名儿童身高的测量值的平均数得到。但再测量100名儿童，可能得到不同的值。多次做100名儿童身高的测量得到的值尽管各不相同，但都处于某个区间范围之内，把这些值加以平均的到的值（例如6次测量，共600名儿童平均）是否更“可信”一些？比做3次测量是否更可信一些，即“置信度”更高？还有一个问题：对不同的总体（或不同的组分，如男童和女童分开），抽样得到样本值离散性可能不同，即计算出的方差σ不同，有的组分（男童）样本值之间差异小（σ小），有的组分（女童）样本值之间差异大（σ大）。那么试验次数相同下，得到均值μ的估计值的“可信度”一样吗？方差σ大（离散性大）的组分试验的次数（样本的数量）是否应当多一些呢？这就要引入统计数据处理的“区间估计”。通常，采用95%的置信度，有时也取99%或90% 均值的区间估计已知方差，估计均值推得，随机区间：在正态分布表中，置信度90%，即α=0.10 ， λ= 1.65 置信度95%，即 α=0.05 ，λ= 1.96 置信度99%，即 α=0.01 ，λ= 2.58 可以看出区间的大小 2× 与λ成正比，即与置信度有关；与σ成正比，即与样本离散性有关，离散度越小，样本平均数越接近真值。与样本数成反比。置信度要求确定，样本离散度一定，样本数越多，区间越小，样本平均数越接近真值。或