1 一元多元虚拟回归.docVIP

下载本文档

10
0
约6.1千字
约 12页
2016-04-01 发布于湖北
举报
版权申诉

1 一元多元虚拟回归.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

1 一元多元虚拟回归.doc

一元回归+ 多元回归+ 逐步回归+ 非线性回归+ 曲线拟合无论是自然现象还是社会经济现象，变量的关系分为两类，一类是确定的函数关系（利率、本金、本息），用函数表示；一类是不确定的统计相关关系不确定（农作物的施肥量与产量，产量是不确定的，随机的，他们之间有相关关系，同时也具有因果关系），对于这样的变量我们通过回归分析来研究。一、一元模型的建立个体的随机性太强，所以我们研究问题总想研究总体，研究总体的平均情况。但是对于总体数据又无法完全取得（成本、能力的限制），所以我们只能去抽取一个样本，通过这个样本近似的来代替总体，获得总体的信息，所以我们想建立的真实模型是的含义：解释变量每变化一个单位时，被解释变量的平均变化数量。对于单个个体我们有用我们获得的一个样本近似的拟合总体有对单个个体有二、一元模型的估计三、经典假设想知道和离他们的真实值有多接近，或者说与其期望值多接近。需要有确定的模型的函数形式，还要对的产生方式做出某些假定。，它表明依赖于和。因此，除非我们明确和是怎样产生的，否则我们将无法对做出任何统计推断，而且我们也无法对和做出任何统计推断。假设1 解释变量是确定性变量假定2 随机干扰项具有零均值，同方差及不序列相关性只有假设都满足了，普通最小二乘法获得的估计量才是BLUE，是线性的、无偏的、有效的四、区间估计假设我们想知道究竟，比方说离有多“近”。为了这个目的，我们试求两个正数和，位于0和1之间，使得随机区间包含的概率为。用符号表示（*）这样的一个区间如果存在的话，就称之为置信区间，称为置信系数，称为显著性水平。五、检验 1、变量的显著性如果变量是显著的，那么参数应该显著的不为0， 1）原假设与备择假设分别为构造统计量 2）给定显著性水平，查询分布表，得到一个临界值 3）从现有样本中算出（5）式的值， 4）如果发生了，为原假设下的一个小概率事件，则在的置信度下拒绝原假设，即变量是显著的，通过了变量显著性检验。如果未发生，则在的置信度下不拒绝原假设，即变量是不显著的。未通过变量显著性检验。回到区间估计针对上面介绍的参数的区间估计，我们说关键是找到和对应的，现在我们学习完了变量的显著性检验时，我们知道有并且给定显著性水平，则有（6）于是我们可以得到的置信度下的置信区间是由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度，因此置信区间越小越好。要缩小置信区间，需（1）增大样本容量，因为在同样的置信水平下，越大，一定，则分布表中的临界值越小。（2）提高模型的拟合优度，因为样本参数估计量的标准差与残差平方和呈正比，模型拟合优度越高，残差平方和应越小。因为，而思考：若通过样本得到了一个置信区间，如何解释？答：给定置信系数95%，从长远看，在类似于的每100个区间中，将有95个包含着真实的的值；但这个特殊的固定区间含有真实的的概率不是1就是0。 2、拟合优度检验我们要说出这条样本回归线对数据拟合的有多么好。一般的情形是总有一些正的或负的残差。我们所希望的仅是这些围绕着回归线的残差尽可能小。记（total sum of squares），称为总离差平方和，反映样本观测值总体离差的大小；（explained sum of squares），称为回归平方和，反映有模型中解释变量所解释的那部分离差的大小（residual sum of squares），称为残差平方和，反映样本观测值与估计值偏离的大小，也是模型中解释变量未解释的那部分离差的大小。可决系数统计量，越接近于1越好拟合优度也是所有解释变量整体的解释能力的度量六、软件实现（1yuan.xls）+学习界面 S.E. of regression 回归的标准误，对估计误差大小的总体度量 Durbin-Watson stat 度量随机误差项是否存在序列相关的 Mean dependent var S.D. dependent var 回归分析结果的报告经过模型的估计、检验，得到一系列重要的数据，为了简明、清晰、规范的表述这些数据，计量经济学通常采用以下规范化的方式：每一行依次为：1估计的样本回归函数；2标准误差SE；3 估计的t统计量；4可决系数和自由度；5F统计量 DW统计量七、预测的软件实现一、总体条件均值预测值的置信区间基本思想：由于存在抽样波动，预测的不一定等于真实总体条件均值，还需要对做区间估计。对做区间预测，必须确定总体条件均值的抽样分布，必须找出与和都有关的统计量具体做法：从的分布分析给定，我们要预测，若我们已有历史上的回归，我们将得到这个条件均值预测值的点估计值，即，可以证明这个点预测量是一个最优线性