- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用统计学-经管类-第9章简单相关与一元线性回归分析.ppt
* * * * * * * 7-* 几种常见的非线性模型 ? 对数函数 线性化方法 x= lgx , 则有y = ? + ? x 基本形式: 图像 ? ? 0 ? 0 7-* 几种常见的非线性模型 ? S 型曲线 线性化方法 令:y = 1/y,x= e-x, 则有y = ? + ? x 基本形式: 图像 7-* 非线性回归(实例) 【例】为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。 废品率与生产率的关系 生产率(周/单位) x 1000 2000 3000 3500 4000 4500 5000 废品率(%) y 5.2 6.5 6.8 8.1 10.2 10.3 13.0 7-* 非线性回归(实例) 生产率与废品率的散点图 7-* 非线性回归(实例) 用线性模型:y =?0??1x+? ,有 y = 2.671+0.0018x 用指数模型:y = ?? x ,有 y =4.05?(1.0002)x 比较 直线的残差平方和=5.3371指数模型的残差平方和=6.11。直线模型略好于指数模型 7-* 结 束 * * * * * 139 * * * 24 This teleology is based on the number of explanatory variables nature of relationship between X Y. * * * * * * * * * * * * * * * * * * 7-* 总离差平方和的分解 因变量 y 的取值是不同的,y 取值的这种波动称为总离差。总离差来源于两个方面: 由于自变量 x 的取值不同造成的; 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响。 对一个具体的观测值来说,总离差的大小可以通过该实际观测值与其样本均值之差 来表示—如果假定X对Y没有影响,Y的最好预测是 —你评价一个学校的教学水平? 7-* 总离差平方的分解(图示) x y y { } } ? 离差分解图 7-* 2. 两端平方后求和有 从图上看有 SST = SSR + SSE 总变差平方和 (SST) { 回归平方和 (SSR) { 残差平方和 (SSE) { 拟合的回归曲线不能解释的部分 由拟合的回归曲线解释的部分 7-* 离差平方和的分解 (三个平方和的意义) 总离差平方和(SST) 反映因变量的 n 个观察值与其样本均值的总离差 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和。 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和。 7-* 决定系数 (判定系数 R2) 回归平方和占总离差平方和的比例: 反映回归直线的拟合程度 取值范围在 [ 0 , 1 ] 之间 R2 ?1,即SSR在SST中的比例越大,说明回归方程拟合的越好----样本观测值越紧密围绕在样本回归线附近 R2?0,说明回归方程拟合的越差 7-* 总离差平方的分解 x y y { } } ? 离差分解图 (三)显著性检验 所谓回归系数的显著性检验,就是根据样本估计的结果对总体回归系数的有关假设进行检验。 下面我们以? 2的检验为例,介绍回归系数显著性检验的基本步骤: 1. t检验 (1)提出假设。对回归系数进行显著性检验,所提出的假设的一般形式是: 式中,H0表示原假设; H1表示备择假设; 是假设的总体回归系数的真值。在许多回归分析的计算机程序里,常常令 =0。这是因为?2是否为0,可以表明X对Y是否有显著的影响。 (2)确定显著水平? 。显著水平的大小应根据犯哪一类错误可能带来损失的大小确定。一般情况下可取0.05。 (3)计算回归系数的t值。 (4)确定临界值。 t检验的临界值是由显著水平和自由度决定的。 这时应该注意,原假设和备择假设设定的方式不同,据以判断的接受域和拒绝域也不相同。对此,在双侧检验的场合,依据?和df,查t分布表所确定的临界值是(-t? /2)和( t? /2 );而在单侧检验的场合,所确定的临界值是( t? )。 (5)做出判断。 如果 的绝对值大于临界值的绝对值,就拒绝原假设,接受备择假设;反之,如果 的绝对值小于临界值的绝对值,则接受原假设。 2.p检验 回归系数的显著性检验还可以采用p检验。其前三步与t检验相同,但t值计算出来之后,并不与t分布的临界值进行对比,而是直接计算自由度为n-2的t统计量大于或小于根据样本观测值计算的 的概率即p值。然后将其与给定的显著水平
文档评论(0)