- 8
- 0
- 约3.72千字
- 约 69页
- 2019-08-19 发布于辽宁
- 举报
9.2.3 显著性检验 由式(9.2.7)知,不管Y与X是否有线性相关关系,只要给定一组不完全相同的数据(x i,y i) (i=1,2,…,n)就能得到一条经验回归直线。 显然,如果Y与X之间不存在线性相关关系,那么寻找的经验回归直线就失去了实际意义。因此, 使用经验回归直线前需要对Y与X之间的线性相关关系、经验回归直线拟合效果进行检验。通常的方法是首先根据专业知识和散点图做出粗略的判断,然后根据抽样信息进行假设检验。 * 从一元线性回归模型可见,当|β1|值越大,Y随X的变化的趋势就越明显;反之, 若|β1|值越小,Y随X的变化就越不明显。 特别是,当β1=0时,则表明无论X如何变化Y的值都不受影响,因而Y与X之间不存在线性相关关系。当|β1|≠0时,则认为Y与X之间有线性相关关系。 * 1.F检验法 检验统计量为: * * 2.T检验法 检验统计量为: 3.r检验法 检验统计量为: * * 9.2.4 预测与控制 预测与控制是回归分析的重要应用之一,当然前提必须是经验回归方程先通过回归显著性检验。所谓预测,就是当给定X=x时,估计相应的Y的取值或取值范围。所谓控制,是指要使Y落在某个指定区间内,应该如何控制X的取值。 * 1.预测 预测可分为点预测和区间预测。点预测指对给定的X=x0,预测对应的随机变量Y0的值 * 图9.2.2 预测区间示意图 * Y0的预测区间具有如下的特点,即在一定的置信度下,x0越接近x,其预测区间越小,预测精度越高;反之,x0离x越远,其预测区间越大,预测精度越低,预测区间形状呈喇叭形。 * 图9.2.3 预测区间示意图 * 2.控制 控制问题指:若要使Y=β0+β1x+ε的取值以1-α的概率落在指定的区间(y1,y2)内,自变量x应控制在什么范围, 即求出自变量x的取值区间(x1,x2),使得对应的因变量Y以1-α的概率落在(y1,y2)内。事实上这是预测问题的反问题。 * * 图9.2.4 对x的控制图(β 10) * 图9.2.5 对x的控制图(β 10) * 例9.2.3 为研究家庭收入与家庭食品支出的关系,随机抽取了10个家庭,得到表9.2.2的数据。试根据这些数据: (1)建立家庭食品支出对家庭收入的经验回归方程; (2)检验回归模型;(α=0.05) (3)试确定当家庭收入为4 200元时,家庭的食品支出及其置信度为95%的预测区间。 * 图9.2.6 家庭收入X与食品支出Y的散点图 * * 9.3 一元非线性回归 前面讨论了线性回归模型。在实际问题中,变量之间的关系往往是比较复杂的非线性相关关系,对这类问题不能直接应用线性回归模型。比如,散点图不呈现直线趋势而是曲线趋势,这时,应该考虑采用曲线拟合模型,即非线性回归模型。 * 首先,根据散点图的趋势,选择适当的非线性函数(曲线)形式。常见的非线性函数有幂函数、指数函数、对数函数、有理函数等,以及它们的复合函数,这些函数的绝大部分可以通过适当的变量变换将其转化为线性函数形式。下面表9.3.1列举了常见的非线性回归模型中的曲线函数及图形和线性化方法,在一些数学和工程手册上可找到更多的曲线回归函数。 * 出版社 理工分社 概率论与数理统计 第9章 回归分析 变量间的关系一般可分为两类,一类是确定性关系,另一类是不确定性关系。确定性关系是指变量之间的关系可以用函数关系来表达。另一种非确定性关系的特点是: 当一个或几个变量的值给定时,相应的另一个变量的值不能完全确定,而是在一定范围内变化,则称变量之间的这种关系为不确定性关系或相关关系。 * 譬如,人的身高与体重间的关系,一般来说,人高一些,体重就重一些,但同样高度的人,体重往往不相同,因此,称人的身高与体重之间的这种关系为相关关系。又如,人的血压与年龄也存在相关关系。回归分析正是研究相关关系的一种常用的统计方法。 * 9.1 回归分析的基本概念 “回归”的概念是英国生物学家Galton在研究生物遗传现象时提出的。他当时研究这样一个问题:高个子的人生的子女一般偏高,照这样看,各代人在身高分布上将有两极分化的趋势,个子很高和很矮的会愈来愈多,而处在中间状态的会愈来愈少。但现实却是各代人的身高分布基本保持稳定。 * 如何解释这个现象?Galton收集了1 074对夫妇,以每对夫妇的平均身高作为x,而取他们的一个成年子女的身高作为y,将收集的数据绘成散点图,发现趋势近乎一条直线。建立了下列关系式 (y-173.36)=0.8(x-173.36) * 其中,x,y分别表示父母的平均
原创力文档

文档评论(0)