- 13
- 0
- 约 15页
- 2015-08-07 发布于湖北
- 举报
STA第和章翻译-统计班-曹佳星.doc
STA333 第25章
回归和分类树 (第1部分)
25.1 说明
当我们运用回归分析时, 其中一个主要目的是决定因变量Y与自变量X存在什么样的关系. 然而在练习中, 我们并不局限于只是考虑一个自变量: 通过使用许多自变量 (X1, X2, …, Xk) 去确定因变量Y的价值的概念在数据分析中广泛的运用。
举个例子,考虑下列情形:
? 你患上心脏病的风险也许同时受很多潜在因素的影响: 你的体重, 你是否有心脏病的家族遗传史, 是否有糖尿病, 运动的时间,你的血压, 等等.
? 汽车的汽油英里数受到很多方面的影响: 汽车的重量,发动机有多少气缸, 汽车外形是否符合空气动力学, 等等.
?一个邮件过滤器能识别出一封收到的邮件是否是垃圾邮件也许与许多潜在因素有关: 例如. 主要信件的文字总长,金钱这个词在信件中出现的频率, 在信件中出现“XXX” 的特征, 等等.
在实际中,标准数据分析工具用于这样的问题就是多元回归. 在多元回归中,我们试图运用一些规定的数学函数将因变量Y与自变量联系起来。
Y = 0 + 1X1 + 2X2 + … + kXk +
被估计的参数β和过去经常发生预测的Y 并且去决定哪一个变量对Y最具影响. 明显地, 这是一种参数方法推理关于Y取决于参数β的估计值和回归误差的假定。
描述潜在自变量如何影响
原创力文档

文档评论(0)