- 3
- 0
- 约3.32千字
- 约 4页
- 2017-04-10 发布于湖南
- 举报
分散共分散と相関係数
重回帰分析
? 回帰分析では単一の説明変数(独立変数)を用いて単一の目的変数(従属変数)を予測することを考えた。
? 重回帰分析では複数の説明変数を用いて単一の目的変数を予測することを考える。また、個々の説明変数が目的変数に対してどの程度影響を与えているかを表すこともできる。
データの例(寿命と医療費?たんぱく質摂取量)
年度
平均寿命
医療費の割合
たんぱく質摂取量
Y
X1
X2
1955
65.70
3.27
69.70
1960
67.80
3.06
69.70
1965
70.30
4.22
71.30
1970
72.00
4.10
77.60
1975
74.30
5.26
81.00
1980
76.20
6.18
78.70
平均
71.05
4.35
74.67
標準偏差
3.60
1.09
4.58
回帰分析で何がわかるか?
? 『平均寿命に対して、医療費とたんぱく質摂取量は何らかの効果を持っている』というモデルは有効であるか?
? もしモデルが有効であるなら、平均寿命に対して、医療費とたんぱく質の摂取量はどのような効果を、どれくらい持っているか? またそれらの効果は“統計的に有意である”か?
? 重回帰分析では次のような重回帰式を前提にして考える。
? ここでを偏回帰係数(partial regression coefficient)と呼ぶ。また、この例のように各変数の単位が異なる場合には、それぞれの変数を標準化(平均を0に、分散を1に)して求めた標準偏回帰係数を計算する。
? したがって、医療費の方がたんぱく質摂取量に比べて平均寿命に及ぼす影響が大きいといえる。
回帰分析の結果の要約(統計パッケージの出力例)
従属変数 : LIFE
R= R^2= 調整済R^2= β
標準誤差β
B
標準誤差B
t(3)
p-値
切片
39.29043
11.56307
3.397924
.042526
MED
.627072
.242962
2.07682
.80467
2.580942
.081713
PROT
.387017
.242962
.30440
.19110
1.592909
.209429
F(2,3)=25.025 p.01345 推定値の標準誤差: 1.2105
? Rは重相関係数(multiple correlation)と呼ばれ、観測値と予測値の相関係数のこと。
? R2は決定係数と呼ばれ、重相関係数の2乗であるが観測値と予測値、残差(観測値から予測値をひいたもの)のそれぞれの平方和には次のような関係が成り立つ。
? もし予測値が観測値に非常に近ければ残差平方和はゼロに近づくので次のようにをで割ったものが1近いほど“よい予測値”ということになる。そこで、この比を決定係数と名付け“あてはまりの良さ”の指標とする。
観測値?予測値と残差
観測値
予測値
残差
標準化予測値
標準化残差
1
65.70000
67.29862
-1.59863
-.97951
-1.32062
2
67.80000
66.86250
.93751
-1.09338
.77447
3
70.30000
69.75864
.54136
-.33718
.44721
4
72.00000
71.42718
.57282
.09848
.47321
5
74.30000
74.87126
-.57126
.99776
-.47191
6
76.20000
76.08180
.11819
1.31384
.09764
最小
65.70000
66.86250
-1.59863
-1.09338
-1.32062
最大
76.20000
76.08180
.93751
1.31384
.77447
平均
71.05000
71.05000
-.00000
.00000
-.00000
中央値
71.15000
70.59291
.32978
-.11935
.27243
決定係数と自由度調整済み決定係数
? 決定係数は“あてはまりの良さ”を示す値であるが、説明変数を増やすと単純に増加してゆくという性質を持っている。
? したがって“役に立たない説明変数”であっても、付け加えることにより、名目上の“予測の精度”はどんどんと上昇する。
? これでは役に立たないので、標本数や説明変数の数を考慮にいれた決定係数をもちいる。これが“自由度調整済み決定係数”である。
? 自由度調整済み決定係数()と決定係数()の間には次のような関係がある。
ただし、Nは標本数、pは説明変数の数
データ例(“役に立たない変数:乱数
您可能关注的文档
- 第1章序-saitolab.meijo.doc
- 地球物理与石油资源学院2004~2008年学术讲座一览表.doc
- 第5回火山都市国際会議報告-eri.u.doc
- 第6章機率論.doc
- 第6章演示文稿制作软件powerpoint2000.doc
- 第10章钻孔与灌浆工程施工.doc
- 第19号様式(第28条関係).doc
- 第22回島根県レディース卓球大会開催要項.doc
- 第42回触媒フォーラム.doc
- 第44号様式(第40条第1項).doc
- 2026年及未来5年内中国液体氩气行业投资前景及策略咨询研究报告.docx
- 2026年及未来5年内中国黄铜合页行业投资前景及策略咨询研究报告.docx
- 2026年及未来5年内中国竹工艺家具行业投资前景及策略咨询研究报告.docx
- 2025年中国微机数显自动分析仪市场调查研究报告.docx
- 2026年及未来5年内中国微尘白色粉笔行业投资前景及策略咨询研究报告.docx
- 2025年中国微电脑型压胶机市场调查研究报告.docx
- 2026年及未来5年内中国数字化等功游泳训练测试系统行业投资前景及策略咨询研究报告.docx
- 2025年中国圆形花瓶市场调查研究报告.docx
- 2026年及未来5年内中国植物纤维静淀过滤器行业投资前景及策略咨询研究报告.docx
- 2025年中国超音波手套机市场调查研究报告.docx
最近下载
- 平潭澳海上风电场项目可研收口报告2018年4月版本15工程设计概算表.pdf VIP
- 2024年常州信息职业技术学院单招职业技能测试题库(历年真题).docx VIP
- 腹膜透析指南(2025年版).docx VIP
- 党的二十届四中全会PPT课件.ppt VIP
- 产品设计与实训 设计实训.ppt VIP
- 施工现场建筑垃圾减量化专项方案.pdf VIP
- 《数学史》数学的起源.pptx VIP
- 2026年信息科技课标试题及答案.doc VIP
- 本科课件-ArcGIS Engine地理信息系统开发教程(完整).ppt
- 北京通州区2022-2023学年高一下学期期末质量检测英语试卷 含解析.docx VIP
原创力文档

文档评论(0)