統計ソフトウェアの活用

活用 9-1 | キーワード:回帰分析の出力・分散分析表・p値・t値・自由度調整済みR²

学習目標

統計ソフトウェア(R・SPSS等)の出力を正確に読み取り、回帰分析・分散分析の結果を解釈できるようになる。

1. 回帰分析の出力の読み方

出力項目意味
Estimate(係数)各回帰係数の推定値 \(\hat{\beta}\)
Std. Error(標準誤差)係数の推定の標準誤差 SE(\(\hat{\beta}\))
t value(t値)\(\hat{\beta}/\text{SE}\)(\(t\) 検定統計量)
Pr(>|t|)(p値)両側 \(t\) 検定の p値。\(p<0.05\) で有意(*)
R-squared(\(R^2\))決定係数(モデルの説明力)
Adjusted R-squared自由度調整済み決定係数 \(\bar{R}^2\)
Residual standard error推定の標準誤差 \(s_e=\sqrt{MSE}\)
F-statistic(F値)モデル全体の F 検定(\(H_0:\text{すべての係数}=0\))
有意水準の目安:* は \(p<0.05\)、** は \(p<0.01\)、*** は \(p<0.001\)

2. 分散分析表(ANOVA表)の読み方

SourceSSdfMSFp値
処理(回帰/群間)SSA\(k-1\)MSAMSA/MSE検定の p
誤差(残差)SSE\(N-k\)MSE
全体SST\(N-1\)

3. 読み取りの注意点

4. 例題

【例題 27-1】回帰分析出力の読み取り

Rの出力(概要):切片=10.5(p=0.00012,***)、\(x_1\)=3.2(p=0.00120,**)、\(x_2\)=−1.5(p=0.230)。\(R^2=0.72\)、Adj \(R^2=0.686\)、誤差の自由度=17(\(k=2\))。(1)有意な変数は? (2)\(x_1=2,x_2=3\) のとき \(\hat{y}\) は? (3)\(n\) は?

解答
(1) \(x_1\) のみ(\(p=0.00120<0.05\))。\(x_2\) は \(p=0.23\) で有意でない。
(2) \(\hat{y}=10.5+3.2\times2+(-1.5)\times3=10.5+6.4-4.5=\mathbf{12.4}\)
(3) 誤差df \(=n-k-1=17\) なので \(n=17+2+1=\mathbf{20}\)
【例題 27-2】分散分析出力の読み取り

一元配置分散分析の出力:群間SS=84, df=3, MS=28, F=7.0, p=0.002。群内SS=64, df=16, MS=4。(1)\(k\) と \(N\) は? (2)有意水準1%での結論は?

解答
(1) 群間df \(=k-1=3\) なので \(k=\mathbf{4}\)。全体df \(=N-1=19\) なので \(N=\mathbf{20}\)(各群5観測)。
(2) \(p=0.002<0.01\) なので有意水準1%で帰無仮説を棄却。4群の母平均に有意な差がある。

5. 練習問題

問題 1

重回帰出力で「Adjusted R-squared=0.65, R-squared=0.72」。(1)\(\bar{R}^2\) が \(R^2\) より小さい理由 (2)説明変数を1つ追加したとき \(R^2\) と \(\bar{R}^2\) はどう変わるか

問題 2

「p=0.048で有意なので効果が証明された」という主張に対し、統計的に正確なコメントを述べよ。

問題 3

出力で「F-statistic: 15.3 on 3 and 46 DF, p-value: 0.0000053」。(1)\(k\) と \(n\) は? (2)このF検定は何を検定しているか?