検定を幾何で理解する 2: Wald 検定は距離を見る

前回は、仮説を確率分布の地図の中の場所として見ました。

今回は Wald 検定を見ます。

Wald 検定は、ひとことで言うと「データが選んだ点から、帰無仮説までの距離を見る検定」です。

推定値から仮説までを測る

コイン投げで考えます。

帰無仮説は、

H_0: p = 0.5

です。

データから推定した値を $\hat{p}$ とします。

Wald 検定は、

\hat{p} - 0.5

がどれくらい大きいかを見ます。

ただし、生の差だけを見るのではありません。

推定値には揺れがあります。20 回投げたときの $\hat{p}$ と、2 万回投げたときの $\hat{p}$ では、同じ 0.1 の差でも意味が違います。

だから標準誤差で割ります。

Z = \frac{\hat{p} - p_0}{\mathrm{SE}(\hat{p})}

これは「何個分の標準誤差だけ離れているか」を表します。

幾何の言葉では、Wald 検定は推定点 $\hat{p}$ から帰無仮説の点 $p_0$ までの距離を測っています。

ただし、ふつうの定規ではなく、統計的な揺れを考慮した定規を使います。

Wald 検定は横方向の距離を見る

推定された点から帰無仮説までのズレを、標準誤差で割った距離として読みます。

データが指す位置

真の点の近くでは対数尤度の山を二次関数で近似できるので、Wald・Score・尤度比は同じ地図に乗ります。

局所二次近似 5% の目安 Wald Score LR

Wald 検定は直感的です。

推定値を出す。仮説の値と比べる。標準誤差で割る。

この流れはわかりやすく、信頼区間とも相性がよいです。

たとえば 95% 信頼区間が帰無仮説の値を含まなければ、だいたい 5% 水準の両側検定で棄却する、という見方ができます。

Wald 検定は、推定点 $\hat{p}$ の近くで地図を見ます。

そのため、推定点が境界に近いと不安定になることがあります。

たとえば $p$ は 0 から 1 の間にしかありません。でも正規近似を使うと、計算上は 0 未満や 1 超えの方向まで考えてしまうことがあります。

これは、曲がった地図を平らな地図で近似していることから起きる問題です。

Wald 検定は、データが選んだ推定点から帰無仮説までの距離を見る方法です。

直感的で使いやすい一方、推定点の周りで近似するため、境界や強い非線形がある場合は注意が必要です。

次回は、帰無仮説の点で坂道を見る Score 検定を扱います。