2/17授業メモ1

統計的仮説検定とは、データをもとに仮説の正しさを統計的に評価する手法です。ある仮説が正しいかどうかを判断するために、標本データを分析し、偶然による誤差か実際の差かを統計的に検定します。

基本的な概念

1. 帰無仮説( H_0 )

• 「差がない」「効果がない」といった、検定の基準となる仮説。

• 例:「新しい薬と従来の薬に効果の違いはない」

2. 対立仮説( H_1 )

• 帰無仮説と対立する仮説で、研究者が証明したい仮説。

• 例:「新しい薬は従来の薬よりも効果がある」

3. 有意水準( \alpha )

• 帰無仮説を棄却する基準となる確率(一般的に0.05や0.01)。

• 例: \alpha = 0.05 ならば、「5%以下の確率でしか起こらないデータが観測されたら、帰無仮説を棄却する」

4. p値(p-value)

• 「帰無仮説のもとで、観測されたデータ以上に極端な結果が得られる確率」。

• p値が有意水準 \alpha より小さければ、帰無仮説を棄却する。

5. 検定統計量

• t 値、 z 値、 \chi^2 値など、仮説を評価するための指標。

• 例:t検定では、t値が基準値を超えると有意な差があると判断。

仮説検定の流れ

1. 仮説の設定(帰無仮説と対立仮説を決める)

2. 有意水準の設定(通常は0.05)

3. 検定の実施(t検定、χ²検定など)

4. p値の算出

5. 結果の解釈

• p値 < 有意水準 → 帰無仮説を棄却(対立仮説を支持) • p値 ≥ 有意水準 → 帰無仮説を採択(証拠不足) 代表的な仮説検定の種類 1. t検定(平均値の比較) • 例:新薬と従来薬の効果を比較 2. χ²検定(カテゴリデータの比較) • 例:アンケート結果の分布に差があるか 3. F検定(分散の比較) • 例:2つのグループのデータのばらつきを比較 4. ANOVA(分散分析)(3群以上の比較) • 例:3種類の治療法の効果を比較 5. 回帰分析(変数の関係を検定) • 例:気温と売上の関係を検証 注意点 • 「帰無仮説を棄却」しても「対立仮説が正しい」とは限らない • 検定は証明ではなく、「偶然では説明できないレベルの差がある」という判断。 • サンプルサイズが小さいと、検定結果の信頼性が低くなる • 大きなデータで再現性を確かめることが重要。 • 多重比較問題(複数回検定すると偶然の有意差が生じやすい) • ボンフェローニ補正などで調整が必要。 統計的仮説検定は、科学的な意思決定の重要なツールであり、医学、社会科学、ビジネスなど幅広い分野で利用されています。