DS046:第1種の過誤、第2種の過誤、p値、有意水準の意味を説明できる
この記事で解決できる疑問
・「p値ってよく出てくるけど、何を意味してるの?」
・「第1種と第2種の過誤ってどう違うの?」
・「検定結果をどうやって信じていいのか分からない」
統計検定を使った分析結果を正しく読み解くためには、p値や有意水準に加えて、「過誤(エラー)」の概念を理解しておくことが重要です。この記事では、第1種の過誤・第2種の過誤・p値・有意水準・検定力について、初心者にもわかりやすく整理して解説します。
仮説検定における「誤り」とは?
統計的な検定を行う際、本来の真実とは異なる結論を出してしまう可能性があります。このような誤りを「過誤(エラー)」と呼び、主に2つの種類に分類されます。
第1種の過誤(αエラー):誤って帰無仮説を棄却してしまう
定義:本当は帰無仮説が正しいのに、間違って「効果がある」と判断してしまう誤り
別名:偽陽性(false positive)
例 :実際には効果のない新薬に対して「効果あり」と判断してしまう
発生確率:設定した有意水準(α)と同じ。たとえば、α = 0.05なら5%の確率で発生
第2種の過誤(βエラー):誤って帰無仮説を採択してしまう
定義:本当は帰無仮説が間違っているのに、「効果がない」と判断してしまう誤り
別名:偽陰性(false negative)
例 :本当は効果のある新薬を「効果なし」と見なしてしまう
発生要因:サンプルサイズが小さい/効果が小さい/検定の設計が不適切
検定力(Power):効果を見抜く力
定義:第2種の過誤を回避できる確率(1 – β)
意味:本当に効果があるとき、それを正しく見つけ出せる力
高めるには?
・サンプルサイズを増やす
・効果の大きさ(効果量)を意識する
・有意水準をゆるめる(ただし、第1種の過誤リスクが増える)
p値とは?なぜ比較するのか?
定義:帰無仮説が正しいと仮定した場合に、今のデータ以上の結果が得られる確率
見方:p値 ≦ 有意水準 → 帰無仮説を棄却(効果ありと判断)
p値 > 有意水準 → 帰無仮説を棄却できない(効果なしと判断)
有意水準(α)とは?
定義:第1種の過誤を許容する上限値
一般的な値:0.05(5%)や0.01(1%)など
注意点:小さくしすぎると第2種の過誤が増えるジレンマがある
よくある誤解と注意点
「p値が小さい」=「効果が大きい」ではない(効果の大きさは効果量で評価)
有意水準は恣意的に設定してはいけない(研究設計に基づいた選定が必要)
検定力が低いと、本当に意味のある効果を見逃す危険がある
まとめ
統計的仮説検定を行う際には、結果を正しく判断するために「第1種の過誤」「第2種の過誤」「p値」「有意水準」といった基本的な用語や概念を正確に理解しておく必要があります。
第1種の過誤は、実際には正しい帰無仮説を誤って棄却する誤りであり、有意水準がその発生確率となります。一方、第2種の過誤は、実際には誤っている帰無仮説を誤って採択してしまう誤りで、検定力(1−β)と密接に関係します。
p値は、得られたデータのもとで帰無仮説が正しいとした場合に、観測された結果以上の極端な結果が得られる確率を示す指標です。このp値と設定した有意水準を比較することで、帰無仮説を棄却するかどうかの判断を行います。
これらの知識を押さえておくことで、単に数値を処理するだけでなく、分析結果の信頼性や判断の正当性をより深く理解できるようになります。ビジネスや研究の場面でも、適切な判断と説明力を備えるための基礎となる重要な内容です。
コメント