データサイエンティスト検定のスキルチェックリストDS45及びDS46に関する解説を行います。
DS45:統計的仮説検定において帰無仮説と対立仮説の違いを説明できる
検定:データに基づいて仮説が正しいかどうかを判断するための方法です。以下の手順で行います。
- 仮説の設定
- 検定統計量の計算、p値の算出
- 優位水準との比較
- 結果の解釈
仮説の検定
まず、「どのような質問に答え、どのような仮説を検証したいのかを明確にします。」仮説には帰無仮説と対立仮説があります。
帰無仮説(H0): 検定の対象となる事象が偶然によって生じたものであり、実際には特定の効果や差がないという仮説です。帰無仮説は「変化がない」「効果がない」「差がない」といった、何も特別なことがない状態を表します。
例:2つの教育プログラムの効果を比較する場合、帰無仮説は「2つのプログラムの効果に差はない」となります。
対立仮説(H1):帰無仮説が間違っている場合に成り立つ仮説で、帰無仮説が示す状態とは異なる状態を示します。対立仮説は「差がある」「効果がある」「変化がある」といった、何らかの特別なことがある状態を表します。
例:2つの教育プログラムの比較では、対立仮説は「2つのプログラムの効果に差がある」となります。
検定統計量の計算、p値の算出
検定の種類に応じた方法で、検定統計量を求めます。
検定統計量:観察されたデータが帰無仮説の下で期待される値からどれだけ離れているかを示す数値です。検定統計量は、帰無仮説が正しいとした場合のデータのばらつきや変動の度合いを示し、その結果が統計的に有意であるかどうかを判断するために使用されます。
p値:統計学において、ある仮説が正しいとした場合に、観測されたデータが得られる確率を示す指標です。具体的には、帰無仮説が正しいとしたときに、観測された結果がどれくらい珍しいか、またはその結果が偶然である可能性を評価します。
優位水準との比較
統計的検定において、帰無仮説(H₀)を棄却するかどうかを決定する重要なステップです。このプロセスでは、計算した検定統計量に基づいて得られたp値と、事前に設定された有意水準とを比較します。
有意水準:検定を行う前に設定する閾値で、帰無仮説が正しいとした場合に、観察されたデータがどれだけ異常であるかを評価する基準です。
結果の解釈
統計的検定の最終ステップであり、データに基づいて得られた結果を意味のある形で理解し、結論を導き出すプロセスです。検定統計量とp値、有意水準との比較を通じて、帰無仮説(H₀)と対立仮説(H₁)のどちらがデータにより支持されるかを判断します。
p値 ≤ 有意水準:帰無仮説を棄却します。つまり過去のデータからは考えられない結果がでているので帰無仮説でたてた「変わらない」という事は証明できず、何らかの変化があったととらえることが出来ます。
p値 > 有意水準:帰無仮説は棄却出来ない。つまり過去のデータの範囲内の結果であり、なにも変わっていない可能性があります。
DS46:第1種の過誤、第2種の過誤、p値、有意水準の意味を説明できる
前述の検定を行い、p値と優位水準を比較して判断する際に過誤が発生する可能性があります。その誤りの種類には2種類あります。
第1種の過誤:帰無仮説が実際には正しいのに、誤って帰無仮説を棄却してしまう誤りのことを指します。これは「偽陽性」とも呼ばれます。第1種の過誤は優位水準と同じ確率で発生します。つまり5%の優位水準を利用した場合は5%の確率で第1種の過誤が発生します。
第2種の過誤:実際には帰無仮説が誤っているのに、帰無仮説を棄却しない誤りのことを指します。これは「偽陰性」とも呼ばれます。第2種の過誤は効果のサイズとサンプルのサイズから求める事が出来、βで表せます。また1-βを検定力とよび、
検定力:実際に効果がある場合に、帰無仮説を正しく棄却する確率を指します。簡単に言うと、効果があるときにそれを見つける能力のことです。検定力は、帰無仮説が間違っているときに、適切な検定が実際にそれを検出できる確率を示します。
コメント