PR

確率分布の種類と特徴をわかりやすく解説

DS019:5つ以上の代表的な確率分布を説明できる

この記事で解決できる課題

「正規分布ってよく聞くけど、実際どんなときに使うの?」「ポアソン分布や指数分布って何が違うの?」
こうした疑問をお持ちの方へ、本記事では代表的な確率分布の種類と特徴、用途をわかりやすく解説します。

データ分析や業務で数字を扱う際、確率分布を正しく理解しておくことで、より意味のある判断ができるようになります。AIや統計分析が身近になる今、「どの分布を使うか」はビジネスの意思決定にも直結する重要な知識です。

確率分布とは?

確率分布とは、「ある事象が起こる確率を、値ごとに整理したもの」です。
例えば、サイコロを振ったときに「1が出る確率は1/6」「3が出る確率も1/6」というように、どの値がどれくらいの確率で現れるかを示します。

確率分布は大きく2種類に分けられます。
・離散型確率分布:値が「数えられる」ケース(例:サイコロの目、人数など)
連続型確率分布:値が「連続して変わる」ケース(例:身長、時間など)

離散型確率分布の代表例

ベルヌーイ分布【成功 or 失敗】
用途:コイン投げ、アンケートの「はい/いいえ」
特徴:1回の試行で成功(1)か失敗(0)のどちらかになる
:成功確率   p=P(X=1)
      失敗確率 1-p=P(X=0)

二項分布【成功回数の分布】
用途:10回コインを投げて、表が何回出るか
特徴:n回のベルヌーイ試行における成功回数
表記:X ~ Binomial(n, p)
例   :X ~ Binomial(10, 0.5) ⇒ P(X=10) = 1/1024

ポアソン分布【ある期間・範囲での発生数】
用途:1時間あたりの電話の件数、事故の発生件数など
特徴:単位時間内で平均 λ 回発生する事象の確率
:P ( X = K ) = ( λ^K * e ^ ( -λ ) ) / k!

連続型確率分布の代表例

正規分布【最も有名な分布】
用途:テストの点数、身長、IQ など
特徴:平均・中央値・最頻値が同じで、左右対称のベルカーブ
表記:X ~ N(μ, σ²)

指数分布【間隔のモデリング】
用途:故障までの時間、次の電話が来るまでの待ち時間
特徴:ある出来事が「次に起こるまでの時間」に使われる
式   :f ( X ) = λ * e^( -λx )  ( x ≧ 0 )

カイ二乗分布【検定で使う】
用途:仮説検定(適合度検定、独立性検定など)
特徴:標準正規分布を二乗して足し合わせた分布

その他の分布(補足)

t分布:サンプル数が少ないときの平均の検定に使う
幾何分布:最初の成功が出るまでの回数をモデリング
一様分布:全ての値が等しい確率(くじ引きなど)

まとめ

確率分布を理解することで、次のようなメリットがあります。
・データのパターンや傾向がつかみやすくなる
正しい統計モデルを選べるようになる
異常値や外れ値への対応力がつく

特にビジネスの現場では、数値の背景にある「確率的な意味合い」を理解することが、説得力のある提案や戦略につながります。


AIで効率化してライバルに差をつける!【ビットランドAI】

コメント

タイトルとURLをコピーしました