DS019:5つ以上の代表的な確率分布を説明できる
この記事で解決できる課題
「正規分布ってよく聞くけど、実際どんなときに使うの?」「ポアソン分布や指数分布って何が違うの?」
こうした疑問をお持ちの方へ、本記事では代表的な確率分布の種類と特徴、用途をわかりやすく解説します。
データ分析や業務で数字を扱う際、確率分布を正しく理解しておくことで、より意味のある判断ができるようになります。AIや統計分析が身近になる今、「どの分布を使うか」はビジネスの意思決定にも直結する重要な知識です。
確率分布とは?
確率分布とは、「ある事象が起こる確率を、値ごとに整理したもの」です。
例えば、サイコロを振ったときに「1が出る確率は1/6」「3が出る確率も1/6」というように、どの値がどれくらいの確率で現れるかを示します。
確率分布は大きく2種類に分けられます。
・離散型確率分布:値が「数えられる」ケース(例:サイコロの目、人数など)
・連続型確率分布:値が「連続して変わる」ケース(例:身長、時間など)
離散型確率分布の代表例
ベルヌーイ分布【成功 or 失敗】
用途:コイン投げ、アンケートの「はい/いいえ」
特徴:1回の試行で成功(1)か失敗(0)のどちらかになる
式:成功確率 p=P(X=1)
失敗確率 1-p=P(X=0)
二項分布【成功回数の分布】
用途:10回コインを投げて、表が何回出るか
特徴:n回のベルヌーイ試行における成功回数
表記:X ~ Binomial(n, p)
例 :X ~ Binomial(10, 0.5) ⇒ P(X=10) = 1/1024
ポアソン分布【ある期間・範囲での発生数】
用途:1時間あたりの電話の件数、事故の発生件数など
特徴:単位時間内で平均 λ 回発生する事象の確率
式:P ( X = K ) = ( λ^K * e ^ ( -λ ) ) / k!
連続型確率分布の代表例
正規分布【最も有名な分布】
用途:テストの点数、身長、IQ など
特徴:平均・中央値・最頻値が同じで、左右対称のベルカーブ
表記:X ~ N(μ, σ²)
指数分布【間隔のモデリング】
用途:故障までの時間、次の電話が来るまでの待ち時間
特徴:ある出来事が「次に起こるまでの時間」に使われる
式 :f ( X ) = λ * e^( -λx ) ( x ≧ 0 )
カイ二乗分布【検定で使う】
用途:仮説検定(適合度検定、独立性検定など)
特徴:標準正規分布を二乗して足し合わせた分布
その他の分布(補足)
・t分布:サンプル数が少ないときの平均の検定に使う
・幾何分布:最初の成功が出るまでの回数をモデリング
・一様分布:全ての値が等しい確率(くじ引きなど)
まとめ
確率分布を理解することで、次のようなメリットがあります。
・データのパターンや傾向がつかみやすくなる
・正しい統計モデルを選べるようになる
・異常値や外れ値への対応力がつく
特にビジネスの現場では、数値の背景にある「確率的な意味合い」を理解することが、説得力のある提案や戦略につながります。
コメント