DS14:母(集団)平均と標本平均、不偏分散と標本分散がそれぞれ異なることを説明できる
データサイエンティスト検定のスキルチェックリストDS14及びDS15に関する解説を行います。
母集団:統計的な分析や推測の対象となる全体の集合を指します。例えば、ある製品を購入する可能性のある消費者層などが母集団となり得ます。母集団は通常、調査や分析の対象となる全体集団を指します。
標本:標本とは母集団から無作為または特定の方法で選ばれた部分集合のことを指します。標本は、母集団全体の特性や動向を推測するために使用されます。
母平均と標本平均
母平均:母集団全体の全要素値の平均です。母平均は膨大であることから直接算出する事が難しいので、通常、標本から推測されることが多くあります。
標本平均:母集団から無作為または特定の方法で選ばれた標本値の平均を指します。計算する際には十分な量の十分に分散したデータを用意することが極めて重要です
不変分散と標本分散
母分散:母集団全体の全要素値の分散です。
標本分散:母集団から無作為または特定の方法で選ばれた標本値の分散を指します。一般的に標本分散は母分散より小さくなる傾向があります。
不偏分散:標本分散の小さくなる特性を補正した分散であり、母分散の推定に用いられます。次の式で計算されます。
SD15:標準正規分布の平均と分散の値を知っている
正規分布:釣鐘型の形状で両側に対称な形をしています。分布の中心は平均値(μ)であり、その広がりは標準偏差(σ)で示されます。正規分布の確率密度関数は下記のようにあらわされます。
標準正規分布:平均値が「0」、分散が「1」の正規分布を標準正規分布と呼ぶ。
正規分布の標準化:正規分布を下記の式で調整する事で標準正規分布の形に変換します。これによって正規分布表を用いた確率を算出できるようになります。
例題
平均μ=70、標準偏差σ=5の正規分布に従う変数から、X≦率を調べます。
- Z値が1の場合の累積確率は約0.8413です。
- 調べた結果から、Xが75以下になる確率は84%であることが分かります。
コメント