DS10:順列や組合せの式 nPr, nCr を理解し、適切に使い分けることができる
データサイエンティスト検定のスキルチェックリストDS10及びDS11に関する解説を行います。
順列:順列とは「複数個のものを並べる並べ方」のことで、n個の中からr個を順番に選ぶといった場面で利用されます。具体的には下記の式で表されます。
では実際に数字を使って、5個のボールから3個を順番に選ぶ時のパターン数を考えてみます。
結果、この条件では60通りのパターンがあることが分かります。
組合せ
組合せ:組合せとは「複数個のものからの選び方」のことで、n個の中からr個を順番に関係なく選ぶといった場面で利用されます。具体的には下記の式で表されます。
では実際に数字を使って、5個のボールから順番を気にせず3個を選ぶ時のパターン数を考えてみます。
結果、この条件では10通りのパターンがあることが分かります。
DS11:確率に関する基本的な概念の意味を説明できる(確率、条件付き確率、期待値、独立など)
確率:確立とは「ある事象が起こる可能性の尺度」を表します。例えば、コインを投げたときに表が出る確率や、サイコロを振ったときに特定の目が出る確率などが確率の例です。
条件付き確率:条件付き確立とは「ある事象が起こったときに、事象が起こる確率」を表します。つまり、事象が与えられた条件下での事象の確率です。この様な状況をP(A|B)と表し下記式で求めます。
P(A∩B)は条件AとBが同時に発生する確率を示し、P(B)は条件Bの発生確率を示します。
では数字を使って確認します。下記の表のように数値が当てはまる場合に条件Bが成立したうえで条件Aも成立する確率を求めます。
A1:条件Aが成立 | A2:条件Aが不成立 | |
B1:条件Bが成立 | 750 | 250 |
B2:条件Bが不成立 | 250 | 750 |
期待値:ある事象が複数の結果を持つ場合に、それぞれの結果が起こる確率とその結果の積を足し合わせたもの。一つのさいころで出る目の期待値を例に計算すると下記のようになります。
結果、さいころの目の期待値は3.5であることが分かります。
独立:2つ以上の事象や確率変数が互いに影響を及ぼさない状態を指します。具体的には「さいころAとBを同時に振った際に出る目は各々に影響を与えない」といった関係が独立と言えます。これらの発生確率は積自称P(A∩B)はP(A)×P(B)と同等である。
コメント