データサイエンティスト検定のスキルチェックリストDS22及びDS23に関する解説を行います。
DS22:指数関数とlog関数の関係を理解し、片対数グラフ、両対数グラフ、対数化されていないグラフを適切に使いわけることができる
まず指数関数と対数関数の関係を下図で確認してください。
2進対数:底を2にした対数
常用対数:底を10にした対数
自然対数:底をネイピア数「e」にした対数
片対数グラフ
片対数グラフとはグラフの縦軸または横軸の一方を対数スケールで表示し、もう一方を通常の線形スケールで表示するグラフのことです。下図に通常グラフとの比較を示します。
グラフから分かるように値が指数関数的に増加する為、通常グラフ(左)では傾向がほぼ表示できません。こういった場合片対数グラフ(中)にする事で全体の傾向を確認する事が出来ます。また、片対数グラフ(右)のÝ軸の単位をlogに変更する事でメモリ表記をすっきりさせる事も可能です。
このグラフで使用した関数を底が10のlogに置き換えると下記のようになります。
上記の式から分かるように、常にLog10(Y)はX+1で増加しています。
両対数グラフ
両対数グラフとはグラフの縦軸または横軸の両方を対数スケールで表示したグラフのことです。下図に通常グラフとの比較を示します。
片対数グラフと同様に全体の傾向が読み取れるようになりました。このグラフで使用した関数を底が10のlogに置き換えると下記のようになります。
上記の式から分かるように、常にLog10(X)が1増加するたびにLog10(Y)は2増加します。
DS23:ベイズの定理を説明できる
ベイズの定理:事前に持っている確率(事前確率)と新しい情報(尤度)を組み合わせて、更新された確率(事後確率)を計算する方法を提供します。特に、不確実な情報や証拠が得られた際に、それをどのように考慮すべきかを示しています。要するに事象AとBがあり、事象Bが起こった状態で事象Aが起こる確率を求めるものです。
ここでP(B)で示される事象Bの周辺確率は下記の用に求める事が出来ます。
式は大きく二つの確率で計算されます。①は事象Aが発生した上での事象Bの確率で、②は事象Aが発生しない時の事象Bの確率となります。
コメント