【DS検定】DS119 データ濃度、DS120 誇張表現

データサイエンティスト検定のスキルチェックリストDS119及びDS120に関する解説を行います。

DS119:情報提示の相手や場に応じて適切な情報濃度を判断できる(データインク比の考え方など)

データインク:グラフや図表において実際にデータを示すために使われるインクや要素のことです。軸、データポイント、バーなどが含まれ、データ伝達の役に立つものです。

データインク比:図表のシンプルさと明瞭さを測る指標です。データを表す部分が多く、装飾が少ないほど比率は高くなります。

データ濃度:図表やグラフ内に含まれる情報量の密度を示します。具体的には、一定の面積内にどれだけ多くのデータが示されているかを指します。データ濃度が高いほど、多くの情報が詰まっていると言えます。

目的とする情報を伝えるために必要なデータインクやデータ濃度で相手に伝える必要があります。過剰にそれらを高めることは無駄な労力となることがあります。

DS120:不必要な誇張をしないための軸表現の基礎を理解できている(コラムチャートのY軸の基準点は「0」からを原則とし軸を切らないなど)

自らの目的を正当化するために恣意的にグラフの基準点をずらしたり、一部だけを抜き出して判断のミスリードを引き出す事などが不必要な誇張です。自身がしないことも大切ですが、そのような図表を見抜く力も重要である。他に下記のような誇張表現があります。

  • 単位の異なるグラフを一つにしている
  • 時間間隔が不均一
  • 増加を誤認させる累積グラフ

コメント

タイトルとURLをコピーしました