【DS検定】DS123 経時変化、DS124 多変量の比較

データサイエンティスト検定のスキルチェックリストDS123及びDS124に関する解説を行います。

DS123:端的に図表の変化をアニメーションで可視化できる(人口動態のヒストグラムが経年変化する様子を表現するなど)

例えば、人口動態のヒストグラムが時間の経過とともにどのように変化するかを、アニメーションを使って動的に示すことで、視覚的に変化の様子を直感的に理解できるようにすることです。これにより、データのトレンドやパターンが一目で把握しやすくなります。例えば下記のように時間毎の野菜の在庫推移を示すなど。

DS124:1~3次元の図表を拡張した多変量の比較を適切に可視化できる(平行座標、散布図行列、テーブルレンズ、ヒートマップなど)

平行座標:多次元データを可視化するためのグラフです。各データポイントは複数の縦軸に沿って線で結ばれ、各軸が異なる変数を示します。これにより、データの相関関係やパターンを直感的に把握しやすくなります。

散布図行列:散布図行列は複数の変数間の関係性を視覚的に示すための図です。各変数の組み合わせについて散布図を描き、それらを行列形式で表示することで、変数間の相関や分布のパターンを一目で確認できるようにします。データの関係性や異常値を探るのに役立ちます。対角線の枠にはその属性のヒストグラムを表示します。

テーブルレンズ:データテーブルを視覚的に探索するためのインタラクティブなツールです。通常、データの表形式の表示に加え、データの分布やパターンを強調するためにヒートマップなどのビジュアル要素を取り入れます。これにより、大量のデータを効率よく分析し、重要な情報を迅速に把握することができます。

ヒートマップ:データの値を色で表現する視覚化手法です。色の濃淡や色のグラデーションによって、データの強度や分布を示し、パターンや傾向を直感的に理解しやすくします。下記の例では数字が大きいほど濃くなります。

コメント

タイトルとURLをコピーしました