PR

順位相関係数とは?ピアソン・スピアマンの違いと使い分け

データサイエンティスト検定

DS021:変数が量的、質的どちらの場合でも関係の強さを算出できる

本記事で解決できる課題

  • データ間の関係性を測定する方法が知りたい
  • 量的データだけでなく、質的データの相関も知りたい
  • ピアソン相関とスピアマン相関の違いを理解し、適切に使い分けたい

データ分析では、変数同士の関係性を測ることが重要です。特に、データの種類によって適切な相関係数を選ぶことで、より正確な分析が可能になります。本記事では、ピアソンの積率相関とスピアマンの順位相関の違いを解説し、どのように使い分けるべきかを紹介します。

ピアソン相関とスピアマン相関の違い

データの関係性を測る指標として、ピアソンの積率相関とスピアマンの順位相関があります。それぞれの特徴を比較すると以下のようになります。

相関係数 特徴 データの適用範囲
ピアソン相関 変数間の線形関係の強さを測る 量的データ(数値データ)
スピアマン相関 変数間の単調関係の強さを測る 順位データ・質的データ

単調関係とは?

単調関係とは、具体的な数値の増減の大きさには依存せず、「一方が増えれば他方も増える(単調増加)」「一方が増えれば他方は減る(単調減少)」という関係のことを指します。

  • 単調増加の例:学力テストの順位と成績
  • 単調減少の例:価格が高いほど売上が減る商品

ピアソン相関は線形関係を前提とするため、曲線的な関係には適しません。一方、スピアマン相関は順位に着目するため、非線形な関係でも相関を測ることができます。

具体例:ピアソン相関とスピアマン相関の比較

以下の例を見てみましょう。

  1. 線形関係(Y = AX + B)

    • ピアソン相関:1.0
    • スピアマン相関:1.0

    → 完全な直線関係なので、どちらの相関係数も1になります。

  2. 非線形関係(Y = X³)

    • ピアソン相関:1未満
    • スピアマン相関:1.0

    → データはすべて単調増加しているため、スピアマン相関は1.0のままですが、ピアソン相関は曲線的な関係を考慮し1未満になります。

このように、データの特性によって適切な相関係数を選ぶことで、より正確な分析が可能になります。

画像に alt 属性が指定されていません。ファイル名: 1a7108e99cac32ee531a5514cc5fa02c-1024x302.png

まとめ

  • ピアソン相関は量的データの線形関係を測るのに適している。
  • スピアマン相関は順位データや非線形の単調関係を測るのに適している。
  • どちらの相関を使うべきかは、データの特性に応じて選択することが重要。

順位相関係数を適切に使いこなせるようになれば、データの関係性をより深く理解し、分析の精度を高めることができます。


AIで効率化してライバルに差をつける!【ビットランドAI】

コメント

タイトルとURLをコピーしました