DS021:変数が量的、質的どちらの場合でも関係の強さを算出できる
本記事で解決できる課題
- データ間の関係性を測定する方法が知りたい
- 量的データだけでなく、質的データの相関も知りたい
- ピアソン相関とスピアマン相関の違いを理解し、適切に使い分けたい
データ分析では、変数同士の関係性を測ることが重要です。特に、データの種類によって適切な相関係数を選ぶことで、より正確な分析が可能になります。本記事では、ピアソンの積率相関とスピアマンの順位相関の違いを解説し、どのように使い分けるべきかを紹介します。
ピアソン相関とスピアマン相関の違い
データの関係性を測る指標として、ピアソンの積率相関とスピアマンの順位相関があります。それぞれの特徴を比較すると以下のようになります。
相関係数 | 特徴 | データの適用範囲 |
---|---|---|
ピアソン相関 | 変数間の線形関係の強さを測る | 量的データ(数値データ) |
スピアマン相関 | 変数間の単調関係の強さを測る | 順位データ・質的データ |
単調関係とは?
単調関係とは、具体的な数値の増減の大きさには依存せず、「一方が増えれば他方も増える(単調増加)」「一方が増えれば他方は減る(単調減少)」という関係のことを指します。
- 単調増加の例:学力テストの順位と成績
- 単調減少の例:価格が高いほど売上が減る商品
ピアソン相関は線形関係を前提とするため、曲線的な関係には適しません。一方、スピアマン相関は順位に着目するため、非線形な関係でも相関を測ることができます。
具体例:ピアソン相関とスピアマン相関の比較
以下の例を見てみましょう。
-
線形関係(Y = AX + B)
- ピアソン相関:1.0
- スピアマン相関:1.0
→ 完全な直線関係なので、どちらの相関係数も1になります。
-
非線形関係(Y = X³)
- ピアソン相関:1未満
- スピアマン相関:1.0
→ データはすべて単調増加しているため、スピアマン相関は1.0のままですが、ピアソン相関は曲線的な関係を考慮し1未満になります。
このように、データの特性によって適切な相関係数を選ぶことで、より正確な分析が可能になります。
まとめ
- ピアソン相関は量的データの線形関係を測るのに適している。
- スピアマン相関は順位データや非線形の単調関係を測るのに適している。
- どちらの相関を使うべきかは、データの特性に応じて選択することが重要。
順位相関係数を適切に使いこなせるようになれば、データの関係性をより深く理解し、分析の精度を高めることができます。
コメント