ROC曲線とAUCの見方を解説！分類モデルの精度評価

DS153：ROC曲線、AUC(Area under the curve)を用いてモデルの精度を評価できる

DS153：ROC曲線、AUC(Area under the curve)を用いてモデルの精度を評価できる

はじめに

分類モデルの精度を評価する際、「正答率（Accuracy）」だけでは不十分なことがあります。特に、クラスの不均衡（例：詐欺検出や医療診断）においては、より詳細な指標が求められます。そこで活用されるのが ROC曲線（Receiver Operating Characteristic Curve） と AUC（Area Under the Curve） です。

本記事では、ROC曲線とAUCの概念を分かりやすく解説し、どのようにモデルの評価に活用できるかを説明します。データサイエンス分野に限らず、品質管理、マーケティングなど幅広い分野での応用も紹介します。

ROC曲線とは？

ROC曲線は、分類モデルの性能を視覚的に評価するためのグラフです。特に 閾値（しきい値） を変化させた際の 真陽性率（TPR） と 偽陽性率（FPR） をプロットすることで、モデルの性能を把握できます。

真陽性率（TPR / Sensitivity）
- 実際にポジティブなデータのうち、正しくポジティブと判定された割合。
- 計算式：
偽陽性率（FPR）
- 実際にネガティブなデータのうち、誤ってポジティブと判定された割合。
- 計算式：

ROC曲線の特徴

FPR（横軸） vs TPR（縦軸） のグラフで表現される。
理想的なモデル は、ROC曲線が左上（FPR = 0, TPR = 1）に近づく。
ランダムなモデル（役に立たない分類器）の場合、ROC曲線は対角線（y=x）上に分布する。

AUCとは？

AUC（Area Under the Curve） は、ROC曲線の下の面積を数値化した指標です。モデルの分類性能を 1つの数値 で表せるため、比較が容易になります。

AUCの解釈

AUC値	モデルの性能
1.0	完全に正確な分類
0.9以上	非常に優れた分類能力
0.8以上	優れた分類能力
0.7以上	まずまずの分類能力
0.5	ランダムな予測と同等
0.5未満	逆の予測をしている可能性