なたでぽぽ

混同行列(Confusion Matrix)

混同行列(Confusion Matrix)とは、クラス分類の結果をまとめた表のことです。

陽性のサンプルのうち、何個が正しく陽性と判定され、何個が誤って陰性と判定されたか、といったことを分かりやすくまとめるために用います。クロス表の一種です。

用語がたくさんある上に、分野によって微妙に異なっていてややこしいので、以下にまとめます。

    予測されたクラス
    Positive Negative
実際の
クラス
Positive True Positive False Negative
Negative False Positive True Negative

2クラスの場合、混同行列はこのような2×2の行列になります。

縦が実際のクラス、横が予測されたクラスですが、場合によっては行と列を逆に書くこともありますので注意して下さい。また、PositiveとNegativeを逆にすることもあります。

いずれにしても、左上と右下が予測が当たったサンプルの数、右上と左下が外れた数で、それぞれTrueとFalseを付けます。そのあとのPositive、Negativeは、予測がどちらなのかを表しています。

正解率(Accuracy)=(TP+TN)/(TP+FP+TN+FN)

TP(True Positive)とTN(True Negative)を足して、全部の合計で割ったもの。

真陽性率(True Positive Rate)=TP/(TP+FN)

実際に陽性であるサンプルのうち、陽性であると判定されたサンプルの割合。

検出率(Recall)、感度(Sensitivity)、ヒット率(Hit Rate)、再現率などと呼ばれることもあります。

偽陰性率(False Negative Rate)=FN/(TP+FN)

実際には陽性であるサンプルのうち、陰性であると判定されたサンプルの割合。

偽陽性率(False Positive Rate)=FP/(FP+TN)

実際には陰性であるサンプルのうち、陽性であると判定されたサンプルの割合。

誤検出率、誤警報率(False Alarm Rate)とも言います。

真陰性率(True Negative Rate)=TN/(FP+TN)

実際に陰性であるサンプルのうち、陰性であると判定されたサンプルの割合。

特異度(specificity)とも呼ばれます。

精度(Precision)=TP/(TP+FP)

陽性であると予測したサンプルのうち、実際に陽性であるサンプルの割合。適合率ともいいます。