f値 (f1-score)
f値(f1-score)とは、分類モデルの性能を評価するための指標の一つです。
モデルの適合率(Precision)と再現率(Recall)という2つの指標のバランスを評価するために使用されます。
適合率とは、モデルが「陽性」と予測したもののうち、実際に陽性であった割合を指します。不要なものを誤って陽性と判断してしまわないかというモデルの正確性を表します。
数式では以下のように表現されます。

ここで、TP(True Positive)は実際に陽性で、モデルも陽性と予測した数、FP(False Positive)は実際は陰性だが、モデルが誤って陽性と予測した数を表します。
再現率とは、モデルがどれだけ「陽性」と正しく予測できたかの割合です。 陽性であるものを見逃していないかというモデルの網羅性を示します。

ここで、FN(False Negative)は実際は陽性だが、モデルが陰性と誤って予測してしまった数を表します。
適合率と再現率はしばしばトレードオフの関係にあります。例えば、多くのものを陽性と予測するようにすると再現率は高まりますが、その分誤って陽性と判定するもの(偽陽性)も増え、適合率は低下する傾向があります。逆に、陽性と判定する基準を厳しくすると適合率は高まりますが、本来陽性であるものを見逃す(偽陰性)可能性が増え、再現率は低下する傾向があります。
F1スコアは、この適合率と再現率の調和平均を計算することで、両方のバランスの取れた評価を行います。これにより、正確に陽性を予測しつつ、同時に多くの真の陽性を見逃していないかというモデルの総合的な性能を評価できます。
数式では以下のように表現されます。
