機械学習とかで結果の評価として普通に出てくる感じの適合率や再現率だけど、どっちがどっちだか忘れることがあるのでまとめてみる。wikipediaにはドキュメント検索を例に上げているけど、ここでは○×問題を解答した結果の評価的な感じで考えてみる。まとめると、以下な感じだろう。
- 正答率(accuracy):すべての問題で○×を正しく当てる割合。(正答率)=(正解数)/(問題数)
- 適合率(precision):○と解答した問題で正しく当てる割合。(適合率)=(○と解答した問題の正解数)/(○と解答した問題数)。逆に×についての適合率も考えることができる。
- 再現率(recall):○の問題だけについて、正しく当てる割合。(再現率)=(○の問題だけの正解数)/(○の問題数)。逆に×についての再現率も考えることができる。