DSOC研究員の吉村です. 先日, Sansan の Scan for Trees という取り組みの一環で, 宮城県の大崎市に植樹に行ってきました. 普段のオフィスでのデスクワークから離れて, 鍬を手に持ち植樹をするという経験は非常に新鮮でした.
さて, 今回も引き続き「機械学習のモデルの評価方法」について見ていきます. 前回お伝えした通り, 多クラス分類 (multi-class classification) と回帰 (regression) の評価指標について確認していきます. これまでと同様に, モデルという言葉を機械学習のモデルという意味で用いていきます.
比較的基本の内容ですが, 見ていきましょう.
Notation
多クラス分類における精度評価部分では, テスト事例集合を で, 候補クラス (ラベル) 集合を で表します. 事例は , クラスは とします. , , , はそれぞれ, クラス を正例として, そのほかのクラスを負例とした時の TP, FP, TN, FN の数を表しています.
また, 回帰における精度評価部分では, テスト事例集合を で, 事例を で表します. 加えて, 事例 の真の値と予測値をそれぞれ, , とします. また, 各事例の真の値の平均を と表現します.