統計学および機械学習の評価指標(とうけいがくおよびきかいがくしゅうのひょうかしひょう)では統計学および(教師ありの)機械学習の評価指標について述べる。

回帰に対する評価指標

以下のものがある。観測値を y = { y 1 ,   y 2 ,   ,   y N } {\displaystyle y=\left\{y_{1},\ y_{2},\ \cdots ,\ y_{N}\right\}} 、推定値を y i ^ = { y 1 ^ ,   y 2 ^ ,   ,   y N ^ } {\displaystyle {\hat {y_{i}}}=\left\{{\hat {y_{1}}},\ {\hat {y_{2}}},\ \cdots ,\ {\hat {y_{N}}}\right\}} と表す。これらの評価指標は代表的なPythonのオープンソース機械学習ライブラリscikit-learnではmetricsモジュールに実装されており、評価指標を計算する関数を併記する。

ただし、決定係数は上に挙げたものの他に7種類の定義が知られている。

二値分類

混同行列

scikit-learnではmetricsモジュールの「confusion_matrix(y_true, y_pred)」。

各種指標

以下のものがある

scikit-learnではmetricsモジュールの下記の関数を呼び出すことで計算可能:

  • 適合率:precision_score(y_true, y_pred)
  • 再現率:recall_score(y_true, y_pred)

脚注


回帰モデルの評価指標を一挙に解説(MSE, RMSE, MAE, RSquared等)【機械学習入門10】 米国データサイエンティストのブログ

統計学入門:最尤推定の理解度チェック|高橋泰城(たかはしたいき)

機械学習を解釈する技術~予測力と説明力を両立する実践テクニック

機械学習における評価指標とは?種類から学習方法まで徹底解説 TRYETING Inc.(トライエッティング)

モデル評価指標わかりやすく ,データサイエンスラボ 野村総研 話題のデータサイエンス用語 2分動画で解説