はじめに

機械学習の回帰問題において、作成した予測モデルを評価する際に決定係数(R-squared)を確認したい場合があります。
VerticaはRSQUARED関数を利用すると決定係数による評価を行えます。

RSQUARED

コマンド構文

パラメータ名内容
targets目的変数(正解情報)が格納されている列
predictions予測結果が格納されている列

利用例



例として以下のサポートベクターマシン回帰(SVR)を使用して、イエローストーン国立公園の間欠泉の噴火継続時間(分)を予測し、その結果を評価します。
eruptionsが正解情報、predがVerticaが予測した結果です。


RSQUARED関数を利用し、上記の予測結果を評価します。
事前準備として、予測結果の呼び出しを簡素化するために、上記SQLをビューとして登録しておきます。


作成したpred_faithful_resultsビューに対してRSQUARED関数を実行します。


上記結果よりsvm_faithfulモデルの決定係数は0.722255037794467であることが確認できます。

参考情報

RSQUARED
https://www.vertica.com/docs/9.1.x/HTML/index.htm#Authoring/SQLReferenceManual/Functions/MachineLearning/RSQUARED.htm

検証バージョンについて

この記事の内容はVertica 9.1で確認しています。