はじめに

本記事では、機械学習アルゴリズムのトレーニングで使用できるデータ型について、ご紹介します。

各アルゴリズムで使用できるデータ型には「Y」、使用できないデータ型には「N」を記しています。

回帰モデル

回帰モデルの各アルゴリズムにおいて、トレーニング時の予測因子(Predictor)と応答(Response)で使用可能なデータ型は以下のとおりです。

予測因子

アルゴリズムINTFLOATNUMERICBOOLCHARVARCHAR
Linear_regYYYY (※1)N (※2)N (※2)
svm_regressorYYYY (※1)N (※2)N (※2)
rf_regressorYYY (※1)YYY

※1:Vertica 9.2以降で利用できます。
※2:One_hot_encorderで変換後に利用できます。

応答

アルゴリズムINTFLOATNUMERICBOOLCHARVARCHAR
Linear_regYYYNNN
svm_regressorYYYNNN
rf_regressorYYY (※1)NNN

※1:Vertica 9.2以降で利用できます。

分類モデル

分類モデルの各アルゴリズムにおいて、トレーニング時の予測因子(Predictor)と応答(Response)で使用可能なデータ型は以下のとおりです。

予測因子

アルゴリズムINTFLOATNUMERICBOOLCHARVARCHAR
Logistic_regYYYY (※1)N (※2)N (※2)
svm_classifierYYYY (※1)N (※2)N (※2)
naive_bayesYYY (※1)YYY
rf_classifierYYY (※1)YYY

※1:Vertica 9.2以降で利用できます。
※2:One_hot_encorderで変換後に利用できます。

応答

アルゴリズムINTFLOATNUMERICBOOLCHARVARCHAR
Logistic_regYYYY (※1)N (※2)N (※2)
svm_classifierYYYY (※1)N (※2)N (※2)
naive_bayesYY (※1)Y (※1)Y (※1)YY
rf_classifierY (※1)Y (※1)Y (※1)Y (※1)YY

※1:Vertica 9.2以降で利用できます。
※2:二値分類のためサポートしていません。

参考情報

任意のデータをOne-hot 表現に変換する(Vertica 9.0新機能)
http://vertica-tech.ashisuto.co.jp/one_hot_encoder/

検証バージョンについて

この記事の内容はVertica 9.2で確認しています。

更新履歴

2019/4/11 本記事を公開