はじめに


VerticaはSQLで機械学習を行うことができます。
本記事は、Verticaの機械学習機能のページをまとめた記事です。

Verticaで機械学習を行うことによるメリットは以下の記事をご確認ください。

  • Verticaで始める機械学習~ビッグデータ分析/IoTに有効な機械学習機能の紹介~
  • http://vertica-tech.ashisuto.co.jp/vertica-in-database-machine-learning/

    機械学習機能の一連の動作イメージを理解する

    以下の記事では、機械学習のチュートリアルとして有名なタイタニック号の乗客生存予測をVerticaの機械学習を用いて実施しています。
    Verticaで機械学習を実施する場合の一連の流れをご確認いただけます。


  • Verticaで始める機械学習~タイタニック号の乗客生存予測にチャレンジ~
  • http://vertica-tech.ashisuto.co.jp/machine_learning_titanic/

    各機能の詳細を理解する

    以降の記事では、具体的な機械学習機能の利用方法を紹介しています。

    データ準備に関する機能

  • 各列の平均、中央値、最大値/最小値、標準偏差等を一括で確認する
  • http://vertica-tech.ashisuto.co.jp/summarize_numcol/

  • 異常値(外れ値)を検出/除外する
  • http://vertica-tech.ashisuto.co.jp/detect_outliers/

  • 欠損値を補完する
  • http://vertica-tech.ashisuto.co.jp/imputing_missing_values/

  • 任意のデータをOne-hot 表現に変換する
  • http://vertica-tech.ashisuto.co.jp/one_hot_encoder/

  • データの正規化を行う
  • http://vertica-tech.ashisuto.co.jp/normalize/

  • 不均衡データをバランシングする(アンダー/オーバーサンプリング)
  • http://vertica-tech.ashisuto.co.jp/balance/

  • データのサンプリングを行う
  • http://vertica-tech.ashisuto.co.jp/tablesample/

  • 主成分分析(PCA)を用いた次元削減
  • http://vertica-tech.ashisuto.co.jp/pca/


    モデル作成・実装に関する機能

    回帰モデル

  • Verticaで始める機械学習~線形回帰を使った回帰~
  • http://vertica-tech.ashisuto.co.jp/linear_reg/

  • Verticaで始める機械学習~SVM(サポートベクターマシン)を使った回帰~
  • http://vertica-tech.ashisuto.co.jp/svm_regressor/

  • Verticaで始める機械学習~ランダムフォレストを使った回帰~
  • http://vertica-tech.ashisuto.co.jp/rf_regressor/

    分類モデル

  • Verticaで始める機械学習~ロジスティック回帰を使った分類~
  • http://vertica-tech.ashisuto.co.jp/logistic_reg/

  • Verticaで始める機械学習~ナイーブベイズを使った分類~
  • http://vertica-tech.ashisuto.co.jp/naive_bayes/

  • Verticaで始める機械学習~SVM(サポートベクターマシン)を使った分類~
  • http://vertica-tech.ashisuto.co.jp/vertica-ml-svm/

  • Verticaで始める機械学習~ランダムフォレストを使った分類~
  • http://vertica-tech.ashisuto.co.jp/random_forest/

    クラスタリングモデル

  • Verticaで始める機械学習~k-meansを使ったクラスタリング~
  • http://vertica-tech.ashisuto.co.jp/kmeans/

    評価に関する機能

    回帰モデルの評価

  • MSE/RMSEによる評価
  • http://vertica-tech.ashisuto.co.jp/mse/

  • 決定係数(R-squared)によるモデル評価
  • http://vertica-tech.ashisuto.co.jp/rsquared/


    分類モデルの評価

  • エラー率によるモデル評価
  • http://vertica-tech.ashisuto.co.jp/error_rate/

  • Confusion Matrix(混同行列)によるモデル評価
  • http://vertica-tech.ashisuto.co.jp/confusion_matrix/

  • ROC/AUCによるモデル評価
  • http://vertica-tech.ashisuto.co.jp/roc/

  • PR曲線/F1値によるモデル評価
  • http://vertica-tech.ashisuto.co.jp/prc/


    モデル管理に関する機能

  • 作成したモデルの一覧を確認する
  • http://vertica-tech.ashisuto.co.jp/models/

  • 作成したモデルのモデル名を変更する
  • http://vertica-tech.ashisuto.co.jp/renaming_a_model/

  • モデルのスキーマを変更する
  • http://vertica-tech.ashisuto.co.jp/moving_models_to_another_schema/

  • モデルの所有者を変更する
  • http://vertica-tech.ashisuto.co.jp/changing_model_ownership/

  • 作成したモデルを別の環境に移行する(モデルのエクスポート/インポート)
  • http://vertica-tech.ashisuto.co.jp/export_import_models/

  • モデルを削除する
  • http://vertica-tech.ashisuto.co.jp/dropping_models/