Verticaのマイナーバージョン「9.1」がリリースされましたので、主な新機能と強化された機能の概要をご紹介します。
今後、新機能の検証結果なども本サイトでご報告する予定です。

Vertica 9.1 の主な新機能/機能強化

クラウド対応の拡充

Eonモードの追加

Vertica 9.1から、従来の「Enterpriseモード(ローカルノード間でデータを分散)」に加えて、「Eonモード(ストレージレイヤと計算ノードを分離)」が追加されました。「Eonモード」では、すべてのデータをS3(共有ストレージ)に保存することできます。また、利用頻度に応じて、定期的にEC2インスタンスをスケールアウトやスケールインすることもできます。


S3からのデータロード:AWSパラメータをセッション単位で設定可能に

S3からのデータロードでは、Verticaで指定したAWSパラメータの値が使用されます。
9.0までは、AWSパラメータはグローバルにのみ設定でき、異なるリージョンや資格情報をパラレルに読み取ることはできませんでしたが、9.0からはセッション単位で設定できるようになりました。

パフォーマンス向上

Distinct集計処理の高速化

SQLのグループ処理が、マルチスレッドに対応したことにより、大量データに対してのパフォーマンスが大幅に向上しました。

カラム数の多いテーブルに対するMergeout処理の高速化

Mergeout処理で利用可能なメモリサイズが増えたことにより、カラム数の多いテーブルに対してのパフォーマンスが大幅に向上しました。

In-Database分析機能の拡充

予測分析のための機械学習機能の充実

新しい機械学習の機能が追加されました。

・主成分分析(PCA)アルゴリズム
・特異値分解(SVD)アルゴリズム
・ROCに基づくAUC(Area Under Curve)評価機能
・F1スコア評価関数を用いたPR曲線(Precision Recall Curve)

その他、追加/強化された機能

Management Consoleによる外部データの監視

Verticaの外部テーブルとHcatalogテーブルのデータ量をモニタリングできるようになりました。

監査用システム・テーブル

クエリ実行やDBユーザー、テーブル、パラメータ変更を監査するためのシステム・テーブルが追加されました。

・AUDIT_MANAGING_USERS_PRIVILEGES
・LOG_PARAMS
・LOG_QUERIES
・LOG_TABLES

Pythonのユーザー定義関数

従来のC++、Java、Rに加えて、Pythonでユーザー定義の変換関数(UDTFs)を作成できるようになりました。

アップグレード前の実行スクリプト

Vertica 9.1以降、すべてのバディプロジェクションのSELECT句とORDER BY句は同じ順番で列を指定する必要があるため、アップグレード前にスクリプトを実行してください。

<参考情報>
https://my.vertica.com/9-1-pre-upgrade-script/

その他

稼働環境

サポート開始/終了

・openSUSEの42.3をサポート
・Amazon Linux 2017.09のサポートを終了
・SUSE 11 SP3のサポートを終了
・Ubuntu12.04のサポートを終了

システム要件の詳細はこちらの記事でご確認ください。

検証バージョンについて

この記事の内容はVertica 9.1で確認しています。