Oracle Exadata X10MではAMD社製のCPUが採用されたことで、DB Server、Storage ServerともにCPUの性能自体が向上しています。本記事をご覧の皆さんに、当社で実施したExadata X10Mの処理性能検証結果を共有します。
なお、Exadata X10Mのスペックや提供形態などは、下記の記事でご紹介しています。
Exadata X10Mの処理性能を検証!
検証環境
今回は、Exadata X8MからX10Mへのリプレースを想定し、下記の環境で検証しました。
ポイントは、DBの初期化パラメーターCPU_COUNTの値を同一にすることで、Exadata X8M-2 KVMとExadata X10M上の各DBを使った処理性能を比較検証する、という点です。
|
Exadataのモデル |
Exadata X8M-2 KVM EF Eighth Rack |
Exadata X10M HC Eighth Rack |
| DB Server |
ノード数 |
2 |
2 |
| CPUモデル |
Intel Xeon Platinum 8260 CPU 2.40GHz |
AMD EPYC 9334 32-Core Processor 2.70GHz |
| CPUコア数/ノード |
6 |
32 |
| メモリー/ノード |
128GB |
384GB |
| Storage Server |
サーバー数 |
3 |
3 |
| CPUモデル |
Intel Xeon Gold 5218 CPU 2.30GHz |
AMD EPYC 9334 32-Core Processor 2.70GHz |
| CPUコア数/サーバー |
16 |
32 |
| メモリー/サーバー |
192 GB |
256 GB |
| XRMEM容量/サーバー |
1536 GB |
577 GB |
| XRMEM Cache/サーバー |
1501 GB |
563 GB |
| Flashディスク容量/サーバー | 25.6 TB |
13.6 TB |
| Flash Cache/サーバー | 1192 GB |
12668 GB |
| Software |
Exadata System Software |
23.1.3.0.0.230613 | 23.1.8.0.0.231109 |
| OS |
Oracle Linux 8 |
Oracle Linux 8 |
| DB |
19.19 |
19.21 |
| Swingbench | 2.7 |
2.7 |
検証ポイント
X8M-2と比較してX10MはCPUがAdvanced Micro Devices社のAMD EPYCTMプロセッサに変更され、CPUの処理性能が向上しました。そこで当社でも、Exadata X8M-2、X10Mのオンラインおよびバッチ処理でのCPU性能比較の観点で、実際にアプリケーションを動かして高速になるのか検証しました。
なお、オラクル社のExadata X10Mの紹介記事は、「Exadata X10Mの紹介: 卓越したスケーラビリティと大幅に向上した価格パフォーマンス」(オラクル社サイトに移動します)をご参照ください。
オンライン、バッチの処理性能検証(対象:X8M、X10M)
オンライン処理性能検証シナリオ
下記のような設定で検証を実施しました。
| 項目 |
|
値 |
| DB |
初期化パラメーターCPU_COUNT |
6 |
| 初期化パラメーターSGA_TARGET |
8g |
| 初期化パラメーターPGA_AGGREGATE_TARGET |
4g |
| 表領域暗号化 |
無 |
| Storage Server |
XRMEM Cache |
有効 |
| Swingbench |
使用するシナリオ |
SOE(Simple Order Entry) |
| 実行時間 |
1時間 |
| 同時接続ユーザー数 |
1000 |
オンライン処理性能検証結果
「1秒あたりのトランザクション数(TPS)」の平均を比較すると、X8M-2に比べてX10Mはスループットが3.4倍向上しました。
(※下記は、X8M-2の「1秒あたりのトランザクション数(TPS)」の平均を「1」とした場合に、X10Mが何倍であったをグラフにしたものです)
オンライン処理性能検証の「1秒あたりのトランザクション数(TPS)」
「応答時間(ミリ秒)」の平均を比較すると、X8M-2に比べてX10Mは3.4倍高速になりました。
(※下記はX8M-2の「応答時間(ミリ秒)」の平均を「1」とした場合に、X10Mが何倍速かったかをグラフにしたものです)
オンライン処理性能検証の「応答時間(ミリ秒)」
「ユーザープロセスのCPU使用率」の平均を比較すると、X8M-2とX10Mはほぼ同様でした。
| モデル |
ユーザープロセスのCPU使用率(%):平均 |
ユーザープロセスのCPU使用率(%):最大 |
OS(System)プロセスのCPU使用率(%):平均 |
OS(System)プロセスのCPU使用率(%):最大 |
| X8M-2 |
60 |
85 |
19 |
65 |
| X10M |
57 |
70 |
20 |
29 |
オンライン処理性能検証の「CPU使用率」
X8M-2に比べてX10Mは、平均I/O待機時間が40%以上短縮しました。
オンライン処理性能検証結果の考察
X8M-2環境では、CPUの高負荷が原因で下記の待機イベントが発生しています。
・CPU数を割り当てるための待機イベントである「resmgr:cpu quantum」が発生している
・グローバルキャッシュサービス(GCS)の処理遅延によるロード関連の下記の待機イベントが発生している
・gc current block congested
・gc cr block congested
・REDOログ・ファイルのcheckpointが終了していないため、次のREDOログ・ファイルへスイッチする際の
待機イベントである「log file switch(checkpoint incomplete)」が発生している
同様の負荷テストを実施したX10Mでは上記のような待機イベントは発生していないため、X10MのCPU関連の処理性能(トランザクション数、応答時間、CPU使用率)が優れていると考えられます。
バッチ処理性能検証シナリオ
下記のような設定で検証を実施しました。
| 項目 |
|
値 |
| DB |
初期化パラメーターCPU_COUNT |
6 |
| 初期化パラメーターSGA_TARGET |
8g |
| 初期化パラメーターPGA_AGGREGATE_TARGET |
4g |
| 表領域暗号化 |
無 |
| Storage Server |
XRMEM Cache |
有効 |
| Swingbench |
使用するシナリオ |
TPC-DS(Transaction Processing Performance Council-Decision Support) |
| 実行時間 |
1時間 |
| 同時接続ユーザー数 |
1000 |
バッチ処理性能検証結果
「1秒あたりのトランザクション数(TPS)」の平均を比較すると、X8M-2に比べてX10Mはスループットが3.5倍向上しました。
(※下記はX8M-2の「1秒あたりのトランザクション数(TPS)」の平均を「1」とした場合に、X10Mが何倍であったをグラフにしたものです)
バッチ処理性能検証の「1秒あたりのトランザクション数(TPS)」
「応答時間(ミリ秒)」の平均を比較すると、X8M-2に比べてX10Mは119倍高速になりました。
(※下記はX8M-2の「応答時間(ミリ秒)」の平均を「1」とした場合に、X10Mが何倍速かったかをグラフにしたものです)
バッチ処理性能検証の「応答時間(ミリ秒)」
「ユーザープロセスのCPU使用率」の平均を比較するとX8M-2と比べて、X10Mは21%CPU使用率が低い良い結果となりました。言うまでもないことですが、CPU使用率が低いということは、その分処理の余力が大きいということであり、性能が向上したと言えます。
| モデル | ユーザープロセスのCPU使用率(%):平均 | ユーザープロセスのCPU使用率(%):最大 | OS(System)プロセスのCPU使用率(%):平均 | OS(System)プロセスのCPU使用率(%):最大 |
| X8M-2 | 66 | 85 | 21 | 75 |
| X10M | 45 | 80 | 15 | 31 |
バッチ処理性能検証の「CPU使用率」
X8M-2に比べてX10Mは、平均I/O待機時間が大きく短縮する性能差となりました。
バッチ処理性能検証結果の考察
オンライン処理性能検証時と同様にX8M-2環境では、CPUの高負荷が原因で下記の待機イベントが発生しています。
・CPU数を割り当てるための待機イベントである「resmgr:cpu quantum」が発生している
・グローバルキャッシュサービス(GCS)の処理遅延によるロード関連の下記の待機イベントが発生している
・gc current block congested
・gc cr block congested
・REDOログ・ファイルのcheckpointが終了していないため、次のREDOログ・ファイルへスイッチする際の
待機イベントである「log file switch(checkpoint incomplete)」が発生している
同様の負荷テストを実施したX10Mでは上記のような待機イベントは発生していないため、X10MのCPU関連の処理性能(トランザクション数、応答時間、CPU使用率)が優れていると考えられます。
検証に関するまとめ
オンラインの性能検証においては「CPU使用率」に大きな差はありませんでしたが、バッチの性能検証ではX8M-2と比べてX10MがCPU使用率が低い、つまり性能が向上しているという結果になりました。
また、オンライン、バッチのいずれの性能検証においても「スループット」「応答時間」はX8M-2に比べてX10Mが優れた性能結果となり、Exadata X10MではCPUがAMD社製になったことで、Oracle Databaseに最適なプラットフォームとしてさらに性能が向上したことを確認できました。
Exadataを選択肢としてお考えのお客様、導入実績豊富な当社へぜひお気軽にご相談ください。
執筆者情報
2002年入社。 BI、帳票、電子帳票、印刷管理、文字管理、ワークフローなどの情報基盤製品のフィールドエンジニアを経て、2013年からはOracle Databaseのフィールドエンジニアとしてお客様へのプリセールス活動や技術支援を担当。
また、プログラミング等のスキルを活かして業務の自動化や工数削減にも積極的に取り組んでいる。
プライベートでは3児の父。