CYBERNET

CAEを学ぶ

構造解析

Ansys Mechanical に搭載されたGPU機能とベンチマーク結果

Ansysの標準ベンチマークテストを利用しGPUにより実際どれだけのパフォーマンスが得られるかを検証

活用が広がるGPU

GPU(Graphics Processing Unit)はその名が示すとおり従来はグラフィックスに特化した演算装置でしたが、大量の演算を並列に処理できる特長を活かしてCAEの計算パフォーマンスを向上させる取り組みが行われてきました。Ansys Mechanicalは2010年にリリースされたVer13.0よりGPUに対応しています。

本稿では、Ansysの標準ベンチマークテストを利用し、GPUにより実際どれだけのパフォーマンスが得られるかを検証した結果をご紹介いたします。

CPUコア数が少ないときにGPUが威力を発揮

本ベンチマークでは9種類の標準ベンチマークモデルを用意し、Ansys Mechanical APDL18.1でベンチマークを実施しました。比較検討したプロセッサは①CPU only、②CPU + NVIDIA Tesla K40c、③CPU + NVIDIA Quadro GP100です。

CPUは2、4、8、16、32、44コアで計算時間を計測し、CPU onlyの2コアで計算した時間を基準とした①~③のスケーラビリティをまとめました。(このグラフは標準ベンチマークテスト9ケースの平均値を示しています)

CPU onlyの場合、32コア使用時に6.22のスケーラビリティが得られていますが、CPU+K40cであれば、16コア使用時に5.65 、CPU+GP100であれば、16コア使用時に6.33に達しています。

このグラフの黄枠で囲んだ箇所、すなわちCPUコア数が少ない場合に特にGPUの威力が発揮されることがわかります。CPUが4コア以下ならばGPUを追加するだけで2倍以上の高速化が望める点は有効であると考えられます。

一方で、十分なCPUコア数がある場合(このグラフでは32コア以上)は、GPUを追加してもパフォーマンスの向上が見られなくなっています。このことから、GPUは常に有効な手段ではなく、状況に応じた選択が求められると考えられます。


Ansys、ならびにANSYS, Inc. のすべてのブランド名、製品名、サービス名、機能名、ロゴ、標語は、米国およびその他の国におけるANSYS, Inc. またはその子会社の商標または登録商標です。その他すべてのブランド名、製品名、サービス名、機能名、または商標は、それぞれの所有者に帰属します。本ウェブサイトに記載されているシステム名、製品名等には、必ずしも商標表示((R)、TM)を付記していません。 CFX is a trademark of Sony Corporation in Japan. ICEM CFD is a trademark used by Ansys under license. LS-DYNA is a registered trademark of Livermore Software Technology Corporation. nCode is a trademark of HBM nCode.