リモート解析

ANSYS Workbench は共通のプラットフォームという特性を活かした様々な解析支援ツールを提供しておりますが、リモート解析もその一つの機能です。

リモート解析とは、計算実行環境を自由に選択できる、いわゆる“ジョブキューイングシステム”と呼ばれる機能のことです。また、他社製のジョブスケジューラ(例えばLSF、PBS、UGE等)を統合することで負荷分散を考慮したクラスタ環境へジョブ投入する仕組みを構築することも可能です。
これにより、リソースの効率的な運用が実現します


リモート解析のメリット

概要

ANSYS Workbench Mechanical の解析実行と解析のジョブ管理をANSYS Workbench Mechanical とは別プロセスで行ないます。
ANSYS Mechanical ソルバーは「計算サーバー」上で実行します。
解析のジョブ管理は「リモート解析マネージャ(RSM)」で行ないます。

  • 「クライアント」はHPCリソースの「ランチャーサービス」に対してジョブを送信
  • ジョブの管理はHPCリソースの「ジョブスケジューラ」が実施
  • ジョブはジョブスケジューラが決定したHPCリソースの「実行ノード」で実行

ジョブ投入前に ANSYS Workbench プロジェクトファイル(拡張子 wbpj)として保存が必要です。計算終了後は「結果の取得」で結果を取り込みます。

ジョブが終了すると、ただちに解析マネージャへデータが転送され、計算サーバー側のデータは削除されます。 ユーザの指示で解析マネージャから結果データをクライアントに転送します。

RSMとは

ANSYSリモート解析マネージャ(RSM)は、ANSYSアプリケーションからジョブスケジューラなどで管理されたハイパフォーマンス・コンピューティング(HPC)リソースを利用するための環境を構築するソフトウェアです。

17.2以前のRSMは、「基盤」「ジョブの管理・実行」「モニタリング」の機能が一体となったツールでした。
18.0以降のRSMは、下記のような構成に変更されています。
・RSMは「基盤」機能のみ
・ジョブの管理・実行機能は「ANSYS RSM Cluster」として提供
・ジョブのモニタリング機能は「ジョブモニタ」として提供

ジョブスケジューラとは

メモリやCPUなどのリソースを公平に利用するため、複数のジョブ(プログラムやバッチ処理)の実行・終了の監視・報告などを行うソフトウェアのことです。ユーザが計算サーバへジョブを投入し、リソースに空きがある場合はジョブが即時実行されますが、計算サーバが混み合っている場合は、他のジョブが終了するまでそのジョブは保留されます。

ANSYSアプリケーションとRSMの統合

RSMは下記ANSYSアプリケーションと統合されており、解析結果や更新は、ANSYS Workbench や Mechanical または EKM から RSM に送信できます。

RSMがサポートするアプリケーションおよびソルバ
 CFX
 Fluent
 Icepak
 Mechanical ※1
 Mechanical APDL
 Polyflow
 陽解法動解析
 機構解析 ※2
 ※1 Samcefソルバ及びABAQUSソルバは除きます。
 ※2 ANSYS RSM Cluster(ARC)のみ送信可能です。

ジョブスケジューラの統合

RSMとジョブスケジューラを統合することでRSMのジョブを管理します。ジョブスケジューラとしてはANSYS RSM Clusterまたは他社製品ジョブスケジューラを利用することが可能です。

ANSYS RSM Cluster(ARC)

18.0以降で利用可能なRSM専用ジョブスケジューラです。他社製品ジョブスケジューラが利用できない場合にご検討下さい。
※基本的なHPCリソースの管理機能のみ提供します。
※他社ジョブスケジューラ製品を置き換えるものではありません。

17.2以前のRSMに含まれていたジョブ管理機能では対応できなかったHPCリソースの管理に対応します。

実行ノードの下記リソースを設定することができます。
・利用するコア数
・ジョブ毎のメモリー
・ディスクの上限

キューとして下記リソースを設定することができます。
・実行ノード
・利用ユーザ
・同時実行数
・利用可能な時間帯

複数の実行ノードを利用した分散並列計算を運用できます。

RSMシステムのプラットフォーム

下記プラットフォームの組み合わせをサポートします。
※ Linux のクライアントからWindows用ランチャーサービスへのジョブ送信はサポートされていません。

設定手順の概要

設定作業

RSMの利用環境を設定する場合、ファイル共有方法などのHPCリソースに関するシステム運用を決定する必要があります。

  1. HPCリソースの管理者による一通りの設定作業の後、RSMクライアント利用者による設定作業が必要です。
  2. HPCリソース管理者は、HPCリソースを構成するRSMとジョブスケジューラの設定を行った後、RSM設定情報をRSMクライアント利用者に提供します。
  3. RSMクライアント利用者は、管理者から提供された設定情報を用いてHPCリソースの利用設定を実施します。

ジョブスケジューラ:ARCの場合

他社ジョブスケジューラ製品が利用できない場合、ARCをセットアップすることでRSMを利用したHPC利用環境を構築することが可能です。以下、HPCリソース管理者による作業項目とクライアント利用者の作業項目をお示しします。

HPCリソース管理者による作業
 1.RSMのインストール

 2.HPCリソースの設定
  2-1.RSMランチャーサービスの設定
  2-2.ARCの設定

 3.RSMの設定
  3-1.利用するHPCリソースの設定
  3-2.RSM設定情報の共有

RSMクライアント利用者による作業
 4.RSMの設定
  4-1.共有されたRSM設定情報の取り込み
  4-2.利用するHPCリソースの設定
※詳細手順は ANSYS ヘルプ「リモート解析マネージャユーザーガイド」をご参照下さい。

RSMとARCのシステムサービス

RSMとARCに関するシステムサービスを紹介します。

RSM関連-ランチャーサービス※
  クライアントからジョブを受けてジョブスケジューラにジョブを投入するサービスです。

ARC関連-ARCMasterサービス※
  ARCのジョブを管理するサービスであり、実行ノードに対してジョブの開始・停止を制御します。

ARCNodeサービス
  ARCのジョブを実行するサービスであり、ARCMasterから指定されたジョブを実行・停止します。

※ランチャーサービスとARCMasterサービスは同じノードで稼働させる必要があります。

ARCを利用する際のRSMのサービス設定

HPCリソース構成に対するサービスの構成例です。

クラスタ構成例

“スモール”なシステム構成例をお示しします。

  • 2ノード構成
  • 計算ノード数:1
  • クラスタ管理ノードはファイルサーバ機能と兼務
  • ノード間をアプリケーション用ネットワークで直結

運用方法としては以下を想定しております。

  • プリポスト処理と解析処理を分離
  • 解析処理を計算ノードへ集約化
  • プリポスト処理はリモートデスクトップ(RDP)経由でクラスタ管理ノードへアクセス
  • ジョブ投入はプリポスト用マシン(もしくは管理ノード)から実施
  • ジョブスケジューラはOS及びお客様のご要望に応じて選択
  • 生成されたデータはなるべく移動しない運用を提案

リモート解析構築・運用モデルケース

導入前の状況

A社では、Workstation を4台設置しており、機材毎にANSYS Workbench Mechanical、CFX、FLUENT及び2Way FSIをGUI上でジョブ実行していました。

問題点

  • ANSYS 社製品の各ジョブは WS 単体性能が上限
  • W/S の管理はエンドユーザである社員に任されていた
  • W/S 間は業務系ネットワークで接続されており、データ通信に支障を来す恐れがあった

提案内容

ジョブスケジューラ機能とファイルサーバ機能を兼務したクラスタ管理ノード1台と実行ノード1台を設置、2台構成でジョブ管理するシステムを構築して“スモール”なシステムとしての運用体制を提案。将来を見据えて、段階的に増強できるようなスモールな内容です。

運用の状況

A社では、下記手順でジョブ投入による運用を実施していただいています。この場合、クライアントPCで一貫してプリポスト処理が出来る点が長所です。

  1. クライアントPCでMechanicalを起動します。
  2. ヘッドノードの共有ディレクトリにwbpjファイルを保存します。
  3. RSMを介して実行ノードへジョブを投入します。
  4. 適切なタイミングに実行ノードでジョブが実行されます。
  5. ジョブが終了すると、結果データを取得し、ポスト処理を行います。

こちらでご紹介したようなリモート解析のジョブ投入システム構築を、サイバネットシステムがサポートいたします。ご興味をお持ちの方は、お気軽に弊社までお問い合わせください。

ジョブ投入システム構築

CONTACT US

ご購入・レンタル価格のお見積り、業務委託についてはこちら。

お問い合わせ

ページトップへ