テストデータ (Test Data)
テストデータとは、機械学習モデルの性能や汎化能力を評価するために使用されるデータの集合です。
モデルの学習には一切使用されず、学習が完了した後に、そのモデルがまだ見たことのない新しいデータに対してどれだけ正確な予測ができるかを確認するために利用されます。
訓練データ・検証データとの違い
一般的な機械学習では、利用可能なデータを通常、「訓練データ(Training Data)」、「検証データ(Validation Data)」、そして「テストデータ(Test Data)」の3つに分割します(ホールドアウト法)。
訓練データでモデルの学習を行い、検証データでハイパーパラメータの調整やモデルの選択を実施します。
最後にテストデータで最終的なモデルの性能を評価します。テストデータでの評価は、モデルが実際の運用環境でどの程度のパフォーマンスを発揮できるかを偏り無く確認するために非常に重要です。
CAEサロゲートモデルにおけるテストデータの活用
CAEサロゲートモデルの構築では、モデルの学習に使用していないCAE解析結果や物理的な実験結果などをテストデータとして使用します。
構築したサロゲートモデルにこのテストデータを入力し、モデルが出力する予測値と実際のCAE解析結果または実験結果を比較することで、サロゲートモデルの精度や信頼性を評価します。
テストデータでの評価結果が良ければ、そのサロゲートモデルは実際のCAEシミュレーションの代わりとして十分に活用できる可能性が高いと判断できますが、逆にテストデータでの精度が低い場合は、モデルの再構築や学習データの見直しが必要となります。