データ同化:そのインパクトを3Dで実感する
情報・システム研究機構 統計数理研究所 樋口知之 様
科学技術振興機構(JST) 中村和幸 様

はじめに:データ同化とは

現在、地球規模の複雑な現象の高精度予測のために大規模なシミュレーションが行われているが、その規模がスパコンクラスになるとシミュレーション実験だけでは、設定したパラメータや境界条件が適切かどうかもよくわからない。さらに突き詰めると、シミュレーションのモデル自体も一つの理想化されたものにすぎないわけで、それが正しいかどうかを検証しなければならない。
そこで登場するのが"データ同化"---英語では"Data Assimilation"という---である。データ同化は、時空間観測・計測データと最先端の大規模なシミュレーションモデルを統合し、適切な初期値・境界値やパラメータ等を実際の現象をなるべく再現するように決める作業である。この作業結果の分析から、シミュレーションモデルの性能と妥当性を系統的に診断することが可能になる。

参考文献[1]、参考文献[2]を参照。

即時双方向性とフィルタリング技術

そもそもシミュレーションは、初期条件と境界条件をいったん与えてしまえばデータ無しに独自に計算が進んでいく。一方データ解析は、データが与えられてからはじめて作業が始まる。サッカーでいえば、シミュレーションはフォワード、データ解析はディフェンス(バック)のようなものである。それらを同時にやることに意味があり、データ同化はこれを実現する技術である。サッカーに限らず攻撃と守備間の連絡がうまくいくことが勝利への鍵であるが、データ同化でも同じ事がいえる。データとシミュレーション間の実のあるコミュニケーションのためには、お互いに自己主張をする中で相互理解を少しずつ進め、深い関係を築くことが大切である。シミュレーションのしっぱなしではダメで、一方ただデータ解析だけで議論していくのも明らかに健全でない。
データ同化は、フォワードモデルとバックワードモデルを時々刻々と、それもシステマティクにつないでいく。その計算基盤を与えるのが状態空間モデルにもとづくフィルタリング計算技術で、その研究開発では統計数理研は誇るべき経験と実績がある。フィルタリングにはオンライン型とオフライン型がある。分かりやすく言えば、オンラインは会話によって、またオフラインは郵送による手紙の交換によって意思疎通を図るようなものである。我々データ同化グループでは、アンサンブルカルマンフィルタ、粒子フィルタ、混合カルマンフィルタを中心に、オンライン型である逐次データ同化手法の研究とその応用を行っている。

参考文献[3]、参考文献[4]を参照。

CTと津波データ同化

データ同化実験には、シミュレーションモデルと実際のデータが必ずセットとして必要である。津波データ同化実験では、浅い水の表面にできる波を記述する方程式系である、浅水波方程式を用いた津波伝搬のシミュレーションモデルを利用し、データとしては験潮所での潮位計による津波に関係した潮位データを用いた。
ここで問題になるのは海底地形である。というのも、海底の深さが正確にわかれば、津波の到達時間は浅水波方程式により比較的高い時間精度で求まる。ところがこの海底地形に関しては、実はそれほど高精密のデータベースがあるわけではない。この海底地形情報の不確実性が津波を介して潮位計データに表出してくるが、これを逆手にとれば、潮位計データから海底の深さを推定することが期待できる。これは、地震波を複数の観測点で観測し、地震波動データから地殻の内部構造を推定する逆問題解法と推論メカニズムは同じで、同じ理屈は医療用CT(Computed Tomography)にも見ることができる。

参考文献:
[1] データ同化HP http://daweb.ism.ac.jp/
[2] 樋口知之、統計数理は隠された未来をあらわにする:ベイジアンモデリングによる実世界イノベーション(監修・執筆)、東京電気大学出版局
[3] 中村 和幸, 上野 玄太, 樋口 知之, データ同化: その概念と計算アルゴリズム, 統計数理, Vol. 53, No. 2, 211-229, 2005.
[4] K. Nakamura, T. Higuchi, and N. Hirose, Sequential Data Assimilation : Information Fusion of a Numerical Simulation and Large Scale Observation Data, Journal of Universal Computer Science, Vol. 12, 608-626, 2006.