「情報可視化」について 〜大規模データの全貌を一画面でみる「平安京ビュー」〜
お茶の水女子大学 理学部情報科学科 伊藤 貴之 准教授

「十二単ビュー」

これは製薬会社の薬物実験の可視化に応用した例です。
薬物の実験では、肝臓の中に酵素があって、何種類かの酵素と薬の元となる化合物との反応性を調べます。聞いたところによると、一種類の酵素に反応するのもダメだし、全部の酵素に反応するのもダメとか、いろいろ条件があるらしいです。ここでは5種類の肝臓の酵素を5つの色に割り当てていて、5色1セットで1つの化合物との実験結果を示しています。それぞれの色は、反応する場合は明るく、反応のない場合は暗くなります。
たとえば、左上のグループに属する薬物は、ほとんど紫色に反応していることがわかります。しかし、いくつかの薬は、別の1種類の酵素にも反応しています。グルーピングは、分子構造と関係しているので、まだ世の中に現存しない化合物でさえ、構造式が判れば、だいたいどんな酵素に反応するかが予測できます。このように可視化によって絞込みができれば、実験回数を減らすことができ、製薬会社にとって大きなコストダウンが期待されます。
これは、もともとは、京都大学の薬学部の先生のアイデアで、その先生と僕と製薬会社の共同で研究しています。
この様に、5〜6種類くらいの酵素の実験値を、虹の色みたいに6色の色に割り当てて表すと、平安京ビューがカラフルに見えるので「十二単ビュー」と呼んでいます。


(図3)「十二単ビュー」

「クラスタード・アルバム・サムネール」=略して「CAT」

これは、大量の画像を平安京ビューを用いて一覧表示したものです。例えば、ズームアップすると、その中には、1枚1枚の写真があるんですが、この辺が紫色の花のグループ、黄色の花のグループとか、この様に花の種類でグループ化されています。スケールダウンしていくと、それぞれのグループを代表する画像が一枚で表示され、さらにスケールダウンしていくとさらに代表画像を表示していくという事をします。その時その時に画像の解像度をみて大きさを調節し、その代表の画像1枚だけを表示するか、全部1つ1つの画像を表示するかを調節して、分類された画像を表示すると言うことをやっています。
このように、平安京ビューでは、多くのフォルダに散在するファイル情報を単純に1つ1つ機械的に表示したものに比べて、感覚的な検索が容易になります。
今は、これと似た研究で音楽をアイコンにして、明るい曲、暗い曲にそれぞれ別のアイコンを割り当て、例えばアーティスト毎に、と言うような感じでフォルダで区切られた形で表示するというような事をやる等、割とパーソナルユースの方面にも最近は進出しようとしています。
これは、最近、始めた研究ですが、やっぱり学生はそういう話が好きなんですね、僕より学生のほうが先行してます(笑)。デジカメやiPodが出てきて、ファイルの分類のような問題は、学生達の方が、より身近に感じているのだと思います。こちらの名前は、単に学生が猫が好きだからと言うことです(笑)。


(図4)CAT「クラスタード・アルバム・サムネール」で表示された花のファイル

さいごに

よく平安京ビューの論文で、他の可視化の技術と何が違うんだってよく言われるんですけど、身の回りによくある、非常に不均一な階層をもつ情報においても、とにかく情報全体を見渡せるんです。あるフォルダにはものすごくたくさんあって、あるフォルダの中にはものすごく少ないとかそういうような情報においても、最終的には均一に画面いっぱいに埋め込むような事をするわけですね。
また、まだ名前をつけて発表はしていませんが、平安京ビューの画面に時系列情報を付加した形で表示して、過去に何が起こったかを振り返るものがあり、今は昔と言うことで「今昔物語」にしようと思っています。うちの研究室では、平安京ビュー以外の研究に従事する学生にも、研究成果に名前を付けるということを奨励しています。その方が呼び易いからです。

編集後記

平安京ビューは幅広い分野で利用実績があります。 平安京ビューの可視化手法は、今後もいろいろな方面の技術分野に応用することが可能な技術であると感じられました。