シミュレーション以外でもスパコンを活用

日程の最後に行われた国立情報学研究所の五條堀教授の講演で、最初のヒトゲノムの解読は20年あまりの時間とアポロ計画にも匹敵する費用が掛かったが、ジーンシーケンサーの性能向上は著しく、現在では1000人分のゲノム解析を2年間で終えるというプロジェクトが開始されている。

そして、さらに高速のシーケンサーの開発が行われており、目論見通りに行けば、ヒトゲノムの解析が2分で可能になるという。このようなシーケンサーからは膨大な情報が出てくる。

現在、DNAデータバンクには2000億塩基の情報が格納されているが、これが急速に増加することになる。このような大量のデータから意味のある結果を見出すためのデータ処理技術が無ければ、宝の持ち腐れになってしまうという。つまり、生命科学には、シミュレーション以外にも、巨大データベースとそこからのデータマイニングというスパコンの必要な分野がある。

東大の宮野教授をリーダーとするデータ解析融合研究開発チームは、このような大量データを処理して有用な結果を見出すソフトウェアの開発を行っている。遺伝子と疾患や薬物反応などのデータを集めても、どの遺伝子が効いているかは容易には分からない。この問題に対して、遺伝子間の相互作用の関係を推定しグラフ的に表す遺伝子ネットワークを作成するソフトウェアを開発する。これにより、遺伝子と薬物反応の関係などが分かりやすくなり、創薬ターゲットなどの把握が容易になると期待される。

そして、 2008年10月に京大の石井教授をリーダーとする脳・神経系研究開発チームが設立された。脳は、神経細胞から局所回路、脳の各種の領域、脳全体という階層構造となっているが、この階層をボトムアップとトップダウンの解析を融合して理解しようとしている。ただし、ヒトの脳は複雑すぎるので、蚕蛾がフェロモンに反応する臭覚系の情報処理を研究対象としてチャレンジする。