北海道大学(北大)は8月3日、例えば、開いているか/閉じているか、結合しているか/離れているか、といった有限個で連続的でない飛び飛びの値を持つ分子の時系列データから、分子の状態をネットワークという表現を用いて客観的に評価し、分子が将来取り得るデータ出力を予想する新しい解析手法を開発することに成功したと発表した。

成果は、北大電子科学研究所の李振飈准教授、同・小松崎民樹教授らの研究チームによるもの。研究の詳細な内容は、米国東部時間8月2日付けで「Physical Review Letters」に掲載された。

通常、医師は患者の心拍数の時系列データを測ることにより患者の病状を診察したりする。仮に、その時系列データ以外の、例えば、性別、年齢、体温、既往症などの如何なる情報も得られないとした時、どのようにして客観的に患者の状態を判断できるのだろうか? 時系列データは1次元の、非常に限定された情報であるため、それらの評価には恣意性が入り込む余地が高いことが知られていた。

李准教授らが今回開発した数学的な手法は、分子の状態をネットワーク(人のつながりやインターネットなどと同じ)という表現を用いて表し、分子の時系列データからネットワークを構成するノード(WWWではURL、人間社会では人)がどれくらいの数存在し、どのノードとどのノードが強くつながっているかを客観的に評価するというものだ。

考え得るすべてのネットワークにおいて、観測されたデータが保証していない情報がどれくらい組み込まれているかを定量化する新しい指標を考案。その指標を最小化する(データに忠実、かつ最も客観的な)ネットワークを時系列データから抽出するアルゴリズムを開発することに成功した形だ。

李准教授らは、手始めにこの手法を一分子酵素反応の一分子計測データの解析に適用。その結果、反応する相手の基質分子の濃度に依存してネットワークが動的に変化することや、今回の研究成果で得られるネットワークを使うことによって、どのようなデータを取得すると正しいネットワークに最も近い答えを導き得るかに関する知見が得られることなどを明らかにした。

現在、この解析手法は、分子の時系列データからできるだけ客観的に分子の状態を同定し、分子が将来取り得る状態を予想すると共に、実際にデータを計測する実験研究者に対してデータ取得上の新たな指針の提案にもつながるものとして期待されている。

(左)有限個で連続的でない飛び飛びの値を持つ1分子時系列データ。(中)時系列データが持つ統計情報(滞在時間統計)。(右)データによって保証されていない情報を最小に抑えた最も客観的なネットワーク(各ノードは分子が取り得る個々の状態を、各矢印付きのエッジはその状態間の遷移を表している)