奈良先端科学技術大学院大学(NAIST)は、慶應義塾大学(慶応大)、東京大学、京都大学との共同研究により、RNAの塩基配列データからその折り畳み構造を予測する、従来の常識を打ち破る超高速ツールセットの開発に成功したと発表した。

成果は、NAIST情報科学研究科の加藤有己助教、慶応大の佐藤健吾講師、東大の浅井潔教授、京大の阿久津達也教授らの共同研究グループによるもの。研究の詳細な内容は、7月発行の「Nucleic Acids Research」電子版に掲載された。

RNA(リボ核酸)は人間を含めた生物の細胞の中に存在し、DNAのゲノム(遺伝情報)からタンパク質の情報をコピーしている鎖状の高分子だ。RNAは通常1本鎖で存在し、4種類の塩基A(アデニン)、C(シトシン)、G(グアニン)、U(ウラシル)からなる文字列(塩基配列)で表現される。

RNAの多くは、選択的に塩基同士で水素結合することにより「2次構造」と呼ばれる折り畳み構造を形成。RNAの2次構造の中には画像1のような複雑な部分構造を含むものが少なからず存在することがわかっていて、複雑な2次構造を含めてRNAの構造を解析できることは、より精度の高い機能推定につながると期待されている。

画像1。複雑な2次構造の例。丸は塩基を、破線は水素結合による塩基対を表す。複雑性はRNA1本鎖を直線で表した時、塩基対を表す異なる色の破線が交差することに起因する

このRNAの未知の機能を解明するには、強い相関関係がある構造の解析が不可欠だ。コンピュータによりRNAの塩基配列データからその折り畳み構造を予測するアプローチは、時間とコストがかかる構造解析実験技術を補完する有力なツールとされている。

また近年になって、遺伝子の働きの抑制など、重要な生命活動の機能を発揮するRNAが相次いで見つかっており注目を集めるようになってきた。例えば、あるRNAがタンパク質の鋳型である別のRNAと結合することで、タンパク質の合成を抑制する現象などだ(画像2)。

画像2。RNA間相互作用の例。上側のncRNAはほかのRNAを制御する役割を持ち、標的となる下側のRNAと水素結合する(赤色の破線)

このような現象はRNA間相互作用と呼ばれているが、相互作用の仕組みを解明するためには、2つのRNAから構成される結合構造を解析することが重要になる。ここでも、構造の解析が重要というわけだ。

これまでいくつかの研究グループにより、RNA2次構造予測問題及びRNA間相互作用予測問題に対して、コンピュータを利用したさまざまなアプローチが提案されてきた。しかし従来法では、複雑な構造を解析する時には計算効率が極端に悪くなるという欠点があったことから、それらを考慮せずに解析するか、あるいは考慮する代わりに時間をかけて計算するかの2通りのアプローチを採ってきた。つまり、扱える構造のクラスと計算効率にはトレードオフの関係が存在しているというわけだ。

今回の研究ではこのトレードオフの関係を打破すべく、複雑な構造をうまく分割して解析しやすい問題を解き、結果を重ね合わせることで元の構造を復元するというアプローチが採用された。

具体的には、複雑な構造の近似確率分布の下で予測構造の精度の期待値を最大化する問題を、「しきい値カット」と呼ばれる技術を用いた手法「整数計画法」で解くことにしたのである。整数計画法はモデル記述能力と拡張性に優れるものの、通常は計算時間を長く要する手法だ。

しかし、今回の研究では期待精度を最大化するという原理を融合させることで、高速に計算できる整数計画法を実現することに成功。実際の構造データを用いた計算機実験結果では、開発手法は既存手法と比べて同等以上の予測精度を達成したが、特筆すべきはその実行時間の短縮速度にある。

ツールの計算速度は世界最速レベルで、予測精度もほかの手法と比べて勝るとも劣らないことが実証されたという。例えば、従来法と比べて構造予測では最大で1万2千倍、相互作用予測では最大で4万倍の高速化を実現した。

研究グループは、今回の研究で開発されたツールはまさにそのような時代のニーズに合ったものであると確信しているという。今回の研究の特徴の1つは、大規模なハードウェアの能力に依存するのではなく、斬新なソフトウェアの開発だけで高速性を実現したことだ。したがって、開発手法は個人用の標準的なPCでも高速に動作することが可能である。

なお研究グループは今回のツールの高速性に対し、RNAの大規模な遺伝子領域の予測や、相互作用のための標的RNAの探索に真価を発揮し、生命科学の発展だけでなく、医学や薬学の分野に貢献することが期待されると述べている。現在、こうした問題に応用する研究を着々と進めていることも併せてコメントしている。

また今回のツールは2種類の予測ができ、1つは従来法で無視されることが多い複雑な部分構造を含めたRNA全体の構造予測で、精度の向上と新たなRNA遺伝子の発見につながる。もう1つは、RNAが部分的に結合した際の相互作用の予測で、RNAによる生体内制御機構の解明が期待されているとした。

これらRNA2次構造予測とRNA間相互作用予測のための開発ツールは、単体のプログラムとしてダウンロードして利用できるほか、両ツールを広く公開するため、それらを実装したWebサーバを開発し、商用目的以外であれば誰でも自由に利用することが可能としている(画像3)。

画像3。出力スナップショット