理化学研究所(理研)と九州工業大学は1月22日、モデル植物であるシロイヌナズナの未知のゲノム領域から、サイズが小さくさまざまなアミノ酸が決まった順番で繋がるタンパク質のペプチドをコードする短い遺伝子を7000個以上を発見し、さらにこれらの遺伝子の一部は形態形成に関与することを明らかにしたと共同で発表した。

成果は、理研 植物科学研究センター 機能開発研究グループの花田耕介客員研究員(九工大 若手研究者 フロンティア研究アカデミー准教授)、同・樋口美栄子研究員、同・植物ゲノム機能研究グループの松井南グループディレクターらの共同研究グループによるもの。研究の詳細な内容は、米国科学雑誌「米科学アカデミー紀要(PNAS)」に1月21日の週に掲載される予定だ。

全DNA配列(ゲノム)の解読は、生命現象の理解の基盤となるため、さまざまな生物種のゲノムプロジェクトが実施されている。しかし、ゲノム配列を読み取っただけでは生命現象の理解には不十分であり、個々のDNA配列の機能や役割を検討する必要がある。特に、アミノ酸配列をコードする遺伝子は、細胞の主要な構成成分であるタンパク質の種類を決定するため、そのような遺伝子領域を同定することが重要だ。アミノ酸配列情報は、DNAから転写されたRNAの配列情報からなる。そのため、RNAへの転写領域の解読もゲノム解読と同時に実施されている次第だ。

近年のRNAの網羅的な転写解析によって、これまでタンパク質をコードする遺伝子領域ではないと考えられていた領域にも、RNAに転写される領域が多数存在することが明らかになってきた。

こうしたRNA転写領域には、100アミノ酸以下という短いアミノ酸配列からなるペプチドをコードする短い遺伝子があり、近年、さまざまな生物種で、生命の維持に必須な機能があることが明らかとなってきた形だ。

そこで研究グループでは、これまでにゲノムの多くが解読され、遺伝子の間隙が短いため機能解析がしやすいモデル植物のシロイヌナズナを用いて、ペプチドをコードする新規の短い遺伝子の同定や、それらの機能解析に挑んだ。

今回の研究では、アミノ酸をコードするDNA、RNA配列のパターンを抽出することが可能な機会学習法を開発、さらに既知遺伝子が存在しないところに短い遺伝子を予測する方法も併せて開発し、シロイヌナズナの解析を行った(画像1)。その結果、未知のゲノム領域から、新規に7901個におよぶ短い遺伝子領域が推定されたという。

解析方法は、具体的には既知のアミノ酸をコードする配列(coding配列)とそれ以外の配列(non-coding配列)を集めてきて、その塩基組成を学習させ、未知の「オープンリーディングフレーム」のうち、coding配列のパターンに類似しているものを、新規遺伝子の候補として同定した形だ。なお、オープンリーディングフレームとは、ペプチドあるいはタンパク質に翻訳される可能性があるDNA・RNA領域のことである。

画像1。情報解析を通じて既知遺伝子が存在しないところに短い遺伝子を予測する方法

次に、これらの短い遺伝子の候補が、遺伝子として機能しているかを確認するために、マイクロアレイを作製し、16カ所の組織、9つの異なるストレス条件下、8つの異なる光条件下という合計33の条件下で、RNA発現強度が調べられた(画像2)。

その結果、弱いRNA発現は7000個以上がカウントされた。特に、非常に強いRNA発現は2099個で確認し、遺伝子としての機能が確認できた(画像3)。研究グループは、これを「ペプチド大陸」と名付けている。

画像2(左)は、新規に推定した短い遺伝子の33条件下のRNA発現(HanaDB-AT)。一番左が植物の全体図で、その隣に16カ所の組織を示している。右上が日射時間や当てる光の違いによる8つの異なる光条件、右下が乾燥、塩害などの植物に与える9つの異なるストレス条件。RNA発現の強度を色で表し、赤色ほど非常に強い発現、黄色になる程弱い発現を示す。画像3は、同定した短い遺伝子の位置(HanaDB-AT)。赤い部分が短い遺伝子の位置。HanaDB-ATにて公開中

さらに、7000個以上の中から473個を無作為に選び、これらがコードするペプチドを過剰発現させた変異体を作製し、観察した結果、約10%にあたる49個の過剰発現体で野生型とは異なる異常な形態を示すことが判明した(画像4)。

画像4。短い遺伝子の過剰発現体が示す表現型のカテゴリ

長い遺伝子を対象とした網羅的な過剰発現解析では、1.4%程度の割合でしか形態形成に関わる遺伝子を発見できないといわれている。今回の結果は、未知のゲノム領域に、形態形成に関係するペプチドをコードする短い遺伝子が数多く存在する可能性を示唆しているという。

今回発見された形態形成に関係する49個の遺伝子の機能の詳細を調べるため、それらの遺伝子が発現する組織や条件のすべてに共通して発現している既知の遺伝子群を観察したところ、植物ホルモンに関わるペプチド遺伝子が、共発現していることがわかった。この結果は、今回同定された遺伝子がコードするペプチドが、なんらかの植物ホルモンに関わる機能で働くことを示唆しているという。

また、33の条件下における49個の新規の短い遺伝子と既知遺伝子の発現量については、今回構築されたデータベース「HanaDB-AT」で、誰でも自由に利用可能だ。また同データベースは、新規に推定した短い遺伝子と同じ条件で発現している遺伝子を推定する共発現解析や、ゲノム上の位置を確認するアプリケーションも提供しているのが特徴である。

今回の研究で発見された短い遺伝子は、シロイヌナズナ以外の植物にも保存されていることもわかったという。そのため、今回発見した「ペプチド大陸」の中から、生産性や環境耐性に関わるものが同定できると、そのペプチドを利用し、バイオマスエネルギー産業や農業分野に大きな貢献を果たす可能性があるという。また、動物においても生命維持に関わる数多くの短い遺伝子が存在することが予想され、医療も含めてさまざまな生物分野への展開が期待できると研究グループではコメントしている。