理化学研究所(理研)は6月21日、既存のマイクロアレイなどの生命科学データベースを活用して、植物の遺伝子発現を制御するDNA配列(プロモーター)を人工的に設計するWebアプリ「PromoterCAD」を開発したことを発表した。
同成果は、理研環境資源科学研究センター バイオマス工学連携部門 合成ゲノミクス研究チームの松井南チームリーダーらと理研情報基盤センター 統合データベース特別ユニットの豊田哲郎ユニットリーダーらの研究グループによるもので、詳細は英国の科学雑誌「Nucleic Acids Research」オンライン版に掲載された。
生物の体を構成する組織・器官の構造や機能は、DNA配列から合成される遺伝子産物(RNAやタンパク質)によって決められており、それらの遺伝子産物は、遺伝子からRNAに写し取られたり(転写)、RNAからタンパク質へ変換(翻訳)されたりして合成される(遺伝子発現)。
プロモーターは、遺伝子発現の工程の1つである転写を正常に制御するためのさまざまなタンパク質(RNA合成酵素のRNAポリメラーゼや転写因子)を結合させることが知られており、特定の組織だけに働く転写因子(組織特異的転写因子)が特徴的な配列であるモチーフ配列に結合することで、特定の組織や時期に合わせて遺伝子発現を調節することも判明している。
こうした過去の研究から、さまざまなタイプのモチーフ配列が同定、予測されており、既存のプロモーターにそうしたモチーフ配列を自由に組み入れることで、人工的に有用なプロモーターを設計しようとしたり、生物や細胞に含まれる分子やシステムを再現し、人工的に新たな分子/システムを生み出そうという合成生物学という分野が近年、盛んに研究が進められるようになってきた。
中でも、その応用研究の1つとして、遺伝子が発現するタイミングや場所を自在に制御した植物や微生物を用いて、バイオマスを効率的に工業レベルで生産することを目指した開発が進められており、これまでにDNA配列設計用のアプリも複数開発され、設計部品となるプロモーター、タンパク質配列、シグナル配列などの標準的なパーツの整備が進められている。
しかし、そうした対象は主に微生物やウィルスで、植物や動物などの高等生物の研究は未開拓といえる状況であり、標準的なパーツの整備が遅れていたほか、合成生物学で用いられるアプリの多くは標準的なパーツ以外のデータを利用することができないため、利用できるデータが限られており、これまでプロモーターを自由にデザインすることはできないという課題があった。
そこで、研究グループは今回、モデル植物であるシロイヌナズナにおいて遺伝子を発現する組織やタイミングの調節を可能にする人工プロモーターを設計できるアプリの開発を試みたという。
具体的には、利用者の目的に応じたプロモーター設計ができるように、データ登録システム「LinkData.org」上に、シロイヌナズナのプロモーター設計のパーツとなるデータベースを構築。シロイヌナズナのプロモーターのモチーフ配列が登録された既存のデータベース2種類「ATTED-II」、「PPDB」と、既存のマイクロアレイによる網羅的な遺伝子発現データベース2種類「AtGenExpress」、「DIURNAL」を組み合わせることで、計4種類のデータベースを構築し、LinkData上に登録したほか、プログラミングの専門知識がなくても容易にプロモーター設計を行えるように、プルダウンメニューやボタン操作・グラフ表示に従ってアプリを実行できるユーザーインタフェースを用意し、それらを組み合わせることで、シロイヌナズナにおいて遺伝子発現する組織やタイミングの調節を可能にする人工プロモーター設計Webアプリ「PromoterCAD」を完成させたとする。
PromoterCADは、天然プロモーターで同定されているモチーフ配列を合成プロモーターに導入する戦略を用いることで、人工プロモーターの設計が可能なアプリで、利用者の設定した遺伝子発現条件に応じて、関連の強いと予想されるモチーフ配列のデータを表示し、人工プロモーター設計の素材として選択することが可能だ。
モチーフ配列の組合せによる人工プロモーター配列のデザイン戦略。(A)は天然プロモーターに存在するモチーフ配列を人工プロモーター配列の同じ場所に取り入れる方法。(B)はゲノム配列の統計解析に基づいて、機能的に働くと予測される位置にモチーフ配列を取り入れる方法。(C)は(A)または(B)に加えて、モチーフ配列を複数コピー取り入れる方法 |
格納されているマイクロアレイデータには、2万1000個の遺伝子について20種類の慨日条件と79種類の成長条件において計測された合計142万が収録されており、このデータを利用してモチーフ配列を選択するために2つのツールも用意したという。1つは、特定の組織や時期によって最大・最小の発現レベルを示す遺伝子を見つけ出し、その遺伝子が持つモチーフ配列を提示するツール「MotifExpress」、もう1つは、指定した条件において、慨日振動の振幅が最大となる遺伝子を見つけ出し、その遺伝子が持つモチーフ配列を提示するツール「MotifCircadian」で、いずれも利用者は簡単、迅速に適切なモチーフ配列を取得することが可能だと研究グループでは説明しており、利用者が自由にデータを追加したり、アプリをカスタマイズすることも可能だという。
「PromoterCAD」のユーザーインタフェース(MotifExpressツールを使用している例) |
「PromoterCAD」のユーザーインタフェース(MotifCircadianツールを使用している例) |
なお研究グループでは今後、果実を形成する植物であるトマトや哺乳類のモデル動物であるマウスのデータベースなども整備し、アプリに追加していくことで、より汎用性の高いプロモーター設計アプリに発展させていく予定とするほか、植物のみならず動物にもDNA設計の対象を拡大できれば、環境面だけでなく医療面でも合成生物学を応用することが可能になることが期待されるとコメントしている。