理化学研究所(理研)と九州大学(九大)は1月11日、生体内で作り出される代謝産物の濃度を測定し、その経時変化データだけを用いて、「代謝反応ネットワーク」を推定する手法を開発したと発表した。
成果は、理研 植物科学研究センター 代謝システム解析チームの平井優美チームリーダー、同・シユタサ・カンスポーン特別研究員、九大大学院 農学研究院の白石文秀教授らの共同研究グループによるもの。研究はJST戦略的創造研究推進事業チーム型研究「CREST」の一環として行われ、詳細な内容は日本時間1月11日付けで米国オンライン科学誌「PLoS ONE」に掲載された。
代謝はよく耳にする言葉だが、生体内で起こる化学反応のことをいう。体外から取り入れた物質を用いて自身を構成する新たな成分を合成したり、または分解してエネルギーを取り出したりする化学反応である。
代謝はすべての生物が持つ仕組みで、代謝の結果生じる物質を「代謝産物」と呼ぶ。特に植物やある種の微生物は、人間にとって有用な代謝産物(アミノ酸や医薬品原料など)を合成する代謝経路を持つため、これを人為的に改変し効率よく合成させる「代謝工学」が注目されてきている。
生体内のさまざまな化学反応からなる代謝経路は、多種類のタンパク質、つまり酵素を触媒にして行われており、その経路はまるで大都市の地下鉄路線のネットワークのような複雑さだ。さらに酵素は、さまざまな代謝産物によってフィードバック制御を受けており、代謝産物間の関係をさらに複雑にしている。
このため、特定の有用物質の生産量増大を目指す代謝工学では、どの代謝産物が反応してどの代謝産物に変換されるか、その反応はどの代謝産物によって制御されているか、といった「代謝反応ネットワーク」を網羅的に理解することが必要だ。
これまでは、個々の化学反応の仕組みやそれを触媒する酵素の特性を、生化学的な方法で1つ1つ明らかにすることで、代謝経路は少しずつ解明されてきた。しかし、生体内に何百、何千種類もある化学反応を1つ1つ検討することは容易ではない。
一方、近年になって、すべての代謝産物(メタボローム)を網羅的かつ一斉に解析する分析技術が発達し、多くの代謝産物の量と種類を測定できるようになった。そこで研究グループは、代謝産物濃度の実測データだけを用いて、代謝反応ネットワーク全体を1回で推定する方法の開発に挑んだのである。
代謝が安定している定常状態では、各代謝産物の生体内の濃度は一定だ。しかし、生育環境を変化させたり、化合物を投与したりするなどの小さな攪乱を生体外から与えると、各代謝産物の濃度は一時的に変化して、その後、元の定常状態に戻る。この一時的な増減の経時変化は代謝産物によって異なり、個々の代謝産物の代謝反応ネットワークでの位置に基づく結果と考えられるというわけだ。
そこで共同研究グループは、攪乱後の代謝産物濃度の経時変化を測定して、代謝反応ネットワークとその特徴を推定する手法を開発した。具体的には、(1)時系列データをつなぐ近似曲線の補正(「局所回帰」によるスムージング)、(2)時系列データに基づくグレンジャーの因果関係の検定、(3)バイオケミカルシステム理論による代謝反応ネットワークのモデリング、(4)「非線形最小二乗法」によるパラメータ決定、という4つの理論を組み合わせた新たなアルゴリズムだ(画像1・2)。
画像1。開発された4つの理論を組み合わせたアルゴリズム |
画像2。今回の手法の概念図。例えば、代謝産物1~4の経時変化を測定し、得られた実測値だけから代謝反応ネットワークを推定する。「+」は反応を促進する制御を、「-」はフィードバック制御を表す |
まず、代謝産物濃度の経時変化を示す実測データは、生物学的バラつきや解析誤差を含んでいるため、局所回帰を行って各データをつなぐ近似曲線を求める。次に、代謝産物同士は直接的または間接的に相互作用しているため、各代謝産物をほかの代謝産物と組み合わせてグレンジャーの因果関係を検定する。
なお局所回帰とは、取得した狭い範囲のデータに対して、従属変数(例えば代謝産物濃度)が独立変数(例えば時間)にどう関わるかを推定することだ。
その結果、統計的に有意な因果関係があると判断できた代謝産物だけで仮の代謝反応ネットワークを構成する。併せて、この仮の代謝反応ネットワークにバイオケミカルシステム理論を適用し、数式モデルを構築する。このモデルには、代謝反応やその制御関係を表すパラメータが多数含まれている。
バイオケミカルシステム理論とは、細胞内の酵素による触媒反応で構成する複雑な代謝反応ネットワークの特性を明らかにするための理論だ。各代謝産物濃度(Xi)の時間変化を画像3の微分方程式で表す。
画像3の式の右辺の第1項は代謝物Xiのプールへの正味の流入流束(単位時間、単位体積当たりで、その代謝産物が合成される速度をまとめたもの)、第2項は正味の流出流束(単位時間、単位体積当たりで、その代謝産物が分解される速度をまとめたもの)を表し、それぞれ合成、分解に影響を与えるほかの代謝産物濃度の累乗に比例する。
最後に、数式モデル中のパラメータを非線形最小二乗法で決定する。非線形最小二乗法とは、従属変数と独立変数の関係が直線的ではない、すなわち非線形の関係にある測定データに対して、最も適合する曲線を決定する手法の1つだ。測定値と計算値の差の2乗和が最小となるように、両者の関係を表す式中のパラメータを決定し、結果としてそのような曲線を得るというものである。
ここで、ある代謝産物がほかの代謝産物に与える影響の大きさを表す反応次数という複数のパラメータの内、ほかに比べて小さい値となったものについては、その関係性を仮の代謝反応ネットワークから削除し、もう一度数式モデルを構築し直す。この検討を計算が収束するまで繰り返し、最後に残ったパラメータに基づいて代謝反応ネットワークを推定するのである。
実際に、14個の代謝産物でネットワークが構成されることが知られている乳酸菌の解糖系とその周辺の代謝経路に着目し、その内5個の代謝産物濃度の経時変化を既報の論文より取得して代謝反応ネットワークを求めたところ、これら5個の代謝産物のネットワーク内での相対的な位置を再現し、代謝反応ネットワークを正しく推定できたのである。さらに、これまで同定されていなかったフィードバック制御の存在の可能性も見出した具合だ。
また、数式モデルに基づいて解析したところ、グルコースから「グルコース-6-リン酸」に至る反応が、乳酸生合成の速度を決める主要な代謝経路であることも推定することに成功した(画像4・5)。
画像4(左)と5は、乳酸菌がグルコースを解糖するときの代謝反応ネットワーク。画像4は、14個の代謝産物で構成される既知の解糖系とその周辺の代謝経路。この内5個の代謝産物(赤字)の実測データを用いて、代謝反応ネットワークを推定した。
画像5は、5個の代謝産物の経時変化データから推定した代謝反応ネットワーク。乳酸が増えるとグルコースがグルコース-6-リン酸になる反応が抑制されるという、これまで同定されていなかったフィードバック制御の存在の可能性が見出された(赤点線矢印)。また、グルコースからグルコース-6-リン酸に至る代謝経路が乳酸生合成の速度を決める主要な代謝経路(青矢印)と推定できたという。
乳酸菌がグルコースを解糖するときの代謝反応ネットワーク。画像4(左)は、14個の代謝産物で構成される既知の解糖系とその周辺の代謝経路。画像5は、5個の代謝産物の経時変化データから推定した代謝反応ネットワーク |
微生物を用いた有用代謝産物の生産は、これまで産業界でも実用化されてきた。しかし、代謝反応ネットワークの全体を解明し、理論的に代謝経路を設計する研究はまだ始まったばかりだ。
また、地球温暖化の問題が近年顕著になってきており、植物の光合成能力を最大限に活用し、二酸化炭素を資源にさまざまな有用代謝産物を生産することが期待されている。しかし、植物の代謝反応ネットワークは微生物よりもさらに複雑で、その解明のための研究手法の開発が求められているところだ。
よって、研究グループは今回開発した手法について、微生物や植物を用いた代謝工学の発展に大きく貢献すると期待できると述べている。