京都大学医学部附属病院がんセンターでは、集積するがん患者約5,000例の実臨床データ解析を進めている。治療パターンや患者の副作用、予後などの一連の時系列データを解析することで、がん医療におけるビッグデータからの知識発見と予測医療の方法論開発に取り組んでいるのだ。

4月20日から22日にかけて東京ビッグサイトで開催された「ヘルスケアIT 2016」では、「ビッグデータからの予測医療と個別化医療」と題した講演に、京都大学大学院医学研究科 臨床システム腫瘍学 特定教授の奥野恭史氏が登壇。京大病院がんセンターにおけるビッグデータの解析事例を紹介しながら、予測医療と個別化医療の可能性について言及した。

医療ビッグデータ解析の2つの課題

京都大学大学院医学研究科 臨床システム腫瘍学 特定教授の奥野恭史氏

基礎研究から応用(創薬など)に至る過程でのボトルネックとして、奥野氏は「”人を科学する方法論”の欠如」を挙げた。

「動物実験や細胞の実験はできても、人体実験(探索研究)はもちろん認められていません。そのため、まずは人を”観察”します。そこから出てきたデータを解析・理解し、それを元に予測して、結果を検証・介入するという『人を科学するプロセス』が必要になるのです」(奥野氏)

「人を観察する」というのは、生体内情報のような臨床情報、生体分子情報などの生体試料、そして日常生活情報を取得することを指す。このうち、日常生活情報はセンシング技術の向上もあって最近取得しやすくなっており、ビッグデータ活用の加速にもつながっている。

「人を対象にしてモニタリングしたさまざまな観測結果が、ビッグデータとなります。ひととおりデータはそろうようになったので、これをビッグデータ解析やシミュレーション、AIといった最新のテクノロジーを駆使して解析し、知見を得ることへとつなげていく試みが今、進められています。ただし、肝心の解析手法が現状では未成熟な点が課題です」と奥野氏は説明する。

京都大学医学部附属病院がんセンターでは、日々臨床現場で発生する時系列医療ビッグデータに基づく、新たな個別化医療と創薬の実現を目指している。そのなかで見えてきた医療ビッグデータ解析・実臨床データ解析の問題点の1つとして、基礎研究と臨床試験、実臨床で、データの背景分布が異なる点が挙げられる。

まず基礎研究は、完全にコントロールされて共通化した実験条件の下で行われ、臨床試験も、特定の条件を満たす被験者のみを対象とするため、かなりコントロールされた条件となる。これに対し、実臨床ではさまざまな年齢、疾患、症状の日々の診療記録が対象となり、意図的なコントロールは及ばない。そのため、実臨床データには偏差の問題が生じてしまうのである。

もう1つの課題が、通常、患者を対象としたビッグデータ解析では相関関係の知見しか得られないため、因果関係などのメカニズム解明には至らない点だ。容易に介入実験ができないため、計算で可能な限り深掘りできるよう、介入研究の代わりにシミュレーションを利用したバーチャル介入試験も注目されている。

「メカニズムはわからなくても、予測さえできればいいというのであれば、今は人工知能を利用できるのが大きいでしょう。いずれにせよ、偏差と相関関係しか得られないという問題から、今のところは『ビッグデータを解析したら、すぐに必要な知見が得られる』という段階には至っていません」と奥野氏はコメントした。

余命3カ月の患者を77%の正答率で予測可能に

時間変動する実臨床データ解析の成果として、奥野氏は京大病院がん患者の検査値NLR(好中球数とリンパ球数の比率)を用いた従来統計手法(生存時間解析)による予後予測について解説を行った。対象となった患者数は5,285人で、そのうち死亡者数は2,683人、生存期間の最大は16年で平均2.2年となっている。

奥野氏らは、死亡日を起点に並べることで、死亡日から初診までの検査日程を逆算して検査値の特徴的傾向を洗い出した。その結果、患者が死亡する1年前ぐらいから、NLRの値が恒常的に高い状態に陥るという傾向が見えてきたのだという。そこからさらに分析を進め、ALB、LDH、好中球数の3つの検査値で予測モデルを構築することに成功。余命3カ月の患者を77%の正答率で予測可能になったのである。

「『臨床データを使えば、こういうことができる』というのが見えてきました」と奥野氏は説明する。

では、創薬の観点から見るとどうだろうか。患者の状態は刻一刻と変化しているが、そこにはある分岐点があり、この分岐点を越えると死に向かい出すことがわかった。それならば、創薬における開発過程で大切なのは、身体の中で何が起きているのか、なぜある人は死に向かい始め、ある人は向かわないのかという分岐点を割り出すことになる。

「人を科学する視点の1つは、こういったところにあるのでしょう」(奥野氏)

もう1つ奥野氏が手がけたケースとして、臨床ビッグデータを使った、より短期的な予測というのがある。それは、検査値変動のシミュレーション予測モデルの構築だ。

抗がん剤の代表的な副作用に、骨髄抑制がある。患者が骨髄抑制の状態になると、好中球数などの血球数の慎重な経過観察が必要となり、数値が一定以下になると造血因子製剤を投与して意図的に上げねばならなくなる。この対応がうまくいかないと、発熱性好中球数減少症となって死に至ってしまう。そこで奥野氏らは、臨床ビッグデータを使ってシミュレーション予測モデルを構築することで、体内状態の短期変動を捉えるようにしたのだ。

奥野氏は言う。「患者サンプルによる病態メカニズム解析のポイントは、できるだけ同じ状態の患者サンプルを選択した実験を行うことにあります。ビッグデータに対する期待値は高いですが、こうした方法論の確立を今、しっかりやっていかなければならない段階にあるのです」

>> メカニズム解明に向けてスーパーコンピュータ「京」を活用