科学技術振興機構(JST)、東京大学、東京理科大学、国立がん研究センター(国がん研)は8月29日、生物医学画像を自動分類するソフトウェア「カルタ」の開発に成功したと発表した。
成果は、東大大学院 新領域創成科学研究科の朽名夏麿助教、同・桧垣匠特任助教、同・馳澤盛一郎教授、東京理科大 理工学部の松永幸大准教授、国がん研 東病院の山口雅之ユニット長、同・藤井博史分野長らの開発グループによるもの。研究は、JST研究成果展開事業(先端計測分析技術・機器開発プログラム)の一環として行われた。また研究の詳細な内容は、英国時間8月28日付けで英国科学雑誌「Nature Communications」オンライン速報版に掲載された。
遺伝子・タンパク質などの分子レベルから、細胞内外の微細構造、細胞、組織、器官、個体、ひいては地球レベルまで、生命現象のモニタリングでは画像化(イメージング)技術が不可欠になっている。そして、顕微鏡による細胞診断、CT、PET、MRI、内視鏡など、イメージング技術の発達に伴い、近年、生物医学画像データの多様化と大規模化が進んでいる。しかし、多様なイメージング機器から得られる画像データは複雑であるため、現状では、実務経験の豊富な限られた医師や研究者の目視による画像分類が行われている状況だ。
その結果、画像診断医や専門家の負担が大きく、画像診断に時間がかかる原因となってしまっている。研究および医療現場のこうした状況を改善し、さらに主観的判断や診断ミスを防止するためにも、データの信頼性や再現性を維持した客観的な自動画像分類法の開発が求められているというわけだ。
また、基礎・応用研究分野においても、大量画像の高精度・自動分類法の開発が待ち望まれている。例えば、創薬や機能性物質の開発に必須な候補物質・化学物質の生体影響評価やスクリーニングでは、細胞形態の解析や生死判定を客観的に行う必要性があるためだ。
こうした基礎・応用研究の現場で用いられる画像については、画像の種別や分類目的ごとに、個別の自動評価システムが開発されていた。しかし、顕微鏡で同じ細胞について明視野像と蛍光像のような異なる画像を取得した場合、それぞれの像を分類するためには異なる分類ソフトウェアを開発し、分類する必要がある。
そのため、個別のソフトウェア開発に加え、分類結果の比較などにともなって煩雑なデータ処理が生まれるなど、多くの時間と労力が必要となってしまう。膨大で多種多様な画像を、自動かつ高精度で分類できる方法を開発すれば、これらの問題が解決できると期待されているのである。
開発グループは、これまでに各種画像分類法の開発を行っており、2007年10月から2010年9月までJST バイオインフォマティクス推進センター(BIRD)事業における「創造的な生物・情報知識融合型の研究開発」の開発課題「進化型計算と自己組織化による適応的画像分類法の開発」において、汎用性と精度を兼ね備えた「半教師付き学習アルゴリズム」を考案し、国際特許を含む複数の特許を出願してきた。
その後、2010年10月から、引き続き、JST 研究成果展開事業 先端計測分析技術・機器開発プログラム「生物画像のオーダーメイド分類ソフトウェアの開発」プロジェクトを通じて、半教師付き学習アルゴリズムの改良と、その高精度・高速化に取り組んできたという状況である。この5年越しの技術開発の結果、開発グループは今回、多種多様な生物医学画像を高速かつ高精度で自動分類することができる能動学習型ソフトウェア「カルタ」の開発に成功したというわけだ(画像1)。「カルタ」はどんなイメージング機器にも搭載できる汎用性を持つことに加え、専門家の画像分類効率を格段に向上させることを成し遂げたのである。
ちなみに「カルタ」とは、Clustering-Aided Rapid Training Agentの略だ。ユーザーの指示で分類する様子が、日本の伝統ゲームである「かるた」の読み札に合わせて絵札を取る様子に似ていることから、名付けられたという。
従来の画像分類ソフトウェアとカルタの違い。従来の画像分類ソフトウェア(画像1:左)は、開発コストが高く、汎用性の低い画像分類しかできなかった。カルタ(画像2:右)では、開発コストが低く、精度と汎用性の高い画像分類ができる |
カルタは、「自己組織化マップ(SOM)」による画像の「クラスタリング」を介して、専門家(ユーザー)の意見を繰り返し学習することで、研究や検査目的にあった的確な分類基準を自動的に検討する(画像3)。
クラスタリングに用いる特徴量は自由に入れ替えることが可能であり、遺伝的アルゴリズムを使用して最適な分類を達成した段階で自動的に検討作業を止め、その結果をコンピュータ上に表示す。
画像3は、カルタの概略図。ユーザーが教えた分類目的にあった最適な特徴量の組み合わせをクラスタリングの繰り返しによって能動的に学習するアルゴリズムを実装している。クラスタリングの反復中に、ユーザーから追加のアドバイスを受けることも可能だ。
そして、実際に各種バイオ画像を分類・判定することで、カルタの性能を実証。まず、判別が難しい2種類のがんについて核磁気共鳴画像法(MRI)で画像を取得し、カルタを用いて分類した(画像4)。
今回の分類対象となる肉腫由来のがん細胞「S180」と乳がん由来のがん細胞「FM3A」から形成された腫瘍を撮像した286枚のMR画像だ。これらのMR画像から2種類の腫瘍を見分けることは困難なため、従来は、画像診断医が1枚ずつ目視で分類し、診断を下していた。今回、カルタを用いて分類した結果、2種類の腫瘍を由来別に、高精度で分類することに成功したのである。
この結果は、がんの画像分類においてもカルタが高い分類性能を発揮でき、画像診断医の負担軽減や診断支援などに貢献できると期待させるものだ。
画像4は、MRIにより取得された腫瘍画像のカルタによる分類。肉腫由来のがん細胞S180と乳がん由来のがん細胞FM3Aを19個体のマウスに移植して形成された腫瘍のマウスMR画像286枚(上2枚:MR画像例)を、カルタによって分類。
カルタは画像分類結果をタイルマップ(下・左)と円グラフマップ(下・右)で表示する。その結果、カルタは左側にFM3A、右側にS180の画像群を分類した。マップの格子点には数枚から数10枚の画像が分類されている。
タイルマップは分類された画像群の中で、代表的な画像を示す。円グラフマップは分類群の中で、FM3AとS180がどのくらいの割合を示すか表示している。円グラフの大きさは分類された画像枚数に比例する。
次に、基礎研究分野で重要であるタンパク質の細胞内局在解析や特定タンパク質の発現を低下させた細胞表現型の評価、蛍光画像と明視野画像の細胞生死判定などについて、従来法(1枚ずつ目視で判断した場合)と分類・判定精度を比較した。
その結果、カルタを使用した場合(画像5)の判定精度は、目視による従来法を上回り、判定速度についても2倍以上にスピードアップすることができた(画像6)。さらに、植物の生育状況のスクリーニングにも活用できることから、農業や環境分野にも応用可能であることが示された(画像7)。
これらの結果は、カルタのイメージング機器への搭載により、画像の種類を問わず、細胞を用いたリード化合物探索や毒物評価の省力化と高速化に貢献できることを示している。
画像5は、カルタを用いた細胞死(アポトーシス)判定のモニター画面。ヒト子宮頸がん細胞について、カルタを用いて生きた細胞とアポトーシスにある細胞を分類した結果、96.9%の精度で分類することに成功した。カルタを利用することで、特徴量の抽出が困難な明視野画像でも実用精度での分類が可能になったといえる。
従来は、シグナル/ノイズ比が高い蛍光画像が、主に自動分類の対象となっていた。その場合は、画像を得るための測定機器や撮影対象の違いに応じて分類に必要な特徴量を抽出し、個別にソフトウェアを構築する必要があったのである。分類性能はソフトウェアのできによって大きく左右されるため、精度のよい分類結果を得るためには多くの時間と労力が必要となってしまう。
画像6は、専門家の画像判定へのカルタ画像分類の効果。専門家が目視で蛍光画像判定に要した時間(左)と判定精度(右)とを、カルタを使用しない従来法(青)とカルタ使用法(赤)とで比較が行われた。専門家3人ともに判定時間は半分以下になり、判定精度はカルタによる画像分類をした方が優れていた。この結果は、カルタが優れた画像診断支援ソフトウェアであることを示している。
画像7は、植物(ダイズ)の画像分類。カルタにより植物の生育状況を自動で評価した例だ。健全に生育している植物(赤)と生育が滞っている植物(青)が分類されている。カルタは広範囲の生物学的モニタリングや評価システムを初め、自動化された植物工場にも導入可能だ。
今回、開発に成功した生物医学画像の分類ソフトウェア「カルタ」は、高齢化社会の到来に伴う画像診断の急増に直面している日本の医療・臨床現場の省力化に大きく貢献するものと期待されるという。さらに、今回の成果はあらゆる画像分類に利用可能であることから、基礎研究のほか、創薬や毒性検査、農業などの産業分野に加え、環境分野などにも応用が可能だ。
また、カルタは国産に限らず海外製のイメージング機器にも搭載することができる。顕微鏡や内視鏡に代表される医療機器など、日本の画像機器開発は世界トップレベルだが、画像分類においても国産技術であるカルタが世界標準となることも期待されると、研究グループはコメントしている。