前回までに、現在の人工知能ブームの中心にあるディープラーニングの本質や、実務に導入する際にビジネスで「使えて」「投資効果」のある目標精度(要求精度)を定めるべきこと、ただし、目標精度はトレーニング用の正解データの量・質次第なので、事前にコストが見積もりにくいことを説明しました。
精度には、「適合率」と「再現率」があり、その両方について妥当な要求水準を目標としないと、人工知能を役立てられずに終わりがちです。AI活用にあたり、適合率と再現率、そしてそれらのビジネスにおける意味(なぜその数字が必要なのか? その数字なら役に立つのか?)を論じないのは自殺行為。なぜなら、これらなしにはROI(Return Of Investment)が全く議論できないし、技術ロードマップを描いてもあまり意味のないものになるからです。目標精度が少し違っただけで、開発コストが10倍以上変わってくることも十分あり得ます。
目標精度を立てるには、AIを使いこなす人間の作業フロー、すなわち人間がどんなUIでどんな中間処理や最終判断を行うかを精査し、詳述する必要もあります。目標精度があって初めて、AI構築に必要なコスト(分母)の大半を占める「正解データ作り」のコスト見積もりの必要最低条件が描けます。
「必要最低条件」としているのは、その上にさらに、少量データを用いた小規模実験などによって実際に目標精度がどこまで高められるかを予測しながら、スパイラル式にコスト見積もり精度を上げていく必要があるからです。
同じようにデータを集めたとしても、学習データの属性や構造、入出力・処理モデルの決定次第で、精度向上の見込みや実際の推移、ひいては開発コストが変わってきます。
したがって、実データを保有する現場において、研究開発の進捗状況を監視しながら、冷静にROI、つまり「成果を活用した経済的ご利益」/「投入コスト」が1以上になる損益分岐点を、より精度高く予想していく事業家センスが求められます。「生データからROIの洞察まで」――これが、AI時代に求められる情シスの役割かもしれません。
ROIを決める数式の分子に当たる「成果を活用した経済的ご利益」を求めるには、その新事業構造の「寿命」を読む、市場予測も必要です。そのため、利用者や市場ニーズの将来を予測できるような抜群のマーケティングセンスも求められます。
とは言え、従来の縦割り組織では、そうした市場予測をするのは困難です。エンジニアの資質だけでは不十分であり、精度評価による仮説の定量検証を職業的に行ってきた研究者の資質・経験も不可欠となります。加えて、できれば制度評価を行うのと同じ人物が、部門横断的に事業主視点に立ち、AI導入の可否を判断できるのが望ましいと言えるでしょう。
情シスのミッションの1つ「監視」は、ディープラーニングの得意技
拙著「人工知能が変える仕事の未来」(発行:日本経済新聞出版社)では、ディープラーニングによる「監視」的なサービスが直接収益に結び付きそうな新規事業の例として、次の1ダースほどの項目を挙げています。
- 交差点などでの通行量の測定
- 監視カメラ映像での不審者などの異常の自動監視と通知
- ヘルスケア・医療向けに広く浅く予備的診断・モニタリング
- 小売り店舗での売れ行き状況、ディスプレイの乱れの監視
- さまざまな機器の異常の検知、判定
- 食材や料理の認識、素早い照合による、客と店、料理とのマッチング
- 運転中(含む自動運転)の窓外で見つけたオブジェクトの認識
- スマホで撮影した草、木、花、茸、各種動物、魚類などの名前を確かめる教育目的
- 監視カメラが捉えた自動車の車種を認識
- 写真中のランドマーク(例:タワーの固有名)を認識し知識検索の上、場所を特定
- さまざまな分野の製品のメーカー、型番を推定(ただし、これらの文字が写っていないとき)
- 人の顔画像から年齢、性別等の基本属性を認識(例:MS社 how-oldサービスと同様)
- 車載カメラ、日本語OCR、がん検出の目安
また下図は、画像の分類と特徴的な映り込み、レイアウトの検出に加えて食べ物の標準カロリーを知識として蓄積しカロリーを回答する「Im2Calories」(上段右端)、出力がより高精細になる(情報量が4倍に増える)アップコンバーター「waifu2x」(下段右端)の例を挙げたものです。
図の左上にあるような商品ディスプレイの乱れの検出や、上下中央の医療用画像などは、各々「異常監視系の応用」と分類しても良さそうです。「情シスのお仕事」としてだけでなく、業務の多忙さを軽減するための予防措置としても、異常(やその予兆)の監視は重要だと言えるでしょう。
監視のわかりやすい例としては、「HDDアクセス時のデータの誤り訂正頻度からクラッシュの予兆を探る」などがありますが、そうした機能の使い勝手に関しては、人間が過去のデータやデグレード曲線などのモデルに当てはめて、適宜統計処理を施した専用ソフトに軍配が上がるかもしれません。
しかし、さまざまな資源の利用パターンや部門・個人の利用状況など、モデルも理論もなく、予測もつかない状況では、画像化などを施したパターンの特徴をディープラーニングによって自動で捉えることで、認識・分類できるようになります。これにより、さまざまなITの負荷状況などを常時監視できるようになれば、インシデントの発生を未然に防いだり、発生時に迅速に対策を打ったりできるようになるのではないでしょうか。
ITIL(IT Infrastructure Library)に関しても、ディープラーニングによる常時監視を前提に、効率化とサービス水準、サービスカバレージの向上を図りつつ、人員削減が図れるようになるかもしれません。AIを前提としたITILを考えておくと、さまざまな業務フローの分解(unbundle)と再構築(rebundle)のヒントや示唆が得られそうな気がします。これができれば、AIを主体的に導入し活用する情シスが、AIを導入したサービス全般のモデリングに大いに貢献したことになるでしょう。