はじめに
本稿では、NTTデータが受託した経済産業省の「平成28年度IoT推進のための新産業モデル創出基盤整備事業(IoT・人工知能技術の活用による物流効率化のための調査)」のプロジェクトを例にとりながら、AI導入プロジェクトでの管理・遂行面での勘所を解説していきます。AI(人工知能)というと幅広い概念ですが、ここでは機械学習として取り扱います。
1.プロジェクト企画
なぜAIを導入するのか、を考える
新聞、テレビ、Webなどメディアを見渡すと毎日のようにAIの記事があふれかえっています。それを見て「うちの会社でもAIやろう。」、「競合ではこんなAIを導入していた。よし、負けずにうちも導入を考えよう。」といった動機でAI導入プロジェクトが始まるケースをよく耳にします。
でも待ってください。なぜAIを導入するのですか?そのようなプロジェクトは単なる技術実証プロジェクト、しかもコストの無駄にしかなりません。企画の段階でどの業務に、どのようなユースケースを想定するのか、その狙いと期待する効果を明確にしておく必要があります。ここは連載の第1回でも特に重要だと触れたところです。
まず動かしてみる
さて、なぜAIを導入するのかが明確になったら、プロジェクト計画に移る前に事前にAIを動かして実現可能性を見ておくことをお勧めします。こうすることで無理難題なプロジェクト、終わりの見えないプロジェクトを避けることができます。
今は簡単に試せるクラウドサービスやオープンソースとして提供されている機械学習ライブラリがたくさんあるため、これらを活用して、サンプルの学習データ、テストデータを使ってどれだけの精度が出せそうかを事前に検証することができます。
2.プロジェクト計画
技術だけの遂行体制ではダメ
プロジェクト計画では、体制をどうするかが悩みですね。ここでは業務チームと技術チームの両輪の体制確立をお勧めします。
よくある失敗プロジェクトでは技術チームだけの体制になっているのですが、これでは技術検証だけでプロジェクトが終わり「で?今の業務がどう変わるのか、改善するのかしないのか、結局出口はどこなのか?」となってその後の普及展開がうまくいきません。
そこで業務チームの出番です。現場部門へのヒアリングなどを通して、AIへの要求仕様を洗い出し、プロジェクト後の普及展開・定着まで見据えて業務変革を推進する役割を担わせます。
データ収集を適切にスケジュール化する
学習データ、テストデータの収集は意外と時間と手間がかかります。当社が受託した経済産業省の「平成28年度IoT推進のための新産業モデル創出基盤整備事業(IoT・人工知能技術の活用による物流効率化のための調査)」では大量のデータを収集しましたが、データの量でAIの精度が大きく変わってしまうことから余裕を見た収集スケジュールを設定し、さらに精度が向上しない場合に備えて追加収集もスケジュールに盛り込みながら進めていきました。
とはいえ、プロジェクトによってはどうしてもデータを集められない、というケースもあるでしょう。そのような場合にはすでに学習済みのモデルを適用する転移学習というやり方もあり、少ない学習データで精度が出せることを当社では実績として確認しています(詳細はここでは紹介しません)。
また教師あり学習で使われるデータへのラベル付けは、データが多いとそれだけ工数がかかります。上でご紹介した経済産業省の事例では、画像の分類を処理するAIなので、画像ごとにラベルをつけていく必要がありました。
最近はラベル付けを請け負う事業者もあるため、場合によっては委託も視野に入れてラベル付けのスケジュールを考えるべきです。
3.プロジェクト実行
AIは無垢である
プロジェクト実行中はAIの精度向上に向けてさまざまな試行錯誤をしていきます。まずは可視化して学習が収束しているかを確認、そこでハイパーパラメータをチューニングする、データ量を増やしてみる、モデルを見直してみる、等何度も計測すると思いますが、教師あり学習においては上で述べたラベル付けが間違っていたら精度は向上しません。
子供に飛行機と電車の写真を見せて「これは飛行機だ、こっちは電車だ」と教えることを考えてみます。何枚も教えたあと、飛行機の写真を電車だと言ったらどうなるでしょうか? 子供は学習中であっても「ちがうよ、これは飛行機じゃないの?」と聞き返してくるはずです。
ですが、AIは無垢なので設定されたラベル通り学習してしまうので、ラベルが間違っていた場合は結果として精度が低いAIになってしまいます。そのため、ラベル付け作業では正確性を担保するために作業支援ツールなどを作る場合がありますが、プロジェクトの目的、収集するデータ等によって対応は異なります。インターネットで公開されているさまざまな学習データセットでも、一部のデータで間違ったラベル付けがされたものがあるので気をつけてください。
後でラベルを変えることもある
教師あり学習では、プロジェクトの途中でラベルを変えたくなることも場合によっては出てきます。上で述べた「平成28年度IoT推進のための新産業モデル創出基盤整備事業(IoT・人工知能技術の活用による物流効率化のための調査)」の報告書では、途中で精度向上を目的としてラベルの変更を行っています。
具体的には異形物としてざっくりラベル付けしていたものを、ビン缶、緩衝材、長尺などより詳細なラベルに見直しを行いました。このとき、すべて人手で一から付け替えしていては大変な労力がかかるので、データとラベルの対応表、対応DBを作っておいて一括変換で対応しました。このような作業は精度向上のために突発的に発生するのですが、計画時からこういうこともある、と想定しておくと慌てずに済みます。
4.プロジェクト完了
AIの精度評価と業務効果の評価をセットで考える
企画の段階で「どの業務に、どのようなユースケースを想定するのか、その狙いと期待する効果」を考えていたと思います。プロジェクト完了時にはAIの精度評価だけでなく、AIを導入することで業務効果が実際にどれだけあったか、定性的、定量的にとりまとめておきたいところです。これができるとその後の普及展開や定着がスムーズに進みます。
* * *
本稿では、AIを導入するプロジェクトにおいて具体的なプロセスを追いかける形で管理・遂行する際のポイントをお伝えしました。
次稿では、AI導入にあたって業務面にフォーカスを絞って検討の勘所をお伝えします。
著者紹介
島野 浩平 (SHIMANO Kohei)
―― 株式会社NTTデータ 製造ITイノベーション事業本部 コンサルティング&マーケティング事業部 ビジネスデザイン統括部 課長代理
一橋大学法学部法律学科卒業(民法・イスラム法を研究)。NTTデータに入社し、主に大手通信事業者様の大規模システム開発において基盤エンジニア、システムアーキテクトとして活動。2014年より現職にて、UXデザイン、サイバーセキュリティ、AIの案件を幅広く手がける。