電化製品などの欠陥製品に対するメーカーの責任を定めた「製造物責任法」。同法は、AIを用いたシステムも適用の対象となる場合がある。また、AIの学習用データは従来のデータ分析とは異なり、かたちを変えて永続する。商用システムにおけるAIの利用は、従来のシステムよりもさまざまなリスクを抱えていると言える。こうしたAIのリスクについてどう考えていけばよいのだろうか。
本稿では、日本マイクロソフトが10月7日に開催したイベント「DLLAB Engineer Days」のなかから、AIデータ活用コンソーシアム理事・副会長/日本マイクロソフト業務執行役員 NTO 田丸健三郎氏によるセッション「知らなかったでは済まされないAIと製造物責任、知財とデータ統制」の模様をお届けしたい。
データ収集からAI活用までのエコシステム、日米の違い
米国での研究開発経験がある田丸氏。まず「データの入手しやすさが米国をはじめとする諸外国と比べて異なる」と日本の状況について説明した。AIに限らず、米国には法律で禁止されていない限り積極的にデータを収集して研究を加速させていこうとする文化がある。また、データ収集だけでなく、社会課題の解決に向けたAI活用までのエコシステムが機能しているという。
一方で日本は「ガイドライン行政による硬直化したビジネス環境が特徴」と田丸氏が指摘するように、機微なデータを積極的に収集/活用しづらい環境にあると言える。エコシステムという観点から見ても、海外データを利用することによってAIモデルに偏りが発生してしまうことなどが課題となる。自然言語や地域、画像データなど、日本固有のデータを必要とする場合は社会実装に至らず研究の段階で止まってしまっているケースも多い。
「例えば日本語をデータとして用いる際に特有の問題として、データが入手しづらいだけでなく陳腐化が早いということがある。テキストデータや音声データだけでは、”やばい”の意味を評価できない。青空文庫に収録されている日本語は現代日本語とは言えない。研究で活用するにはよくても、社会実装したときのクオリティは期待できない。日本語をデータとして活用したい場合には、定期的に収集する仕組みが必要となる」(田丸氏)