富士通研究所は10月16日、データベースと検索内容を暗号化したまま照合できる秘匿検索技術を強化し、暗号化されたデータベースから元データの類推を防止することで、より安全に照合できる技術を開発したことを発表した。

暗号化されたデータベースでも、公開された統計情報などと比較することで、登録数の一致などから元データを推定される危険性があるが、今回開発した技術は、データベースに最小限のダミーデータを追加することで、データベース上の登録数を攪乱し、元データの類推を防止することが可能だという。

これにより、クラウドなどで管理される、パーソナルデータや機密データを暗号化させたデータベースを、さらに安全に活用することが可能になるとしている。

例えば、病名、医薬品、血液型といったデータの項目ごとにグループを作り、そのグループごとにダミーデータを入れていき、各グループ(例::血液型)の要素(例:A型、B型、O型、AB型)の数がそれぞれ均一になるようにダミーデータを登録していくことで、それぞれの要素がデータベース上ではすべて同じ数で出現し、類推をすることができなくなるという。

グループ内の要素の数が均一になるように、グループごとに最小限の数のダミーデータが作成されるため、データ量の増加を抑えることが可能。検索結果に含まれるダミーデータの件数は、独自のルールで作成されたフラグを照合することで容易に除外できるため、利用者には処理された後の正しい検索結果が提供される。

  • データの類推を防止する技術

同技術を活用し、2000項目から成る診察記録10億件をデータベースに登録したところ、データ量の増加を元データの9倍以内に抑え、統計情報と登録数が一致せず類推できない状態で照合ができることが確認されたという。

同社は今後、データの匿名化技術やプライバシーリスクの評価技術など、富士通や富士通研究所のセキュリティ技術と組み合わせて提供していくことを検討していく。まずは、医療分野においてデータ利活用の実証実験から検証を進め、2020年度までに医療情報のデータ利活用ソリューションの実用化を目指す。