日立製作所は3月9日、個人に関する情報を暗号化したまま、安全に匿名化する技術を開発したと発表した。これにより、安全にパーソナルデータを匿名化できるため、匿名加工情報の利活用ニーズに対応していくという。
個人が特定できないようにするパーソナルデータの匿名化技術としてはk-匿名化技術が注目されているものの、これまでは暗号化データをそのまま匿名化することはできず、一度暗号化を解除する必要があるため、リスクになっていた。今回の日立の発表は、そのポイントを克服したという。
具体的には、k-匿名化技術では値が異なるデータを同じデータに集約するツリー構造を利用し、下の階層から上の階層へデータを集約していた。ただ、このケースでデータを暗号化した場合、集約前の下の階層データが暗号化によって解読不能となるため、ツリー構造を作成できなかった。
今回の新技術では、暗号化状態を維持したままデータ比較を行う独自の検索可能暗号技術を活用。比較して同じ値だと判定された暗号化データの数を集計し、この結果を用いてツリー構造を生成する。このツリー構造は、暗号化データのうち、集計結果の件数が少ないほうを下の階層に、件数が多いほうを上の階層としており、集約することによってデータ情報量が減る影響を抑えた。
なお、暗号化処理を施した状態でデータ処理を行うと、通常の場合と比べて処理速度が極端に低下するが、今回の技術で、データ処理におけるオーバーヘッドの増加を30%にとどめ、実用的な処理速度を確保できたという。また、より高い安全性を確保するために、データ暗号化のための暗号鍵と、暗号化されたデータの匿名化暗号鍵は異なるものを利用する。これにより、匿名化前の暗号化データが流出するケースがあっても、暗号化解除の復号鍵はデータ提供者のみが保有するため、安全性を担保できるとしている。