日本電信電話(以下、NTT)は11月27日、暗号化したままデータ分析を行う秘密計算技術において、複数データのデータ結合およびグループ化集計(統計値計算)を行う方法を開発したことを発表した。この成果は、NTTコミュニケーションズ(NTT Com)が提供中のサービス「析秘」に内部演算として既に実装している。
今回開発した方法は、2つの部分からなるという。データ結合部分では、実測値で従来の 3.95倍の速度を達成し、グループ化集計部分では重要な統計値である中央値の計算を実現したとのことだ。この手法により、秘密計算による複数組織のデータの統合・分析が、これまでよりも多様な統計値を対象に、より短時間で実行できるようになる。
従来技術では、計算可能な統計量が平均値や最大値、最小値などに限られていた。しかし、当該技術により、複数の組織が持ち寄ったデータを暗号化したまま、双方のデータに共通して含まれる人物に関し名寄せしたデータを作成(データ結合)し、名寄せ後のデータに対して統計値計算(グループ化集計)を行うという一連の分析を、これまでよりも多様な統計値を対象に実現できるようになった。
例えば、クレジット利用額のような極端な値が含まれるデータに対して、楽曲データを販売している会社Aとクレジットカード会社Bが、好みの楽曲とクレジットカード利用額の関係に着目した分析(グループ化集計)を行い、双方の持つデータを誰にも明かすことなく名寄せを行い、好みの楽曲のジャンルごとのクレジット利用額の統計量を計算できる。
100万件の顧客データ同士を名寄せしてから、好みの楽曲のジャンルごとのクレジット利用額の5種類の統計値(件数、総和、最大値、最小値、中央値)を計算するまでの一連の処理について、9秒で完了するという実験結果も得ているそうだ。