ZOZOテクノロジーズの研究開発組織「ZOZO研究所」は9月2日、同所研究員が研究において使用している大規模データセット「Shift15M」および実装基盤をオープンソースとして公開したと発表した。
「Shift15M」は、ファッションアプリ「IQON」に投稿されたコーディネートを基に構成された大規模データセット。「Shift15M」は、IQONのサービス提供期間である2010年から2020年までに投稿されたコーディネート約255万件のほか、これらのコーディネートを構成する約1,500万件のアイテムに関する特徴量、アイテムカテゴリに関するデータやコーディネート投稿への「いいね」数などの関連データも含む。
同時に公開される実装基盤では、コーディネートデータの年ごとに異なる傾向を認識し、その変化によって生じるデータ分布のシフトを再現実験で確認することが可能。これにより、ファッションの流行を正確にとらえ、研究の発展に役立てることができるとしている。
また、回帰問題、分類問題、集合マッチングなど、データ分布のシフトが生じる条件の下でさまざまなタスクを検証するためのコードも整備されている。
ファッションに関連するデータは、流行の変化による影響を受け、分布シフトと呼ばれる数理的現象が生じると考えられている。分布シフトの検証は、AI技術の実用性に関わる重要なテーマである一方、検証に用いる実用的なデータセットの不足により、学術界におけるファッション分野の研究の進展はこれまで制限されていたという。
そこで、同研究所は分布シフト研究の発展を支える新たな研究基盤として、保有する実データで構成された大規模データセット「Shift15M」と実装基盤を公開することにしたとのことだ。