博報堂テクノロジーズ プロダクト開発センターは21日、過去データを用いた広告運用アルゴリズムのオフライン強化学習や性能検証を行えるPythonライブラリ「SCOPE-RL」を公開した。ソースコードはGitHubに公開、インストールやQuickstatも記載するドキュメントも設置してある。

データ・アルゴリズムを研究する半熟仮想社と東京工業大学工学院経営工学系中田研究室との共同研究で開発された「SCOPE-RL」は、オフラインで新たな方策を学習するフェーズと学習した方策の性能を事前評価するフェーズを一貫して実装できるもので、AIのエンジン部分からフルスクラッチで開発。ログデータなど過去の実績データを用いたオフライン強化学習で広告運用のためのアルゴリズムの学習・評価を行える。

入札額調整や日次の予算運用などマーケティング分野において活用されている強化学習では学習初期段階にロスが発生するため、過去実績データをもとに新たな方策を学習するオフライン強化学習に注目が集まるが、二つのフェーズをひとつで実現するソフトウェアが従来は無かったとその開発背景を述べている。