米DataRobotは、エンドツーエンドのデータサイエンスプロセスを自動化するエンタープライズ向けAIプラットフォーム「DataRobot」の新機能として、「AIカタログ」と「次世代の自動特徴量エンジニアリング」を新たに追加した「v5.2」をリリースした。

AIカタログは、同社が2月に買収したCursorの技術を応用したもので、組織によるデータの発見、理解、活用の効率化を支援するデータコラボレーション・プラットフォームが基盤となっている。

データセットの検索、異なるソースの共有、それらに関する理解と再活用を促進する資産へのコメントやタグ付けなどの機能を活用することが可能。また、特徴量エンジニアリングの準備および管理機能も追加されており、新しいプロジェクトにおいて共有と活用が可能となるため、データサイエンスの生産性が向上するという。

今回、既存のプラットフォームに検索機能とコラボレーション機能が統合されたことで、ユーザーは自身が管理しているAI環境から信頼できるデータ資産に安全にアクセスすることが可能となる。厳密なアクセス権の管理を適用しているほか、データリネージ(追跡)を提供することで、安全かつ信頼性の高い機械学習アプリケーションを実現しており、データ管理のアドバンテージとして、データレイク、データベース、クラウド、オンプレミスなど、あらゆるロケーションに格納されているデータに対しても、アクセスすることができる。

特徴量エンジニアリングの自動化については、ユーザーが複数の関連データセットから新たな特徴量を自動的に抽出することが可能になり、データサイエンスのワークフローで最も労力と時間を要するステップと考えられてきました。DataRobotはこのプロセスを自動化することでデータセットの準備に要する時間を短縮し、機械学習モデルのパフォーマンスを向上するという。

  • 「特徴量エンジニアリングの自動化のイメージ

    特徴量エンジニアリングの自動化のイメージ

これにより、ユーザーは複数のソースから新しいデータを迅速に発掘し、シンプルなビジネスルールを適用した多数の有用な特徴量を作成することが可能なことに加え、これらの特徴量をアルゴリズムごとに変換する作業を自動化できるという。

さらに、今回のリリースでは機械学習オペレーション(MLOps)も含まれており、MLOpsは組織全体での機械学習モデルのデプロイ、監視、管理を行う新たなソリューションとして、9月に発表。DataRobot MLOpsを導入すれば、ユーザーは単一のダッシュボードで複数のモデルをデプロイすることができ、作成あるいはデプロイのロケーションを問わず、ビジネスの現場で実際に活用されるモデルの状況把握を可能としている。