米Clouderaは3月14日(現地時間)、Cloudera Enterprise上のデータサイエンス業務に向けた、新セルフサービスツールである「Cloudera Data Science Workbench」(現在はβ版)を発表した。

Data Science Workbenchにより、データサイエンティストは、昨年Clouderaが買収したデータサイエンスの企業であるSense.ioの製品をベースにしたセキュアなエンタープライズプラットフォーム上で、R、Python、Scalaなど好みのオープンソース言語やライブラリと、Apache SparkやApache Hadoopをネイティブに連携することが可能となり、データの探索から本番環境へのリリースに至るまで、分析プロジェクトを促進することができるという。

データサイエンティスト向けの用途としては、RやPython、Scalaを好みのライブラリやフレームワークとともに、Webブラウザから直接利用することが可能なほか、SparkおよびImpalaからセキュアなHadoopクラスタ上のデータに直接アクセスすることができるため、チーム全体でインサイトを共有し、再現可能かつ協調的なデータ活用を実現するという。

一方、ITプロフェッショナル向けの用途としては、データサイエンスチームが望む手段をいつでも提供が可能な上、Kerberos認証をはじめ、Hadoopのセキュリティ機能を生かしたコンプライアンス対応が可能となっている。さらに、データの管理場所を問わず、オンプレミスでもクラウドでも実行することが可能だという。

「Cloudera Data Science Workbench」の画面