米SAS Instituteは3月14日、データ統合ソリューション「SAS Enterprise Data Integration Server」の最新版が、Apache Software Foundationで開発・公開されているJavaソフトウェアフレームワークであるHadoopに対応したと発表した。

「SAS Enterprise Data Integration Server」は現在、30種類以上のデータソースをサポートしており、今回、新たにHadoopが加わった。すでに、米のオンライン小売業のMacys.comは、同製品とHadoopを用いて、ビッグデータの分析を行い、長期的な投資から大きな価値を導き出すことが可能となったとしている。

HadoopとSASの高度な連携機能としては、分散コンピューティング・フレームワークとして一般的にHadoopと使用されることの多いMapReduceの並列処理のフレームワークを活用する。SAS、Hadoop、データ・ウェアハウス・インフラストラクチャのHiveは、大規模データセットを分析するうえで最適な組み合わせであり、これにより、一般的なビッグデータの分析とその分析結果の活用を容易に行うことが可能となる。

同製品において、Hadoopとビッグデータ分析をサポートする機能としては、以下のものがある。

  • ジョブフロー・ビルダー、ビジュアル・エディター、文法チェッカーなどの機能が、Hive、Pig、MapReduce、HDFSの各種コマンドに拡張される

  • 認証やデータ・リネージなど、SASのデータ・セキュリティ機能がHadoopのセキュリティを補強する

  • データ品質とプロファイリング機能において、Hadoop内外へ移動するデータに対応