Apache Software Foundationは2017年12月14日(米国時間)、「The Apache Software Foundation Announces Apache Hadoop v3.0.0 General Availability : The Apache Software Foundation Blog」において、Hadoopの最新版となる「Apache Hadoop 3.0.0」の公開を伝えた。
Hadoopは分散コンピューティングやクラスタリング・プラットフォームを構築するための基盤として利用されることが多いソフトウェア。
Apache Hadoop 3.0.0の主な特徴は次のとおり。
- HDFSのストレージコストを削減するHDFSイレースコーディング機能
- YARNおよびHDFSの連動による数万台レベルへの透過的スケールの実現
- 機械学習やコンテナとの統合性向上のため、GPUなどのリソースを制御するためのYARNリソースタイプの導入
- 利用時間の短いコンテナに関するスケジューリングを改善する機能の導入
- クラウドストレージシステムに関連した機能の向上とパフォーマンスの改善
- スケーラビリティ、信頼性、使いやすさが向上したYARN Timeline Service 2の導入(プレビュー版)
Hadoopはビッグデータ処理などを実施するためのクラスタリングプラットフォームなどを構築する際に使われるオープンソース・ソフトウェア。スケーラビリティの高い分散コンピューティング環境を構築するために欠かせないソフトウェアとなっており、多くのソリューションやスタックの基盤として活用されている。