「データ容量が爆発的に増え続ける大きな要因は、オフィス文書や画像ファイルの"肥大化"だ。ファイルの肥大化を防ぐためには、データ圧縮や重複排除に代わる新しいテクノロジーが必要になる」

英国ニューパワーソリューションズの最高経営責任者マイク・パワー氏は、オーシャンブリッジが開催したセミナー「NXPowerLite Day 2010」の基調講演でこう語り、"データ容量爆発時代"において企業はどのような点に注意してストレージ戦略を立てていくべきか、また、そのなかで、同社の提供するファイル圧縮ソフト「NXPowerLite」がどのように役立つかを紹介した。

企業を悩ますファイル肥大化の問題

ニューパワーソリューションズ 最高経営責任者 マイク・パワー氏

パワー氏の言うファイルの"肥大化"とは、オフィス文書(Word、Excel、PowerPoint)に大容量の画像データなどが挿入された結果、必要以上にファイル容量が大きくなってしまうことを指す。高解像度のデジタルカメラが普及したことで画像ファイルの容量が数MBを超すケースが増えたが、そうした大容量の画像をそのままオフィス文書に貼り付けると、画像ファイルの容量分だけファイル容量が増えてしまう。だが、画面表示や印刷といった通常のオフィス文書の利用では、高解像度の画像が必要になるケースはほとんどない。実際には利用されないのにデータ容量だけが肥大化してしまっているわけだ。

「フォレスターリサーチの調査では、Microsoft Officeによって1日に1億ドキュメントが作成されている。また、タネジャグループの調査では、企業内に作成されるデータの58%はMicrosoft Officeのような非構造化データだ。こうしたファイルが肥大化していけば、企業に与える影響は大きい。ストレージコストやバックアップコストを増やすばかりか、帯域幅、電力、熱対策、ラックスペース、管理工数などにかかるコストと時間も増加させる。企業がストレージ戦略を立てていくうえで、無視できない問題になっている」(同氏)

データ容量を抑えるテクノロジーとしては、データ圧縮や重複排除があるが、パワー氏によると、これらは、もともとセカンダリストレージ向けに設計された対策であり、部分的な解決策にしかならないという。例えば、重複排除についてこう話す。

「重複排除はファイルの重複している部分を取り除くもので、多くの重複データが存在することが前提だ。バックアップ、レプリケーション、スナップショットなどには有効だが、そもそも重複データが少ないプライマリデータに対しては高い効果が望めない」

こうした限界は、データ圧縮についてもあてはまる。

「データ圧縮は、ファイルの肥大化した部分を隠しているにすぎない。また、オフィス文書や画像ファイルといったすでに圧縮されているデータを圧縮しても、ほとんど容量削減効果はない。読み込み時のファイル復号に時間がかかることで、レスポンス時間とIOPSも悪化する」

画像の最適化で、最大50分の1にまで容量を圧縮

そこでパワー氏が提案するのが、肥大化したファイルの容量を永久に削除することで、プライマリデータの消費ペースを抑えるというアプローチだ。オフィス文書が肥大化する原因は、オフィス文書に挿入された必要以上にサイズの大きい画像データだ。それを取り除き、実用的なサイズにまで最適化すれば、プライマリデータの消費ペースを抑えることができ、データ容量にまつわる問題を根本から解決することができる。そして、そのアプローチに沿って開発提供されているのがNXPowerLiteだ。

「NXPowerLiteは、オフィス文書に埋め込まれた大容量の画像やオブジェクトをいったん抜き出し、不可逆圧縮で最適化したあとに、もとのオフィス文書に書き戻すという処理を行う。最適化の処理は自動で行われ、目で見てわかるような画像の劣化は起こらない。また、最適化後もファイル形式は変わらないため、通常のオフィス文書とまったく同じ様に利用することができる。肥大化したファイル容量を永久に削除する唯一の方法だ」

NXPowerLiteの仕組み

NXPowerLiteには、デスクトップ版とファイルサーバ版があり、デスクトップ版は、クライアントにインストールして、圧縮したいファイルをユーザーが選択的に処理することを想定したもの。一方、ファイルサーバ版は、ファイルサーバ上のファイルに対してバッチ処理を行い、ストレージ全体での容量削減を図るもの。いずれもソフトウェアだけで処理を行い、最大で50分の1にまで容量を圧縮することが可能という。対象となるファイルは、Word、Excel、PowerPoint、JPG、PDFだ。

会場では、最適化処理を行う前と後を比較するデモを披露。見た目には違いがわからないJPG画像のサイズが約2.2MBから約700KBに圧縮されていることを示した。ユーザーは、NASA、LVHM、NOKIAなど世界で100万人以上で、国内でも、ソフトバンクBBや海上自衛隊、パナソニックエナジーなど、約6,600社、約6万3000ライセンスの販売実績がある。開発は、マイクロソフトと技術的な協力関係のもとで進められ、認定パートナーでもあることから、信頼性も高いことをアピールした。

処理前(左)と処理後(右)の画像の比較。講演会場では、スクリーン右側に照明があったためやや色が薄く見えるが、実際にはほとんど違いがわかならない。