中央大学(中大)は、ビッグデータを記憶するデータセンターに向けにフラッシュメモリと抵抗変化型メモリ(ReRAM)を一元管理する統合ストレージシステムを開発したと発表した。

同成果は、同大 理工学部 電気電子情報通信工学科 竹内健教授らによるもの。詳細は2月17日~21日に米国サンフランシスコで開催された「ISSCC 2013(International Solid-State Circuits Conference:国際固体素子回路会議)」にて発表された。

現在、データセンターでは複数のサーバ間やSSD間、各SSDの内部など、それぞれに独立した形で高信頼技術が用いられている。しかし、これら高信頼技術が重複することによる非効率化や、メモリセルの位置や蓄えるデータの内容によるエラーの確率の変動といった、フラッシュメモリの不良の特徴が考慮されていないため、データの信頼性が十分ではないという問題があった。

今回の研究は、それらの課題を解決することを目指したもので、高い信頼性を確保するためにフラッシュメモリとReRAMを一元管理する統合ストレージシステムを考案したという。

図1 従来ならびに今回考案されたストレージの構成。今回のストレージでは、メモリを一元管理することで効率を高め、4つの高信頼技術により、信頼性を32倍高めることに成功したという

研究グループではフラッシュメモリに対しては、データが書き込まれる場所によってエラー率に大きな偏りがあることに着目し、データの信頼性を確保するためにデータを二重化する際に、少なくとも一方のデータは信頼性の高いメモリ領域に書き込まれるように制御するリバースミラーイングを考案した。

図2 リバースミラーイングのイメージ。フラッシュメモリの物理的な特徴を考慮してデータを二重化することで信頼性の向上を実現した。ReRAMを不揮発のバッファとして有効に使用している

また、考案した高信頼性技術を実現するためには、書き換え回数が大きく、上書きが可能で、高速なメモリが必要となるためReRAMをリバースミラーイングのバッファに用いることで、メモリの不良率を69%削減することに成功したという。

図3 リバースミラーイングによりメモリ不良率を69%削減(信頼性を69%向上)することに成功した

さらに、データを冗長化して信頼性を向上するページRAIDを開発。これにより許容できるエラー数を45%増やすことに成功したほか、フラッシュメモリのエラーの特徴から正しいデータを復元する技術やデータを読み出した際のエラーを記録しておき、次に読み出す際に訂正する技術も開発。これら4つの高信頼技術を組み合わせた統合ストレージシステムでは、従来技術比で32倍のエラーを許容することができるようになったという。

図4 データの冗長化により信頼性を向上するページRAID。高速で高信頼のReRAMを用いることで、性能を落とすことなく冗長化が可能になった

図5 ページRAIDを活用することで信頼性が45%向上することを確認したという

なお、フラッシュメモリはHDDに比べて高速かつ低電力ではあるものの、プロセスの微細化による信頼性の低下がデータセンターではボトルネックとされており、研究グループでは今回の統合ストレージシステム技術を活用することで、メモリの信頼性を高めることが可能になるため、ビッグデータを記憶するデータセンターへのフラッシュメモリの導入が加速されるようになることが期待されるとコメントしている。

図6 実際に試作された統合ストレージシステムの写真