オンラインバックアップサービス企業のBackblazeは7月11日(米国時間)、「How to Manage for Hard Drive Failures and Data Corruption」において、自社で利用している故障したハードディスクを分析し、その故障の原因を4つに分けて対策について紹介した。Backblazeは大量の3.5インチハードディスクを使ったバックアップサービスを提供しており、定期的に故障したハードディスクに関する統計データや分析データを公開している。

Backblazeは故障したハードディスクを分析した結果、主に次の4つの原因で故障が発生したことが明らかになったと伝えた。

原因 内容
ヘッドクラッシュ 故障の70%はヘッドクラッシュなどの物理破壊が原因。現在のハードディスクは3.5インチの金属パッケージ内に複数枚の超薄型プラッタが詰め込まれている。これらは毎分5,400回転または7,200回転(毎秒90回転または120回転)で動作しており、この上に磁気データを読み取るヘッダが6.3マイクロメートル前後の位置で動作している。ハードディスクは突然の衝撃に対して脆弱。衝撃はハードディスクをひっくり返しただけでも発生するほか、机の上から誤って落としてしまったり、搬送中に落としてしまったりすることでも発生する。衝撃を受けるとヘッドはブラッタに衝突し、プラッタが損傷する。この物理破壊をヘッドクラッシュと呼ぶ
プリント回路基板 故障の18%はプリント回路基板の故障。プリント回路基板(PCB)はハードディスクの底面に見られる緑色の基盤。湿気や静電気の昇殿などで故障する
スティックション 故障の11%はスティックション。ハードディスクを長時間にわたって使っていないと、アーマチェアが固定されてヘッドが駆動しなくなることがある。ハードディスクは電源に接続され常に回転していることを好んでおり、数字がこれを裏付けている
モータ 故障のわずか1%はハードディスクモータの故障
  • ハードディスク故障の原因割合グラフ - 資料: オンラインバックアップサービス企業Backblaze提供

    ハードディスク故障の原因割合グラフ - 資料: Backblaze

Backblazeはこうした故障に対処する方法として、次のような内容を取り上げている。

対策 内容
取り扱いを厳密に ハードディスクは静電気防止用袋に入れて乾燥した場所に保管する。静電気防止用マットとリストバンドを使うほか、ゴム製マットを誤ってハードディスクを落としやすい場所に敷いておく。ハードディスクを急激に引き抜いたりケースを勢いよく開いたりすることでも故障するため、丁寧に取り扱う。このようにハードディスクの取り扱いについてルールを作り厳密に従うようにする
コピーの実施 データを複数の異なるハードディスクやシステムにコピーしておく。また、マルチドライブNASやRAIDシステムを使用する
ビットフリップエラー対策 シングルビットフリップはハードディスクが自動的に修正するが、規模の大きなビットフリップは修正することができない。ビットフリップエラーがどの程度の頻度で発生するかは議論の余地があるが、実際にビットフリップによるデータ破損が観測されている。ビットフリップに対応するための方法はすでに多くの方法が知られている。こうした方法を使ってビットフリップに対応する

Backblazeの運用しているバックアップサービスにはすでにこうした対策が取り込まれており、高いデータ耐久性と整合性を実現していると説明している。