復旧不定期日誌31, ミラーの欠点その1

最近、データ損失を避けるための方法を尋ねられるのですが、やっぱり「バックアップ」しかないのが現状です。

ところで、同時に複数台に同じ情報を書き込むミラーリングがあります。
そして、台数を増やした場合、コストパフォーマンスが悪いため、2台構成です。
3台以上はRAID-5やRAID-6(補正可能なストライピング)が一般的ですね。

ミラーリングでは、同時故障や、単独に比べ遅くなるなどの欠点をよく耳にすると思います。
ただ、同時故障はさほど心配する必要はありません。
さすがに、確率的にみて同時故障はないと、考えられます?
実は、、、一番心配となるのは、最近の大容量HDDに多発する例の症状がRAIDにまで影響しています。

その症状は、過去にも扱った「書き込めるが読み込めないセクタが突然出没」です。
少し前のHDDは、セクタが破損し読み込めなくなった場合、書き込みもエラーになり、
動作が停止する事により危険を知らせてくれたのですが、です。

ミラーリングの書き込み専門に回されたディスク(つまり、2台目として稼動)がこの症状を起こした場合、
既に読み込めないセクタが増殖しているのに、エラー無しで稼動してしまいます。
そして、本命の1台目が故障し、いざ2台目からデータを出そうとしても、
読めずに動作停止し、そこで初めてS.M.A.R.T.がBAD(もう遅いよ・・)になります。

こうなってくるとRAID自体が無意味に見えてきてしまいますが、
RAID自体、自動バックアップという意味ではありません。
RAIDは障害発生の際、一時的だが稼動を停止させない(修理は休日に回せます)、
または稼動復旧までの時間を短縮するのが目的です。
仮に、それらが叶わない場合は、別のバックアップからの再構築です。

暗号通貨短編