復旧不定期日誌102, [Lab]: 故障予測 パート1 (S.M.A.R.T.)

いつも大変お世話になっております。
データ復旧担当(現:故障予測)の矢野と申します。

シルバーウィークより配置が変わりまして、
データ復旧作業専属から故障予測事業部担当となりました。
ただ、それでも半数(以上?)はデータ復旧作業も担いますゆえ、
故障予測専属というわけではありませんが、ブログを編集できる時間が確保できました。
本日より詳細な情報を掲載できると思います。

パート1 (S.M.A.R.T.):
ストレージの故障予測では、
一般的にS.M.A.R.T.と呼ばれるコマンドを発行いたしまして、
指定の構造体へデータを書き込んでいただき、それを受け取る形式となります。
実際には、ストレージ(HDD,SSD)とユーザが扱うユーザモードの間にはWindows(カーネル)が存在いたしますので、
直接ストレージへ発行できる訳ではなく、危険性の少ない至ってノーマルな方法でコマンドを発行します。
結局はWindowsの仕様通りに発行する手順を経由するはずです

受け取ったのち、S.M.A.R.T.の仕様通りに編集いたしますと、
仕様に沿った属性へ値が入ります。
この値をしきい値(故障と判断する値)と比較して故障予測が成立いたします。

いえ、成立するはずでした。

ところで、しきい値が存在するのに、
それら具体的な予測方法が一切示されておらず、
なんか宙に浮いたまま現在に至っている、そのような受け取り方もあると思います。

そして、データ復旧サービスを通じて分かったことは、
障害を起こした直後のS.M.A.R.T.値、ほとんど当てにならないということです。
不良セクタが大量に増殖して初めて値が増加すると考えて過言ではありません。
しかしながら、肝心なことは不良セクタが大量に増殖してからでは遅いということです。

故障予測 パート2 (不良セクタの分布と増殖の関係1)へ続きます。

暗号通貨短編