先日から急にWHS2011にてクライアントバックアップが取れなくなっていました。原因を調べてみると、バックアップ早々にサーバ側で”Windows Server Client Computer Backup Service”が落ちてしまう様でした。クライアントで進捗1%になって30秒後、サービスが止まる状態。サーバを再起動しても、数日前のWindowsUpdateをロールバックしても変化なし。
WHS2011でバックアップに失敗する?と思ったら”Windows Server Client Computer Backup Service”なるものが落ちていた。とりあえず上げて様子見るけど・・・
— ぶっちー (@guys_dolls) August 23, 2013
と嘆いているとWHS MS-MVPのSatoru Nasu (nasunotw)さんにアドバイスをいただきました。助けてもらってばっかりや(;´Д`)
@guys_dolls おはようございます。バックアップ先のHDDはどうなってますか?以前、OS上からディスクが見えなくなった/ディスク障害によりサービスが落ちる現象を確認してます。ご参考まで… http://t.co/JkrajjcSK1 — Satoru Nasu (@nasunotw) August 24, 2013
結果的にご明察でHDDの故障が原因でした。SMARTチェックはインテル® ラピッド・ストレージ・テクノロジー (インテル® RST)を入れて野放し状態でしたが、もしかしてRAIDの不整合とかしかチェックしたいのだろうか?
実はOSのログにも
デバイス \Device\Harddisk2\DR2 に不良ブロックがあります。
とは出ていたのですが、発生時期が異なりその後もバックアップが取れていたので失念していました。
という訳で泣く泣くST3000DM001-9YN166をゴミ箱へ入れ、クライアントバックアップは正常に動き出しました。また、お勧めのWHS2011向けダッシュボードアプリ「Home Server SMART 2013 protects your data」もインストール。
これでクライアントPCからもサーバのHDDステータス確認が可能になりました。またiOSアプリのBoxcar経由での通知もできるようです(まだ上手く通せていません)。
なお、”Download Today”のボタンからダウンロードする際、2段目にある”Download HSS 2013 – 64-bit”を選びます。一番上はダッシュボードに入らない単独アプリ版で、トライアル期間のあるシェアウェアとなります(WHS版はPayPalでカンパを!)
リビングサーバはファンの音を抑えていたため、HDDは常時50℃を超える状態でした。ソレくらいになるとやっぱりHDDは1年半くらいしかもたない物なんですかね。
Googleの結論「S.M.A.R.Tに基づく寿命予測は役に立たず、HDDは突然死する」 – A Successful Failure
平均温度が35℃から45℃程度がもっとも故障率が低く、30℃以下の低温環境下、あるいは50℃以上の高温環境下で故障率が高くなっている事がわかる。