白”雪姫”の雑なエンジニアブログ

ダイアリーがなくなってしまったため、エンジニアブログとして再出発

自宅で以前建てたLinuxでこんなエラーメールがきた

昨日の未明、こんなメールが昔ちょっとさわってたLinuxのサーバからメールが来た。

This email was generated by the smartd daemon running on:
host name: SSHServer
DNS domain: [Unknown]
NIS domain: (none)
The following warning/error was logged by the smartd daemon:
Device: /dev/sda, 1 Currently unreadable (pending) sectors
For details see host's SYSLOG (default: /var/log/messages).
You can also use the smartctl utility for further investigation.
No additional email messages about this problem will be sent.

簡単に書くと
「/dev/sdaの1セクターで、読み取り不能なセクターがあってメール出したよ。
 詳細は、/var/messagesとかのSYSLOGみてね。」ってことらしいです。

そんなんで、SYSLOGをみてみました。
見た箇所は「/var/log/messages」
ログにはこんな出力がありました。

May 28 00:07:37 SSHServer kernel:
May 28 00:07:37 SSHServer kernel: Descriptor sense data with sense descriptors (in hex):
May 28 00:07:37 SSHServer kernel: 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
May 28 00:07:37 SSHServer kernel: 03 a5 1c 99
May 28 00:07:37 SSHServer kernel: ata1: EH complete
May 28 00:07:37 SSHServer kernel: SCSI device sda: 156301488 512-byte hdwr sectors (80026 MB)
May 28 00:07:37 SSHServer kernel: sda: Write Protect is off
May 28 00:07:37 SSHServer kernel: SCSI device sda: drive cache: write back
May 28 00:07:37 SSHServer kernel: SCSI device sda: 156301488 512-byte hdwr sectors (80026 MB)
May 28 00:07:37 SSHServer kernel: sda: Write Protect is off
May 28 00:07:37 SSHServer kernel: SCSI device sda: drive cache: write back


なんだこれ?って思いまして、まずはじめに
SCSI device sda: 156301488 512-byte hdwr sectors (80026 MB)
を調べてみました。
ググったところ、要は、上に書いてあるセクターが読み取り不能になっちゃってるよ
ってことらしいです。
そんなんで、復旧方法を探してみました。

そうしたところ、「fsck 」というので一応復旧できるみたいなことが書いてありました。

なので、

fsck /

コマンドを実施。
何とか復旧。原因調査などはまた別途やろうと思います。


とか見にくいブログを書いていこうと思います。

ちなみに、稼働年数確認してみましたところ、既に、5年稼働してました。
そろそろハード周りがちょっとまずいかもしれませんね。。。

稼働サーバ詳細:
ハードウェア:HP製NX6320
HDD:富士通製 5800rpm 60GB
メモリ:2GB
CPU:Intel Celeron 1.73GHz

うーん・・・クラウドとこのサーバを接続させるつもりだからハードウェアの交換を検討しないとな・・・

追記 2012/5/30
fsckコマンドは、ルートディレクトリ(/)で実施すると、どうやらチェックはしてくれるが、回復はしてくれないものらしいです(会社の上司が教えてくださった)
1番良いのは、USBなどで対象のハードディスクをマウントしてfsckを実行することとも助言頂きました。
ちょっと調査・実践してみます。

追記その20120606
fsckとは
fsckっていうのは、filesystemcheckコマンドのことで、エラーセクターの修復とかチェックが出来るコマンド。
ただし、該当のセクターがマウントされていると、チェックしか行えない。
そのため、修復を行うためには、knoppixなどCDブートを実施し、ディスクマルゴトチェックと修復をする必要がある。