この記事は最終更新日より 1 年以上経過しています。
画像やリンクが無効になっている可能性もあるのでご了承下さい。
画像やリンクが無効になっている可能性もあるのでご了承下さい。
先日このブログを突っ込んでいるサーバーの SSD が突然逝ってしまわれた時の挙動が軽くトラウマレベルだったので、ログをもう一度見てみようかなと引っ張り出して来た。
メモとして何をどうしたら逝ってしまわれたのかと冷静に考えるも、SSD 自体がやっぱ初期不良的に壊れていたのかなと思うほか無かった。
SSD が急逝してしまったときのログと、その瞬間に自分が打っていたコマンドとその応答は次の通り。
[root@hogehoge] # smartctl -t long /dev/sda
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-3.10.0-957.21.3.el7.x86_64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 10 minutes for test to complete.
Test will complete after Wed Jul 10 03:35:55 2019
Use smartctl -X to abort test.
[root@hogehoge] #
[root@hogehoge] # ls
3rdparty apps core index.php ocm-provider public.php robots.txt themes
AUTHORS config cron.php lib ocs remote.php settings updater
COPYING console.php index.html occ ocs-provider resources status.php version.php
[root@hogehoge] #
[root@hogehoge] #
[root@hogehoge] # which smartctl
/usr/local/sbin/smartctl
[root@hogehoge] # smartctl -a /dev/sda
zsh: Input/output error: smartctl
[root@hogehoge] # /sbi
(eval):1: _autocd: function definition file not found
_main_complete:173: _ignored: function definition file not found
[root@hogehoge] # /sbi
(eval):1: _autocd: function definition file not found
_main_complete:173: _ignored: function definition file not found
[root@hogehoge] # /sbin
(eval):1: _autocd: function definition file not found
_main_complete:173: _ignored: function definition file not found
[root@hogehoge] # ls
zsh: Input/output error: ls
[root@hogehoge] # ls
zsh: Input/output error: ls
smartctl -t long
で SSD の自己診断機能を実行させたことに始まり、直後まで ls
コマンドでカレントディレクトリのファイルは正常に表示されていた。
smartctl
のパスを確認したあとにある程度時間を空けた後、自己診断機能によるテストが終わったかどうか確認する為の smartctl -a /dev/sda
で応答がおかしいことに気付く。
/sbi
とまで打ち込んで残りのパスを tab キーで補完しようとするとエラーが起きる。
で、ls
コマンドすらエラーを吐くと。
何気にこの Input/output error: ls
という応答はトラウマである。
SSD 自体はもう新品交換対応により交換済みで今現在、新しい SSD で運用中だがまた同様の現象により壊れてしまわないかと日々ビク付いている状態である。
たしか自宅サーバー運用を始めて 10 数年だけど稼働中にシステムドライブがすっ飛ぶのって初めてだった気がする。
コメント