サーバーの SSD が逝ったときのログをペタリ

Linux
この記事は約4分で読めます。
この記事は最終更新日より 1 年以上経過しています。
画像やリンクが無効になっている可能性もあるのでご了承下さい。

 先日このブログを突っ込んでいるサーバーの SSD が突然逝ってしまわれた時の挙動が軽くトラウマレベルだったので、ログをもう一度見てみようかなと引っ張り出して来た。
 メモとして何をどうしたら逝ってしまわれたのかと冷静に考えるも、SSD 自体がやっぱ初期不良的に壊れていたのかなと思うほか無かった。

 SSD が急逝してしまったときのログと、その瞬間に自分が打っていたコマンドとその応答は次の通り。

[root@hogehoge] # smartctl -t long /dev/sda
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-3.10.0-957.21.3.el7.x86_64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Extended self-test routine immediately in off-line mode".
Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 10 minutes for test to complete.
Test will complete after Wed Jul 10 03:35:55 2019

Use smartctl -X to abort test.
[root@hogehoge] # 
[root@hogehoge] # ls
3rdparty  apps         core        index.php  ocm-provider  public.php  robots.txt  themes
AUTHORS   config       cron.php    lib        ocs           remote.php  settings    updater
COPYING   console.php  index.html  occ        ocs-provider  resources   status.php  version.php
[root@hogehoge] # 
[root@hogehoge] # 
[root@hogehoge] # which smartctl
/usr/local/sbin/smartctl
[root@hogehoge] # smartctl -a /dev/sda
zsh: Input/output error: smartctl
[root@hogehoge] # /sbi
(eval):1: _autocd: function definition file not found
_main_complete:173: _ignored: function definition file not found
[root@hogehoge] # /sbi
(eval):1: _autocd: function definition file not found
_main_complete:173: _ignored: function definition file not found
[root@hogehoge] # /sbin
(eval):1: _autocd: function definition file not found
_main_complete:173: _ignored: function definition file not found
[root@hogehoge] # ls
zsh: Input/output error: ls
[root@hogehoge] # ls
zsh: Input/output error: ls

 smartctl -t long で SSD の自己診断機能を実行させたことに始まり、直後まで ls コマンドでカレントディレクトリのファイルは正常に表示されていた。
 smartctl のパスを確認したあとにある程度時間を空けた後、自己診断機能によるテストが終わったかどうか確認する為の smartctl -a /dev/sda で応答がおかしいことに気付く。
 /sbi とまで打ち込んで残りのパスを tab キーで補完しようとするとエラーが起きる。
 で、ls コマンドすらエラーを吐くと。

 何気にこの Input/output error: ls という応答はトラウマである。

 SSD 自体はもう新品交換対応により交換済みで今現在、新しい SSD で運用中だがまた同様の現象により壊れてしまわないかと日々ビク付いている状態である。
 たしか自宅サーバー運用を始めて 10 数年だけど稼働中にシステムドライブがすっ飛ぶのって初めてだった気がする。

著者プロフィール
ぶっち

本格的に PC へ触れ始めてたのは 1990 年位から。
興味は PC 全般。OS は Windows と Linux などを嗜む。
プログラマやネットワークエンジニアを経てフリーに活動している 2 児の父な 40 代半ばのおじさんです。

ぶっちをフォローする

コメント

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.