Linuxサーバが止まった・・・・
どのサービスも反応しなくなり、sshでもログインできない・・・・・・ ログインした後のプロンプトが返ってこない
急になんで?って事で、logを確認したらこんな事が・・・
Jan 23 05:38:52 localhost kernel: INFO: task kthreadd:2 blocked for more than 12 0 seconds. Jan 23 05:38:52 localhost kernel: “echo 0 > /proc/sys/kernel/hung_task_timeout_s ecs" disables this message. Jan 23 05:38:52 localhost kernel: kthreadd D ffff880118b83900 0 2 0 0x00000000 Jan 23 05:38:52 localhost kernel: ffff880118b836c0 0000000000000046 ffff880118b1 0b80 ffff880118b83fd8 |
そのあと、色々あるのですが、どうもこのせいでカーネルが止まったらしい・・・・・
googleに載っていますが、
INFO: task kthreadd:2 blocked for more than 120 seconds.
↓
「RAIDブロックデバイスが120秒間返答なしでタイムアウトでハングした」
って事らしいので、ログに書いてある通り、下記のコマンドを実行
#echo 0 > /proc/sys/kernel/hung_task_timeout_secs |
と記述。再起動しても、値が0のままだったので、しばらく様子見をすることに・・・
(他の方の記事に、これをしても再発したって書いてあったので・・・)
ついでに/var/log/messagesの大量のログが気になった為、
/etc/systemd/system.confのLogLevelを変更
#LogLevel=info
↓
LogLevel=notice
に変更しました。