FreeBSD マシントラブル

暑いですね。ガキのころ,夏の炎天下,練習の途中に水分補給もせず(喉が渇いたからといって水を飲むなんて「根性が足りない」と先輩や指導者から叱られたのだ)野球やサッカーに励んだのだが,いまのこの暑さは当時の比ではないように思われる。根性どころの問題ではない。夏の甲子園大会に向けた地方予選がたけなわのわけだが,テレビを観ながら,この子ら大丈夫かと心配になってくるんである。

うちのファイルサーバとして運用している FreeBSD マシンが,このところなんのエラーメッセージを出すこともせず,いきなり電源が切れて突然死することが多くなった。これも,この暑さのせいか。コンピュータが狂うほどの暑さなのか。不信感半ばであった。エラー情報が残されていないので,ディスク,CPU,マザーボードなど機械が壊れたのか,OS のある領域がどこかのダウンのタイミングで破壊されたからなのか,さっぱり原因がわからない。AMD 製 CPU を搭載した安物ノーブランドマシンなので,もともと俺的にはあんまり信頼の置けない機械ではある。A4-7300 Dual-core 3.80GHz / Turbo-core 4.00GHz / 1MB L2 cache / 4GB DDR3 SDRAM メモリ / 500GB TOSHIBA SATA3 HDD + 1TB Hitachi SATA2 HDD 搭載。

しかし,こうもぽこぽここけられると,ディスク,メモリなど使えるもの以外はシステムを新しくするかとも考えた。で,ちょっと切り分けをしてみることに。FreeBSD を起動する直前の boot: プロンプトのところで止めて様子をみたら,それでもしばらくして電源が落ちていた。要するにディスクやメモリを読むことなしに System Wait 状態で突然死したわけだ。ということは,周辺機器を支えている CPU やマザーボード,あるいは電源そのものの故障ではないかと思われた。じゃ,ディスク,メモリを取り出して,別マシンにでも持って行こうかと。

で,このマシンの蓋を開けてみたところ…,うわ,ホコリが尋常でないほど内部に溜まりまくっていて,冷却ファンや通風孔が目詰まりしているではないか。もしかして,このおかげで筐体内・CPU の温度が上がって保護的に電源が落ちたのか,と,なんとなく問題の在り処がわかってきた。そういや,3 年前に購入してからこのかた,一度も筐体を開けていなかった。ということで,エアスプレー,掃除機でもってむせ返りながらせっせとホコリを取り払い,冷却ファンをはじめ筐体内部,コネクタ部をキレイに清掃した。

こうして再起動したら,それまでは数分のうちに電源ダウンしていたのが,いまのところ丸一日元気に動いている。想定は正しかったようである。このマシン,実はファイルサーバとして使う前に公開 Web アプリケーションサーバとして運用していたんだが,そのときも今回のようにぽこぽこ突然死していたのである。FreeBSD 最新版をクリーンインストールしたところ,しばらくは問題なく稼働していたのでそれ以上の調査をせずにいたのである。ところが,この夏の猛暑のおかげで購入後筐体内の清掃をまったくしていなかったケア不足ゆえの冷却問題が判明した次第である。

このように,何のシステムエラーもなくいきなり電源断が起きるような障害には,筐体内の冷却が効いていないことを疑ってみるのもよいと思う。またマシンをリニューアルするなんてくだらない出費をせずにすんでよかった。

20180723-teles-pc.png