ごまめの遠足。

個人的なお気に入りの場所・ツボにはまった場所を紹介

  • 過去のひみつ基地
  • GPSのデータについて
  • 旧・バーチャロン関連は工事中

2011年11月

みたびサーバ調査中

しかしメインマシンもブート用の外付光学ドライブも使えない中、夜半回ってから2~3時間ぐらいしか作業できないことで、復旧は遅々として進まない。

とりあえずHDDを換えても改善しなかったので、HDDの故障の可能性はほぼ消え。突然電源が落ちるわけではないのでPSUの線もやや消え。もっともPSUって、+5Vが5.6V(テスター表示)になるという、いろんな意味で危険な壊れ方もあるので、決めてかかるのは危険ではある。

CPUは、全体がやばい状態でもまじめにログを出している雰囲気なので(ここまできたらもはや雰囲気)、これで実はCPUが原因でした、なんてことになっても仕方ないと割り切って、マザーボードかメモリに絞り込む。

このフィフティフィフティと言われたら、電解コンデンサを持っている分だけマザーが不利だが、しかし(壊れるとしたら一気だと思い込んでいた)メモリがじわじわ壊れるという事例は見たので、今回は期待は持てる。メモリの交換ですめば、OS再インストールは回避できる可能性が高くなる。

外付光学ドライブを探すor内蔵光学ドライブを外してくる手間を惜しんで、メモリを交換したそばからランレベル1で動かすと、データドライブのバックアップ完走までこぎ着けた。

となれば、今はこれ以上何もできないので、ランレベル3で起動。起動プロセスの一番難しいところは切り抜けたようだ。

しかし、システムドライブを交換した直後のトライでも、翌日午後までは走ったので油断はできない。

蛇足だが、5.6Vが出るPSUを分別廃棄のため開けてみたら、電子部品サイズのコンデンサが2個ほど爆発していた。いっそのこと乾電池ぐらいなコンデンサの方が爆発してくれていれば捨てるのも惜しくないんだけど、と、縁起でもないことを言ってみる。

2011/11/17 23:00 | カテゴリー:Fedora | コメント(0)

メインPCもやばい

サーバ復旧の遅れの一端を担っている(そうか?)メインPCの不調について、Memtest86+をブートしてみると、見たことのないエラーが連続して出てちょっと騒然。しかし、どれがまずいメモリなのか絞り込むために着脱を繰り返しているうちに、起動すらしなくなる。

メモリが4枚いっぺんにいかれるとはさすがに考えにくいので、メモリ以外に候補を移す。

ということで、ビデオボードとPSUをストックに換えてみたが起動せず。ここに及んで、マザーボードまたはCPUが原因との可能性が高まった。ただしPSUについては、私が意味もなく使用可能なものを遊ばせているとは思えないので、やっぱり壊れたPSUを繋いだ可能性も残っているけど(汗)。←テスター繋げたら壊れていました(^^;

やっぱり少々手間かけてでも、サブPCのパーツと交換しながら試していくべきであろう。こういう時に、同じソケットのマザーをサブPCにしているのは大きい。まあフライトシムPCの建造の時に、トラブルの元兇(メモリ)にたどり着けずに、ミドルクラスのPCがもう1台組めるだけのパーツを逐次買っちゃったせいなんだけど。

電源ボタン4秒押しで電源が落ちるのはCPUが生きている証拠かもしれないが、できればCPUが原因の方がありがたい。OSの買い直しとA社のライセンス再認証を免れる可能性が高いから。ただCPUの価格と、マザー+DSP版OSの価格と、どっちが有利かは、一概には言えないかもしれない(^^;

Windowsについては、何時間か休ませたら起動して、危機感ゼロで自炊なぞ続行していて特に何事も起こらなかったので、まさかこんなに突然死するとは想像もつかず、結果的にA社のライセンス認証の解除を怠ったのは厳しい。現在はもはや、一晩休ませてもブザーの短音すら鳴らないようになってしまった。

2011/11/16 23:30 | カテゴリー:Windows | コメント(0)

やっぱりハングアップ

帰ったら、14時台でログが停まって、やっぱりアクセスランプが点きっぱなしなサーバがお出迎え(汗)。どうやらシステムドライブではなかったようだ。

となるとマザーかメモリかCPUか、とりあえずランレベル1でデータドライブのバックアップを取ろうと思ったら、FatalErrorが出て完走しない。事態が悪化した。というか前記のいずれかが壊れているなら、だましだまし動かせると考える方が甘い。

OSの再セットアップが不可避なマザー交換だけは避けたい。できればCPUかメモリの交換で解決できれば、というのも甘いだろうか(苦笑)。

システムはTrueImageで静的にイメージ取って、データはRAID1+dump取って、と、障害に強いとまでは言わないけど復旧作業がそれほどストレッサーにならない態勢を作ってきたが、マザー交換だけが弱点になっている。メモリは当面大丈夫な気がするが、CPUは、LGA775が手に入らなくなったら、確実にマザー交換を巻き込むであろう。

次に壊れるのがCPUと決まっていれば、今のうちにLGA775を買っておくところなんだけど(笑)。

まあダウンした時に、原因究明を後回しにしてすぐに、とは言わないまでも2時間ぐらいで予備に切り替えることができるなら、サーバダウンの怖さもさらに低減するというものである。というわけで、サーバの仮想化が、おそらく鯖管としての最後の仕事になりそうだ。いや時間的な最後ではなくて、これさえやっとけば精神的な負荷の大きい仕事はないという意味で(^^;

2011/11/16 23:00 | カテゴリー:Fedora | コメント(0)

おそるおそる運転再開

この機会にデータドライブも1TBに増強するかと思ったら、ARAIDのカギが見つからん(汗)。どうやら半年前の地デジ化工事の際に、どこかに整理したままと思われる。あそこにあるとばっかり思っていたのが実は無かったというのが一番タチが悪い。

仕方ないので、今回のところは従来の320GBで復旧。結果的にデータ引っ越しの目的でのバックアップは、無駄に時間を使っただけに終わった。

さて、ランレベル3にすると、RAID1の/dev/sdb絡みでやたらエラーが出まくる。

kernel: ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
kernel: ata2.00: BMDMA stat 0x24
kernel: ata2.00: cmd c8/00:20:4f:3e:8c/00:00:00:00:00/ee tag 0 dma 16384 in
kernel: res 51/05:20:4f:3e:8c/05:00:1e:00:00/ee Emask 0x1 (device error)
kernel: ata2.00: status: { DRDY ERR }
kernel: ata2.00: error: { ABRT }
kernel: ata2.00: configured for UDMA/100
kernel: ata2: EH complete
kernel: sd 1:0:0:0: [sdb] 625140335 512-byte hardware sectors (320072 MB)
kernel: sd 1:0:0:0: [sdb] Write Protect is off
kernel: sd 1:0:0:0: [sdb] Write cache: disabled, read cache: enabled, doesn’t support DPO or FUA

このエラー自体は、実は以前から出ていて、私としては「SATA1.5G固定のARAID99-2000にSATA3.0で読みにいってフラれた(のでUDMA100にした)」というのを想像している。

最後のWrite cache: disabedが気になる人もおられるようだが、HDDになりすましているRAIDBOXが、本物のHDD同様のキャッシュメモリを持っているとは考えにくいし(狭義のキャッシュというのは、SATA端子とプラッタの間にあるからこそ意味がある)、OS側で書き出し用のバッファをうまく管理すれば、少なくとも猛烈に遅いということにはならないと個人的に考える。

まあえらそうに書いたが、実はあっさりキャッシュ有効にできる方法があったりして(笑)。

世間でも、カーネルのカン違い?ということで、ちゃんと動いているようなら特に気にする必要はないという見解が大勢だが、なんかやたら頻発するようになったのが気になるのだ。

次回のメンテナンスでケーブルでも換えてみることにするが、ひとまずこのまま走らせて出勤。ただ、もしマザーボードよりもARAIDが早死にしたというのなら、あえてチップセットや拡張SATAボードのRAIDを使わず専用のハードを買った意味がないやんけ。

2011/11/15 23:00 | カテゴリー:Fedora | コメント(0)

とりあえずオフラインで

サーバの病因調査開始

シングルユーザモードで確かめるには、DSUBミニ15のモニタが必要になるが、フライトシミュレータのサブモニタ兼用で買った10インチが、こういう時に限って出てこない。先代のDELL24インチはまだアパートにあるが、ACアダプタが行方不明(汗)。いっそのことHDMI出力の計算機を1台組むかとも思ったが、電機屋は軒並み私の営業時間よりも早く閉店してくれるので、週末まではどうしようもない。

結局27時過ぎに探し当てる(^^;;

早速Fedora8をランレベル1で起動したところ、/sda3がないと怒られる。そりゃバックアップ保存用パーティション抜いてリストアしたから。

復旧モードからfdiskとmkfs.ext3で、システムドライブの残りをext3で仕立てる。なかなかトリッキーな手順だったがうまくいったらしい。

あとは引き続きランレベル1で、/etcをtarしたり、データドライブをfsckしたりしてみたが、とりあえずアクセスランプ点きっぱなしという事態にはならない。システムドライブ交換でうまくいったか!?

まだ12時間以上目を離せるまでの自信はないので、ランレベル3で起動するのは今晩まで持ち越し。システムドライブ交換で解決する程度のトラブル(ただし未確定)にしては、えらく時間がかかっているぞ!?

素早い復旧のための教訓

  • システムドライブは身軽にしておく
  • モニタはいつでも使える状態にしておく(オイ)
  • 早く帰る(それができればっ)

2011/11/14 23:00 | カテゴリー:Fedora | コメント(0)

« 古い記事 新しい記事 »

  • 過去記事検索

  • カテゴリー

    • 写真
    • おさんぽ
    • 自転車
    • ハイキング
    • 計算機とか
    • Fedora
    • Windows
    • ビデオ録画とか
    • ゲーム
    • FS2004
    • FSX
    • ただの日記
  • 最近の投稿

    • 北湖一周とパター3本目
    • 猛省
    • サーバ入れ替え
    • 準カレー事件
    • 洗濯機排水ホース交換 ×2
    • BR-6500(F)
    • 白猪ノ氷瀑
    • 『ウォーキングマシン』HSM-T08D のこと
  • アーカイブ

    • 2014年10月
    • 2013年10月
    • 2013年9月
    • 2013年8月
    • 2013年2月
    • 2013年1月
    • 2012年12月
    • 2012年11月
    • 2012年10月
    • 2012年5月
    • 2012年3月
    • 2012年1月
    • 2011年12月
    • 2011年11月
    • 2011年10月
    • 2011年9月
    • 2011年8月
    • 2011年7月
    • 2011年6月
    • 2011年5月
    • 2011年4月
    • 2011年3月
    • 2011年2月
    • 2011年1月
    • 2010年12月
    • 2010年11月
    • 2010年10月
    • 2010年9月
    • 2010年8月
    • 2010年7月
    • 2010年6月
    • 2010年5月
    • 2010年4月
  • 2011年11月
    日 月 火 水 木 金 土
     12345
    6789101112
    13141516171819
    20212223242526
    27282930  
    « 10月   12月 »

* RSS FEED

※過去の記事は順次統合中です

Copyright © Master Keystone, 2001-2011