kill -KILLで死なないし…
とりあえず2nd PCで起動したのを1st PCで利用。
fsckに対して「kill -STOP」をかけてみたが。
が、変化無し。
もしかしてfsck完了前ということで、fwcontrol -Rの出力が変なところに書き出されて、それで普段よりbus占拠が多くなってoverrunしたりしているのかなぁ。
こうなったら、とにかく早くfsckが終ることを期待するしかないな。
今後はUSBとかで怪しい動作を感じたら迷い無くrebootをするようにしよう。
fsckが終らなかったけど大丈夫かな。
あ。
やっぱり食らった。fwohci0: IR DMA overrun (0x40008011)うーん。 「
last message repeated 8 times
pkill -STOP fsck」かけようかどうしようか迷うな。
もうちょっと様子を見るか。
umountを実行:umass0: BBB reset failed, TIMEOUT umass0: BBB bulk-in clear stall failed, TIMEOUT umass0: BBB bulk-out clear stall failed, IOERRORあら。 なんか怪しいぞ。 とりあえず2分ぐらいしたら
umountが終ったけど
USBから抜く時普段は見ないOpened disk da0 -> 5というmessageも出た。 とりあえずそれ以上の問題はなかったので、放置していたら34分ぐらいしたところで突然聞いていた音楽が固まる。 うーむ。 早めにresetしておくべきだったか。 が、TV録画前だったのは幸いというべきか。
yes|make delete-old-libs」。
(da0:sbp0:0:0:0): READ(10). CDB: 28 0 2 3e 45 7f 0 0 20 0 (da0:sbp0:0:0:0): CAM Status: SCSI Status Error (da0:sbp0:0:0:0): SCSI Status: Check Condition (da0:sbp0:0:0:0): MEDIUM ERROR csi:57,56,be,40 asc:11,0 (da0:sbp0:0:0:0): Unrecovered read error (da0:sbp0:0:0:0): Retrying Command (per Sense Data)やべ、と思ったがそれ以上のerror messageは出ず問題無く継続した。 自動不良セクタ割り当てでもうまく働いたか、と思って書き込み作業を継続していたら
(da0:sbp0:0:0:0): WRITE(10). CDB: 2a 0 2 87 f3 bf 0 0 80 0 (da0:sbp0:0:0:0): CAM Status: SCSI Status Error (da0:sbp0:0:0:0): SCSI Status: Check Condition (da0:sbp0:0:0:0): MEDIUM ERROR csi:10,8b,5d,8 asc:c,0 (da0:sbp0:0:0:0): Write error (da0:sbp0:0:0:0): Retrying Command (per Sense Data)を連発されてその後に
sbp0:0:0 request timeout(cmd orb:0x51bedd84) ... agent reset sbp0:0:0 request timeout(cmd orb:0x51bedebc) ... target reset sbp0:0:0 request timeout(mgm orb:0x51bed01c) ... reset start fwohci0: txd err=14 ack busy_X fw_asybusy fwohci0: txd err=14 ack busy_X fw_asybusy fwohci0: txd err=14 ack busy_X fw_asybusy fwohci0: txd err=14 ack busy_X fw_asybusy firewire0: max_asyretry exceeded sbp0:0:0 sbp_reset_start failed: resp=16 firewire0: split transaction timeout dst=0xffc0 tl=0x6 state=8 sbp0:0:0 sbp_reset_start failed: resp=60でHDへのアクセスが外付に限らず一切不能。 firewire HDのaccess lampは消えていたが。 んで諦めてreset。 現在background
fsck中。
K3500TEA/BK
のfirmwareはHDのmedia errorの処理の辺りにbugがあるのかもしれない。
fsckは終った。
とりあえず外付HDは120GBしか無いので全体imageを読み出してみようかな。
とはいえ、すぐにはそれほど空いている訳ではないのでまずは65GB分を3rd PCに転送。
kldload snd_*」を連発して特定してみるか。
どうもsoundに加えてsnd_sbcとsnd_essの両方を入れればいいようだ。
kldunloadしていったらpanicしてしまった。
ま、いいか。
6Rになったことでbackground fsckの恩恵を受けつつkernel reconfigを始めよう。
fdiskかけてboot managerを入れ直したらちゃんと起動するようになった。
んで、2nd PCに退避していたad1の中身をrrestoreで書き戻し。
今のところ1.6MB/sぐらいで進んでいるので17時間ぐらいで終了予定。
ということは明朝7am前ぐらいには終るのか?
fsckもしておくか。
ということで複写先の/usrと/tmpをfsck。
boot -aでなんとかなると思ったら「mountroot> 」というpromptは出たがいいか、何故かkeyboardが効かないし…
set rootdev=disk2s1a」としたら大丈夫かと思ったら…
全然状況は変わらず。
boot -aP」でもダメだ。
rootdev="disk2s1a"と書いても駄目だったが、currdev="disk2s1a"と書いたらうまくいった。
が、/etc/fstabのad0→ad1書き換えはよかったもののpartition nameを4Rのdefaultの付け方から6Rの付け方に変えたのを忘れていてはまる。
とはいえ、手動でmountするだけでよかったのだが。
newfs。
このまま、何か障害が起きると完全にboot出来ない困った状態になりそうなので、とりあえずまずはroot partitionを書き戻し。
で、時間のかかる/usrの書き戻し。
dump命令による終了時間予測は25:50。
UFSのときよりちょっと速いのか?
それとも例のad1書き込み遅い問題が6Rで解決、じゃなくて書き込むのはad0なのでこれは関係ないか。
sysinstallを使おうとしたらなんか、起動前に一瞬表示される。
何かと思ってscriptして見るとacpi0_check: legacy0 busy acpi0_check: cpu0 attached acpi0_check: lnc0 not-presentといったmessageがずらずら表示されていた。 これまで見た覚えがないのはPCが速過ぎて気がついていなかったのか、それとも全てACPI対応のPCだったからか。
sysinstallの中からfdisk→bsdlabel。
dump|restore。
rebootして、single user modeでmergemaster -p。
yes|make delete-old」に切替えた。
次はmergemasterだが、single user modeだとやり難いけど…
やるか。
reboot。
とりあえず起動。
しかしrl0 link state downとかupとかそんなのは始めてみた気がする。
やっぱりRealTekのは不安定かも。
ん?
あと「can't open /dev/apm」とかもでているな。
これはacpi関係に書き直せってことかな。
いや、そんなはずはないな。
こんな古いhardwareでは。
まぁいいや。
portupgrade -af」。
の、前にせっかくだからcvsupをしてからにしよう。
portupgrade -af終了。
引続き作業でcvsupで6Rを取ってくる。
portupgradeがrubyでconfig待ちだった。
ここまでは順調。
smartctl -a /dev/ad1」で確認したら何故かReallocated_Sector_Ctが0になっているぞ。
不思議だ。
cvsupの後に「portupgrade -af」。
今度はメモリがそれなりにあるので、安心してrubyの作り直しが出来るな。
いや、今までも出来ていたんだけどswapばんばんで3日とかかかっていたからなぁ。
mergemaster -pかけたらinstallworldは通るか?
うーん。
「e l」とか使い方が分かっていないせいで、master.passwordのmergeがイマイチだったが、その辺は手動対応で何とかなった。
んで、改めて「make installworld」。
install -o root -g wheel -m 444 test.1.gz /usr/share/man/man1」で「*** Signal 12」食らってcore dump。
やるなぁ。
というか、dateまで落ちるようになったぞ。
もちろんinstallkernelも出来ないし。
さて。
再起動すると悪化するか?
mountされるベキか不明だぞ。
emergency shellをあげて、catはないから…
ddはあるのか。
「dd < fstab」とかしてメモメモ。
んで、Upgrade再開。
fsckまでいった。
smartctl -a /dev/ad1」したらReallocated_Sector_Ctは16だった。
とりあえずzero fillしてみるか。
dump結果を展開してみる。
cvsup。
しかし、4.11R→6.1Rで「make buildworld」でうまくいけるのかという疑問はあるな。
make worldは進んでいるようだ。
明日の朝まで放置だな。
buildkernelはどうするか。
うーん。
最終的には6Rを目指すということで今回はGENERICでいいか。
dump出力による残り時間は大体、ちゃんと実際の5分経過で5分ずつ減るようになりつつあるが、今度は5分未満も増えてきた気がする。
でも、この分だと8:20amぐらいには終るかな。
んで、その後はこんな感じ:
8:03 7:58 7:53 7:49 7:43 7:38 7:33 7:27 7:22 7:17 7:12 7:07 7:02 6:57
6:52 6:47 6:42 6:38 6:33 6:28 6:23 6:18 6:13 6:08 6:03 5:58 5:53 5:48
5:42 5:37 5:32 5:27 5:23 5:17 5:13 5:08 5:01 4:57 4:51 4:46 4:41 4:37
4:32 4:27 4:22 4:17 4:11 4:06 4:02 3:57 3:52 3:46 3:41 3:36 3:31 3:26
3:21 3:15 3:11 3:06 3:00 2:56 2:51 2:46 2:41 2:35 2:30 2:25 2:19 2:15
2:09 2:05 2:00 1:55 1:50 1:45 1:40 1:35 1:30 1:25 1:20 1:15 1:10 1:05
1:00 0:55 0:49 0:45 0:39 0:34 0:29 0:25 0:20 0:15 0:10 0:05
dumpが終った。
time stampを見ると8:03amには終ってたようだ。
エラーも全く検出せず。
とりあえず毎秒のifconfig rl0 upは止めるか。
restore fiでいくつかlsとかcdした感じでは問題無いけど。
やっぱりPATA HDの予備が無いのは痛いな。
rdumpでどこまで取り出せるか実験。
ifconfig rl0 down」「ifconfig rl0 up」して復活。
dumpし直し。
ifconfig rl0 down」「ifconfig rl0 up」して様子見。
ifconfig rl0 up」だけでも復活するみたいだ。
こんなに落ち続けるのは納得できないけど、仕方ないのでAd Hocだが5秒に一度「ifconfig rl0 up」かけることにする。
ping -c 100をかけたら11% packet lossらしい。
5秒に一回の「ifconfig rl0 up」は多いのか少ないのか。
ifconfig rl0 up」のタイミングでpacketが落ちているような気がする。
ちょうど「DUMP: 0.87% done, finished in 28:24」と出たので、次の残り時間表示がどうなるか、「ifconfig rl0 up」を10秒に一回に変えて様子見。
ifconfig rl0 up」を毎秒に変えてみよう。
dump出力は「DUMP: 1.91% done, finished in 26:11」。
ifconfigをもっと頻繁にする価値はあるだろうか。
dump出力による残り時間:
24:52 24:21 23:38 23:16 22:39 22:06 21:37 21:19 21:03 20:47 20:31
20:20 20:03 19:50 19:47 19:43
dump出力による残り時間:
19:36 19:28 19:17 19:08 18:58 18:50 18:43 18:38 18:33 18:27 18:20
18:13 18:06 17:59 17:52 17:48 17:43 17:35 17:27 17:20 17:13 17:06
17:00 16:54 16:48 16:44 16:40 16:34 16:30 16:22 16:17 16:10 16:04
15:59 15:54 15:50 15:44 15:38 15:33 15:28 15:23 15:16 15:10 15:05
14:57 14:53 14:47 14:43 14:37 14:31 14:26 14:20 14:15 14:10 14:06
14:01 13:54 13:49 13:45 13:39 13:24 13:29 13:24 13:18 13:12 13:07
13:01 12:56 12:52 12:48 12:43 12:36 12:30 12:25 12:19 12:14 12:09
12:04 11:59 11:53 11:50 11:45 11:40 11:35 11:30 11:25 11:19 11:14
11:08 11:03 10:57 10:51 10:45 10:40 10:34 10:29 10:24 10:19 10:14
10:08 10:03 9:59 9:54 9:49 9:45 9:40 9:35 9:30 9:24 9:20 9:15 9:10
9:06 9:01 8:56 8:50 8:45 8:40 8:35 8:30 8:26 8:22 8:17 8:12 8:08
ad1s1e: hard error reading fsbn 27705535 of 13852736-13852767 (ad1s1 bn 27705535; cn 1724 tn 150 sn 25) trying PIO modeこの1 sectorだけじゃなくて、たくさんエラーがでた。 さて、どうするかな。 この3rd PCはFreeBSD4Rから6Rにし、UFS2を使おうと思っていたところではあるんだよな。 とりあえずpending。
本ページの主張等は著者の所属組織に全く関係なく、個人としてのものです。