kill -KILL
で死なないし…
とりあえず2nd PCで起動したのを1st PCで利用。
fsck
に対して「kill -STOP
」をかけてみたが。
が、変化無し。
もしかしてfsck
完了前ということで、fwcontrol -R
の出力が変なところに書き出されて、それで普段よりbus占拠が多くなってoverrunしたりしているのかなぁ。
こうなったら、とにかく早くfsck
が終ることを期待するしかないな。
今後はUSBとかで怪しい動作を感じたら迷い無くreboot
をするようにしよう。
fsck
が終らなかったけど大丈夫かな。
あ。
やっぱり食らった。fwohci0: IR DMA overrun (0x40008011)うーん。 「
last message repeated 8 times
pkill -STOP fsck
」かけようかどうしようか迷うな。
もうちょっと様子を見るか。
umount
を実行:umass0: BBB reset failed, TIMEOUT umass0: BBB bulk-in clear stall failed, TIMEOUT umass0: BBB bulk-out clear stall failed, IOERRORあら。 なんか怪しいぞ。 とりあえず2分ぐらいしたら
umount
が終ったけど
USBから抜く時普段は見ないOpened disk da0 -> 5というmessageも出た。 とりあえずそれ以上の問題はなかったので、放置していたら34分ぐらいしたところで突然聞いていた音楽が固まる。 うーむ。 早めにresetしておくべきだったか。 が、TV録画前だったのは幸いというべきか。
yes|make delete-old-libs
」。
(da0:sbp0:0:0:0): READ(10). CDB: 28 0 2 3e 45 7f 0 0 20 0 (da0:sbp0:0:0:0): CAM Status: SCSI Status Error (da0:sbp0:0:0:0): SCSI Status: Check Condition (da0:sbp0:0:0:0): MEDIUM ERROR csi:57,56,be,40 asc:11,0 (da0:sbp0:0:0:0): Unrecovered read error (da0:sbp0:0:0:0): Retrying Command (per Sense Data)やべ、と思ったがそれ以上のerror messageは出ず問題無く継続した。 自動不良セクタ割り当てでもうまく働いたか、と思って書き込み作業を継続していたら
(da0:sbp0:0:0:0): WRITE(10). CDB: 2a 0 2 87 f3 bf 0 0 80 0 (da0:sbp0:0:0:0): CAM Status: SCSI Status Error (da0:sbp0:0:0:0): SCSI Status: Check Condition (da0:sbp0:0:0:0): MEDIUM ERROR csi:10,8b,5d,8 asc:c,0 (da0:sbp0:0:0:0): Write error (da0:sbp0:0:0:0): Retrying Command (per Sense Data)を連発されてその後に
sbp0:0:0 request timeout(cmd orb:0x51bedd84) ... agent reset sbp0:0:0 request timeout(cmd orb:0x51bedebc) ... target reset sbp0:0:0 request timeout(mgm orb:0x51bed01c) ... reset start fwohci0: txd err=14 ack busy_X fw_asybusy fwohci0: txd err=14 ack busy_X fw_asybusy fwohci0: txd err=14 ack busy_X fw_asybusy fwohci0: txd err=14 ack busy_X fw_asybusy firewire0: max_asyretry exceeded sbp0:0:0 sbp_reset_start failed: resp=16 firewire0: split transaction timeout dst=0xffc0 tl=0x6 state=8 sbp0:0:0 sbp_reset_start failed: resp=60でHDへのアクセスが外付に限らず一切不能。 firewire HDのaccess lampは消えていたが。 んで諦めてreset。 現在background
fsck
中。
K3500TEA/BK
のfirmwareはHDのmedia errorの処理の辺りにbugがあるのかもしれない。
fsck
は終った。
とりあえず外付HDは120GBしか無いので全体imageを読み出してみようかな。
とはいえ、すぐにはそれほど空いている訳ではないのでまずは65GB分を3rd PCに転送。
kldload snd_*
」を連発して特定してみるか。
どうもsoundに加えてsnd_sbcとsnd_essの両方を入れればいいようだ。
kldunload
していったらpanicしてしまった。
ま、いいか。
6Rになったことでbackground fsck
の恩恵を受けつつkernel reconfigを始めよう。
fdisk
かけてboot managerを入れ直したらちゃんと起動するようになった。
んで、2nd PCに退避していたad1
の中身をrrestore
で書き戻し。
今のところ1.6MB/sぐらいで進んでいるので17時間ぐらいで終了予定。
ということは明朝7am前ぐらいには終るのか?
fsck
もしておくか。
ということで複写先の/usrと/tmpをfsck
。
boot -a
でなんとかなると思ったら「mountroot> 」というpromptは出たがいいか、何故かkeyboardが効かないし…
set rootdev=disk2s1a
」としたら大丈夫かと思ったら…
全然状況は変わらず。
boot -aP
」でもダメだ。
rootdev="disk2s1a"
と書いても駄目だったが、currdev="disk2s1a"
と書いたらうまくいった。
が、/etc/fstab
のad0→ad1書き換えはよかったもののpartition nameを4Rのdefaultの付け方から6Rの付け方に変えたのを忘れていてはまる。
とはいえ、手動でmount
するだけでよかったのだが。
newfs
。
このまま、何か障害が起きると完全にboot出来ない困った状態になりそうなので、とりあえずまずはroot partitionを書き戻し。
で、時間のかかる/usrの書き戻し。
dump
命令による終了時間予測は25:50。
UFSのときよりちょっと速いのか?
それとも例のad1書き込み遅い問題が6Rで解決、じゃなくて書き込むのはad0なのでこれは関係ないか。
sysinstall
を使おうとしたらなんか、起動前に一瞬表示される。
何かと思ってscript
して見るとacpi0_check: legacy0 busy acpi0_check: cpu0 attached acpi0_check: lnc0 not-presentといったmessageがずらずら表示されていた。 これまで見た覚えがないのはPCが速過ぎて気がついていなかったのか、それとも全てACPI対応のPCだったからか。
sysinstall
の中からfdisk
→bsdlabel
。
dump|restore
。
reboot
して、single user modeでmergemaster -p
。
yes|make delete-old
」に切替えた。
次はmergemasterだが、single user modeだとやり難いけど…
やるか。
reboot
。
とりあえず起動。
しかしrl0 link state downとかupとかそんなのは始めてみた気がする。
やっぱりRealTekのは不安定かも。
ん?
あと「can't open /dev/apm」とかもでているな。
これはacpi関係に書き直せってことかな。
いや、そんなはずはないな。
こんな古いhardwareでは。
まぁいいや。
portupgrade -af
」。
の、前にせっかくだからcvsup
をしてからにしよう。
portupgrade -af
終了。
引続き作業でcvsupで6Rを取ってくる。
portupgrade
がrubyでconfig待ちだった。
ここまでは順調。
smartctl -a /dev/ad1
」で確認したら何故かReallocated_Sector_Ctが0になっているぞ。
不思議だ。
cvsup
の後に「portupgrade -af
」。
今度はメモリがそれなりにあるので、安心してrubyの作り直しが出来るな。
いや、今までも出来ていたんだけどswapばんばんで3日とかかかっていたからなぁ。
mergemaster -p
かけたらinstallworldは通るか?
うーん。
「e l」とか使い方が分かっていないせいで、master.passwordのmergeがイマイチだったが、その辺は手動対応で何とかなった。
んで、改めて「make installworld
」。
install -o root -g wheel -m 444 test.1.gz /usr/share/man/man1
」で「*** Signal 12」食らってcore dump。
やるなぁ。
というか、dateまで落ちるようになったぞ。
もちろんinstallkernelも出来ないし。
さて。
再起動すると悪化するか?
mount
されるベキか不明だぞ。
emergency shellをあげて、catはないから…
ddはあるのか。
「dd < fstab
」とかしてメモメモ。
んで、Upgrade再開。
fsck
までいった。
smartctl -a /dev/ad1
」したらReallocated_Sector_Ctは16だった。
とりあえずzero fillしてみるか。
dump
結果を展開してみる。
cvsup
。
しかし、4.11R→6.1Rで「make buildworld
」でうまくいけるのかという疑問はあるな。
make world
は進んでいるようだ。
明日の朝まで放置だな。
buildkernel
はどうするか。
うーん。
最終的には6Rを目指すということで今回はGENERICでいいか。
dump
出力による残り時間は大体、ちゃんと実際の5分経過で5分ずつ減るようになりつつあるが、今度は5分未満も増えてきた気がする。
でも、この分だと8:20amぐらいには終るかな。
んで、その後はこんな感じ:
8:03 7:58 7:53 7:49 7:43 7:38 7:33 7:27 7:22 7:17 7:12 7:07 7:02 6:57
6:52 6:47 6:42 6:38 6:33 6:28 6:23 6:18 6:13 6:08 6:03 5:58 5:53 5:48
5:42 5:37 5:32 5:27 5:23 5:17 5:13 5:08 5:01 4:57 4:51 4:46 4:41 4:37
4:32 4:27 4:22 4:17 4:11 4:06 4:02 3:57 3:52 3:46 3:41 3:36 3:31 3:26
3:21 3:15 3:11 3:06 3:00 2:56 2:51 2:46 2:41 2:35 2:30 2:25 2:19 2:15
2:09 2:05 2:00 1:55 1:50 1:45 1:40 1:35 1:30 1:25 1:20 1:15 1:10 1:05
1:00 0:55 0:49 0:45 0:39 0:34 0:29 0:25 0:20 0:15 0:10 0:05
dump
が終った。
time stampを見ると8:03amには終ってたようだ。
エラーも全く検出せず。
とりあえず毎秒のifconfig rl0 up
は止めるか。
restore fi
でいくつかls
とかcd
した感じでは問題無いけど。
やっぱりPATA HDの予備が無いのは痛いな。
rdump
でどこまで取り出せるか実験。
ifconfig rl0 down
」「ifconfig rl0 up
」して復活。
dump
し直し。
ifconfig rl0 down
」「ifconfig rl0 up
」して様子見。
ifconfig rl0 up
」だけでも復活するみたいだ。
こんなに落ち続けるのは納得できないけど、仕方ないのでAd Hocだが5秒に一度「ifconfig rl0 up
」かけることにする。
ping -c 100
をかけたら11% packet lossらしい。
5秒に一回の「ifconfig rl0 up
」は多いのか少ないのか。
ifconfig rl0 up
」のタイミングでpacketが落ちているような気がする。
ちょうど「DUMP: 0.87% done, finished in 28:24」と出たので、次の残り時間表示がどうなるか、「ifconfig rl0 up
」を10秒に一回に変えて様子見。
ifconfig rl0 up
」を毎秒に変えてみよう。
dump
出力は「DUMP: 1.91% done, finished in 26:11」。
ifconfig
をもっと頻繁にする価値はあるだろうか。
dump
出力による残り時間:
24:52 24:21 23:38 23:16 22:39 22:06 21:37 21:19 21:03 20:47 20:31
20:20 20:03 19:50 19:47 19:43
dump
出力による残り時間:
19:36 19:28 19:17 19:08 18:58 18:50 18:43 18:38 18:33 18:27 18:20
18:13 18:06 17:59 17:52 17:48 17:43 17:35 17:27 17:20 17:13 17:06
17:00 16:54 16:48 16:44 16:40 16:34 16:30 16:22 16:17 16:10 16:04
15:59 15:54 15:50 15:44 15:38 15:33 15:28 15:23 15:16 15:10 15:05
14:57 14:53 14:47 14:43 14:37 14:31 14:26 14:20 14:15 14:10 14:06
14:01 13:54 13:49 13:45 13:39 13:24 13:29 13:24 13:18 13:12 13:07
13:01 12:56 12:52 12:48 12:43 12:36 12:30 12:25 12:19 12:14 12:09
12:04 11:59 11:53 11:50 11:45 11:40 11:35 11:30 11:25 11:19 11:14
11:08 11:03 10:57 10:51 10:45 10:40 10:34 10:29 10:24 10:19 10:14
10:08 10:03 9:59 9:54 9:49 9:45 9:40 9:35 9:30 9:24 9:20 9:15 9:10
9:06 9:01 8:56 8:50 8:45 8:40 8:35 8:30 8:26 8:22 8:17 8:12 8:08
ad1s1e: hard error reading fsbn 27705535 of 13852736-13852767 (ad1s1 bn 27705535; cn 1724 tn 150 sn 25) trying PIO modeこの1 sectorだけじゃなくて、たくさんエラーがでた。 さて、どうするかな。 この3rd PCはFreeBSD4Rから6Rにし、UFS2を使おうと思っていたところではあるんだよな。 とりあえずpending。
本ページの主張等は著者の所属組織に全く関係なく、個人としてのものです。