VPS不具合その2

またサーバが止まってる。。
最近多いなー
お隣さんVMが大忙しでなのかな。
そこら辺の状況は見れないのでよく解らないけど、とにかくよく止まってる。



Aug 21 14:23:09 brokendish kernel: [67656.992994]
Aug 21 14:25:04 brokendish kernel: [67722.907701] BUG: soft lockup - CPU#0 stuck for 61s! [rsyslogd:4324]
Aug 21 14:25:04 brokendish kernel: [67722.907701] Modules linked in: ipv6 fuse loop snd_pcsp snd_pcm snd_timer snd soundcore psmouse snd_page_alloc serio_raw i2c_piix4 i2c_core button evdev ext3 jbd mbcache ide_disk ide_cd_mod cdrom ata_generic libata scsi_mod dock ide_pci_generic floppy e1000 uhci_hcd piix ide_core thermal processor fan thermal_sys [last unloaded: scsi_wait_scan]
Aug 21 14:25:04 brokendish kernel: [67722.907701] CPU 0:
Aug 21 14:25:04 brokendish kernel: [67722.907701] Modules linked in: ipv6 fuse loop snd_pcsp snd_pcm snd_timer snd soundcore psmouse snd_page_alloc serio_raw i2c_piix4 i2c_core button evdev ext3 jbd mbcache ide_disk ide_cd_mod cdrom ata_generic libata scsi_mod dock ide_pci_generic floppy e1000 uhci_hcd piix ide_core thermal processor fan thermal_sys [last unloaded: scsi_wait_scan]
Aug 21 14:25:04 brokendish kernel: [67722.907701] Pid: 4324, comm: rsyslogd Not tainted 2.6.26-2-amd64 #1
Aug 21 14:25:04 brokendish kernel: [67722.907701] RIP: 0033:[]  [] _einittext+0x7f05b02d/0xffffffffffe8875b
Aug 21 14:25:04 brokendish kernel: [67722.907701] RSP: 002b:0000000041a59d28  EFLAGS: 00010282
Aug 21 14:25:04 brokendish kernel: [67722.907701] RAX: 000000004547e732 RBX: 00000000003e0296 RCX: 0000000000000000
Aug 21 14:25:04 brokendish kernel: [67722.907701] RDX: 0000000000410f7d RSI: 0000000000000000 RDI: 0000000041a59d50
Aug 21 14:25:04 brokendish kernel: [67722.907701] RBP: 0000000000000000 R08: 00007f03c8006de8 R09: 0000000000000000
Aug 21 14:25:04 brokendish kernel: [67722.907701] R10: 00007f03cd9f7a50 R11: 0000000000000000 R12: 0000000041a59ffc
Aug 21 14:25:04 brokendish kernel: [67722.907701] R13: 00007f03c8005c30 R14: ffffffff80230654 R15: ffff810014807f78
Aug 21 14:25:04 brokendish kernel: [67722.907701] FS:  0000000041a5a950(0063) GS:ffffffff8053d000(0000) knlGS:0000000000000000
Aug 21 14:25:04 brokendish kernel: [67722.907701] CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
Aug 21 14:25:04 brokendish kernel: [67722.907701] CR2: 00000000011fb930 CR3: 000000001e4ad000 CR4: 00000000000006e0
Aug 21 14:25:04 brokendish kernel: [67722.907701] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
Aug 21 14:25:04 brokendish kernel: [67722.907701] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
Aug 21 14:25:04 brokendish kernel: [67722.907701]
Aug 21 14:25:04 brokendish kernel: [67722.907701] Call Trace:
Aug 21 14:25:04 brokendish kernel: [67722.907701]
Aug 21 14:27:50 brokendish kernel: [67937.344814] INFO: task kjournald:745 blocked for more than 120 seconds.
Aug 21 14:27:50 brokendish kernel: [67937.344814] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Aug 21 14:27:50 brokendish kernel: [67937.346997] kjournald     D ffff810001002bc0     0   745      2
Aug 21 14:27:50 brokendish kernel: [67937.347002]  ffff81001d425d30 0000000000000046 0000000000000000 ffffffff8024ac9e
Debianメーリングリストから情報を見つけたので一部抜粋
[debian-users:55275] Re: BUG: soft lockup - CPU# で止まってしまう
一部抜粋
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
CPU のソフト的なロックアップを、各 CPU に対するスケジュール間隔で見ているカーネル内論理が
ありますが、VM では実 CPU がいつでも取れるわけではないので。
現在のカーネルではこの問題は認識されていて、VM で取られた CPU 時
間の補正はある程度はいっているはずなんですが、まだ不完全でこの現
象が起きるようです。

基本的には時間で soft lockup を見ているのが乱暴すぎるので

CONFIG_DETECT_SOFTLOCKUP=n

が正しいと思いますが、頻度だけ大幅に下げるということで良ければ

echo 1000 > /proc/sys/kernel/softlockup_thresh

とかして、検出時間を延ばす、例えば 1000 秒、とかにしてしまうのも
アリかと。これでも、自分の VM がものすごく暇で、忙しい VM がやっ
てくると現象再発するかも知れません。

ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

[debian-users:55281] Re: BUG: soft lockup - CPU# で止まってしまう
一部抜粋
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
softlockup_threshを試してみました。
現状の設定が60秒だったのを300秒にしましたが、どうもMAX値が60のようで、そ
れより大きな数字には設定出来ませんでした。
#調べて見ると、0指定で機能を停止するようなパッチもあるようです。

今後、vm上でDebianが使われる事がもっともっと増えると思うので、うまい方法
が出てこればなと思っております。
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

んんんーーーー
どうしょうか

カーネル再構築しか道はなさそうだし、Debian5(lenny) からDebian6(Squeeze)
にアップグレードしようとも思ってたしでもDebian6(Squeeze)にしても状況は変わらなそうだし。。
よし。先に進むにはDebian6(Squeeze)にアップグレードしよう。
 

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です