X8SIA и Machine Check Exception, зависания

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
DanielKing
member
Сообщения: 24
Зарегистрирован: 23 июн 2007, 11:23
Откуда: Москва

X8SIA и Machine Check Exception, зависания

Сообщение DanielKing » 08 дек 2011, 12:49

Доброго дня, All.

Примерно в августе на машине (конфиг: X8SIA/iX3450/MegaRAID SAS 9261-8i) начались странные зависания и падения в Machine Check Exception. Причем регистры пустые. После установки PCIe payload size в 128B падать стала по ощущениям реже, но вот опять - вчера за одни сутки два раза упала в MCE.
Гуглил долго и упорно - в основном у людей две проблемы: либо несовместимость с RAID контроллером, либо подобное проявлялось на ядрах начиная с 2.6.18, но на LKML ничего нет.
Прогоняли memtest86+ - все без толку, тест чистый. Есть подозрения, что падения начинаются при большой нагрузке на сеть (машина - выделенный iSCSI target). RAID массивы тоже чистые. Установлен Debian lenny. Ломаю голову, как быть с машиной...
Скриншоты с сообщением о MCE:
Изображение

uname -a:

Код: Выделить всё

Linux store01 2.6.26-2-amd64 #1 SMP Mon Jun 13 16:29:33 UTC 2011 x86_64 GNU/Linux
Отчет lshw тут (paste.org.ru).

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Re: X8SIA и Machine Check Exception, зависания

Сообщение setar » 12 дек 2011, 10:35

Ну а внимательно экран почитать по шагам?
Там все предельно понятно - кора вываливается при попытке влить "новую" BMC для IPMI
которая к тому же пытается двигать параметры hpet таймера.
Писакам драйверов руки бы за такое поотрывать, типа им виднее чем производителю что там должно быть.
Уберите прошивку биосов из ядра, это чаще всего только хуже делает.
Для проверки можно просто отключить поддержку ipmi в ядре.
t.me: @RoboforumSetar ; st@3nt.ru

DanielKing
member
Сообщения: 24
Зарегистрирован: 23 июн 2007, 11:23
Откуда: Москва

Re: X8SIA и Machine Check Exception, зависания

Сообщение DanielKing » 12 дек 2011, 18:34

setar писал(а):Там все предельно понятно - кора вываливается при попытке влить "новую" BMC для IPMI
которая к тому же пытается двигать параметры hpet таймера.
Вообще-то я удаленно подгружал ipmi-si и ipmi-devintf где-то за день до этого, при этом мессага вылезла в консоль. :)
Сомневаюсь, что дело в этом. На timestamp посмотрите :)

Да и вообще, IPMI там стал нужен ровно тогда, когда оно начало падать.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 8 гостей