Сервер перезагружается. Как выявить проблему ? (+)
Модераторы: Trinity admin`s, Free-lance moderator`s
-
- Junior member
- Сообщения: 12
- Зарегистрирован: 03 авг 2004, 15:17
- Откуда: Санкт-Петербург
- Контактная информация:
Сервер перезагружается. Как выявить проблему ? (+)
Добрый день, уважаемые посетители форума!
Есть сервер, на котором сейчас крутятся Apache (perl, PHP)+mysql под FreeBSD 5.3
Нагрузка - около 1.5 тыс. хостов в день.
Железо: MB Intel 7210TP1 в корпусе SR1325TP1, CPU P-IV 3G, память 2xDDR PC3200 512Mb Kingston ECC, диск Seagate 36,7 U320, контроллер (взято из dmesg) LSILogic 1030 Ultra4 Adapter.
Все это питается через UPS.
Проблема: Машина иногда перезагружается. Никаких ошибок в логах при этом нет вообще, даже намёков не видно (или не вижу). При этом может проработать неск.дней без перезагрузок, а может через каждые 2 часа ребутится.
Изначально эта проблема стала наблюдаться на этой же машине, но стояла ОС FreeBSD 5.2.1.
Перезагрузки стали настолько часты, что машина была отдана в фирму где была куплена, чтобы они выясняли проблему. После их тестирования машина была возвращена со словами: Никаких проблем нету. И их действительно не было. Но после месяца работы в провайдерской стойке началось опять "двадцать пять".
Может есть какие-то методы выявления причин падаения?
Заранее благодарен за любые советы.
Есть сервер, на котором сейчас крутятся Apache (perl, PHP)+mysql под FreeBSD 5.3
Нагрузка - около 1.5 тыс. хостов в день.
Железо: MB Intel 7210TP1 в корпусе SR1325TP1, CPU P-IV 3G, память 2xDDR PC3200 512Mb Kingston ECC, диск Seagate 36,7 U320, контроллер (взято из dmesg) LSILogic 1030 Ultra4 Adapter.
Все это питается через UPS.
Проблема: Машина иногда перезагружается. Никаких ошибок в логах при этом нет вообще, даже намёков не видно (или не вижу). При этом может проработать неск.дней без перезагрузок, а может через каждые 2 часа ребутится.
Изначально эта проблема стала наблюдаться на этой же машине, но стояла ОС FreeBSD 5.2.1.
Перезагрузки стали настолько часты, что машина была отдана в фирму где была куплена, чтобы они выясняли проблему. После их тестирования машина была возвращена со словами: Никаких проблем нету. И их действительно не было. Но после месяца работы в провайдерской стойке началось опять "двадцать пять".
Может есть какие-то методы выявления причин падаения?
Заранее благодарен за любые советы.
Это наиболее сложная для диагностики ситуация.
Кроме как метода исключения я не знаю.
Сам начал бы с софта. поставте туду заведомо рабочий RHEL (желательно именно его а не всякие многочисленные клоны. и не BSD).
После этого если проблемма будет иметь место - покомпонентно менять железо.
Хотя я думаю замены софта будет достаточно.
Кроме как метода исключения я не знаю.
Сам начал бы с софта. поставте туду заведомо рабочий RHEL (желательно именно его а не всякие многочисленные клоны. и не BSD).
После этого если проблемма будет иметь место - покомпонентно менять железо.
Хотя я думаю замены софта будет достаточно.
-
- Junior member
- Сообщения: 12
- Зарегистрирован: 03 авг 2004, 15:17
- Откуда: Санкт-Петербург
- Контактная информация:
По поводу ОС.
Перед тем, как отдавать машину, я ставил на неё:
RedHat 9.0 и Windows 2000 Server.
И там и там пробовал переписывать большие файлы с раздела на раздел - падения налюдались. Причём после каждой очередной перезагрузки успевало переписаться всё меньшее и меньшее кол-во МБайт.
После этого я решил, что проблемы не в ОС, т.к. Intel указал, что под этими ОС их мать прошла Install&Stress Test.
Так же кроме этих ОС ставил FreeBSD 4.10, отключал SMP и ACPI.
Видимо, проблемы действительно в комплектующих. Что ж, придётся выяснять методом научного тыка.
А memtest на рабочей FreeBSD можно погонять? А то машина сейчас в строю, рубут не фатален, а вот в ДОС никак не загрузится естественно.
Перед тем, как отдавать машину, я ставил на неё:
RedHat 9.0 и Windows 2000 Server.
И там и там пробовал переписывать большие файлы с раздела на раздел - падения налюдались. Причём после каждой очередной перезагрузки успевало переписаться всё меньшее и меньшее кол-во МБайт.
После этого я решил, что проблемы не в ОС, т.к. Intel указал, что под этими ОС их мать прошла Install&Stress Test.
Так же кроме этих ОС ставил FreeBSD 4.10, отключал SMP и ACPI.
Видимо, проблемы действительно в комплектующих. Что ж, придётся выяснять методом научного тыка.
А memtest на рабочей FreeBSD можно погонять? А то машина сейчас в строю, рубут не фатален, а вот в ДОС никак не загрузится естественно.
http://www.memtest.org/ - часов на 6 хотя бы запустить
Вообще очень похоже на память
Вообще очень похоже на память
-
- Junior member
- Сообщения: 12
- Зарегистрирован: 03 авг 2004, 15:17
- Откуда: Санкт-Петербург
- Контактная информация:
Re: Сервер перезагружается. Как выявить проблему ? (+)
Много времени прошло с тех пор, но всё же расскажу чем всё закончилось, вдруг кому-то пригодится.
Дело было в материнской плате, а точнее в сетевом контроллере intel который был на борту.
С помощью программы netio, которая есть как в портах для FreeBSD (/usr/ports/benchmarks/netio), так и под другими ОС, мне удавалось
гарантированно отправлять сервер в ребут. Почему именно netio не знаю, обнаружилось случайно.
Через 5-30 секунд работы утилиты сервер стабильно перезагружался. Проверялось на linux и windows.
Таким образом материнская плата была поменяна по гарантии - продавцы больше не могли вернуть тот же сервер через 40 дней со словами "у нас сервер стоял включенный всё это время, никаких перезагрузок, всё нормально".
С тех пор сервер проработал более 3 лет без внеплановых перезагрузок.
Дело было в материнской плате, а точнее в сетевом контроллере intel который был на борту.
С помощью программы netio, которая есть как в портах для FreeBSD (/usr/ports/benchmarks/netio), так и под другими ОС, мне удавалось
гарантированно отправлять сервер в ребут. Почему именно netio не знаю, обнаружилось случайно.
Через 5-30 секунд работы утилиты сервер стабильно перезагружался. Проверялось на linux и windows.
Таким образом материнская плата была поменяна по гарантии - продавцы больше не могли вернуть тот же сервер через 40 дней со словами "у нас сервер стоял включенный всё это время, никаких перезагрузок, всё нормально".
С тех пор сервер проработал более 3 лет без внеплановых перезагрузок.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя