Сервер перезагружается. Как выявить проблему ? (+)

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Slava_K
Junior member
Сообщения: 12
Зарегистрирован: 03 авг 2004, 15:17
Откуда: Санкт-Петербург
Контактная информация:

Сервер перезагружается. Как выявить проблему ? (+)

Сообщение Slava_K » 27 янв 2005, 16:25

Добрый день, уважаемые посетители форума!

Есть сервер, на котором сейчас крутятся Apache (perl, PHP)+mysql под FreeBSD 5.3
Нагрузка - около 1.5 тыс. хостов в день.
Железо: MB Intel 7210TP1 в корпусе SR1325TP1, CPU P-IV 3G, память 2xDDR PC3200 512Mb Kingston ECC,  диск Seagate 36,7 U320, контроллер (взято из dmesg) LSILogic 1030 Ultra4 Adapter.
Все это питается через UPS.

Проблема: Машина иногда перезагружается.  Никаких ошибок в логах при этом нет вообще, даже намёков не видно (или не вижу). При этом может проработать неск.дней без перезагрузок, а может через каждые 2 часа ребутится.

Изначально эта проблема стала наблюдаться на этой же машине, но стояла ОС FreeBSD 5.2.1.
Перезагрузки стали настолько часты, что машина была отдана в фирму где была куплена, чтобы они выясняли проблему. После их тестирования машина была возвращена со словами: Никаких проблем нету. И их действительно не было. Но после месяца работы в провайдерской стойке началось опять "двадцать пять".

Может есть какие-то методы выявления причин падаения?

Заранее благодарен за любые советы.

Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 27 янв 2005, 16:33

Это наиболее сложная для диагностики ситуация.
Кроме как метода исключения я не знаю.

Сам начал бы с софта. поставте туду заведомо рабочий RHEL (желательно именно его а не всякие многочисленные клоны. и не BSD).

После этого если проблемма будет иметь место - покомпонентно менять железо.

Хотя я думаю замены софта будет достаточно.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 27 янв 2005, 16:34

Да трудно сказать. Но, судя по тому, что логи пустые - возможно память (не успевает система ничего сказать). Прогоните-ка мемтест досовский.

Slava_K
Junior member
Сообщения: 12
Зарегистрирован: 03 авг 2004, 15:17
Откуда: Санкт-Петербург
Контактная информация:

Сообщение Slava_K » 27 янв 2005, 17:20

По поводу ОС.
Перед тем, как отдавать машину, я ставил на неё:
RedHat 9.0 и Windows 2000 Server.
И там и там пробовал переписывать большие файлы с раздела на раздел - падения налюдались. Причём после каждой очередной перезагрузки  успевало переписаться всё меньшее и меньшее кол-во МБайт.
После этого я решил, что проблемы не в ОС, т.к. Intel указал, что под этими ОС их мать прошла Install&Stress Test.
Так же кроме этих ОС ставил FreeBSD 4.10, отключал SMP и ACPI.

Видимо, проблемы действительно в комплектующих. Что ж, придётся выяснять методом научного тыка.

А memtest на рабочей FreeBSD можно погонять? А то машина сейчас в строю, рубут не фатален, а вот в ДОС никак не загрузится естественно.

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 27 янв 2005, 17:38

Мемтест, который мы юзаем, работает с бутового диска - сиди или флоп
Конечно всякие есть, но чтобы под фрю - сомневаюсь...

sts
Advanced member
Сообщения: 66
Зарегистрирован: 04 авг 2003, 16:49
Откуда: Владивосток

Сообщение sts » 03 фев 2005, 13:38

http://www.memtest.org/ - часов на 6 хотя бы запустить
Вообще очень похоже на память

Slava_K
Junior member
Сообщения: 12
Зарегистрирован: 03 авг 2004, 15:17
Откуда: Санкт-Петербург
Контактная информация:

Re: Сервер перезагружается. Как выявить проблему ? (+)

Сообщение Slava_K » 27 авг 2012, 16:45

Много времени прошло с тех пор, но всё же расскажу чем всё закончилось, вдруг кому-то пригодится.

Дело было в материнской плате, а точнее в сетевом контроллере intel который был на борту.

С помощью программы netio, которая есть как в портах для FreeBSD (/usr/ports/benchmarks/netio), так и под другими ОС, мне удавалось
гарантированно отправлять сервер в ребут. Почему именно netio не знаю, обнаружилось случайно.

Через 5-30 секунд работы утилиты сервер стабильно перезагружался. Проверялось на linux и windows.

Таким образом материнская плата была поменяна по гарантии - продавцы больше не могли вернуть тот же сервер через 40 дней со словами "у нас сервер стоял включенный всё это время, никаких перезагрузок, всё нормально".

С тех пор сервер проработал более 3 лет без внеплановых перезагрузок.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя