Мониторинг Linux-системы : софт
Модераторы: Trinity admin`s, Free-lance moderator`s
Мониторинг Linux-системы : софт
Добрый день!
Имеется 1U сервер (вашей сборки ) с двумя блоками питания, проц Quad, SATA RAID 10
Уже полгода работает как часы (тьфу-тьфу-тьфу-). Но, хотелось бы получить предупреждение о том что:
- вылетел один из БП
- проблемы с RAID
- проблемы с температурным режимом
- проблемы с фаном
Какой софт можете посоветовать чайнику под Linux?, чтобы предупреждал о проблемах? Что еще надо бы мониторить?
Имеется 1U сервер (вашей сборки ) с двумя блоками питания, проц Quad, SATA RAID 10
Уже полгода работает как часы (тьфу-тьфу-тьфу-). Но, хотелось бы получить предупреждение о том что:
- вылетел один из БП
- проблемы с RAID
- проблемы с температурным режимом
- проблемы с фаном
Какой софт можете посоветовать чайнику под Linux?, чтобы предупреждал о проблемах? Что еще надо бы мониторить?
Re: Мониторинг Linux-системы : софт
Одно из самых универсальных решений: NAGIOS (последняя версия: 3).
Умеет опрашивать статус других серверов (NRPE, SNMP), куча плугинов под различное железо, lmsensors на ура и т.п.
Умеет опрашивать статус других серверов (NRPE, SNMP), куча плугинов под различное железо, lmsensors на ура и т.п.
Re: Мониторинг Linux-системы : софт
Nagios - больше предназначен для мониторинга сети, в условиях локальной сети показывает себя прекрасно, но в условиях интернета очень много ложных срабатываний. А есть ещё cacti (в работе не видел) и Munin ( у знакомых стояло - память, загрузка сети, винча).
- RedScorp
- Advanced member
- Сообщения: 158
- Зарегистрирован: 24 июл 2003, 11:01
- Откуда: Западный Казахстан, г.Уральск
- Контактная информация:
Re: Мониторинг Linux-системы : софт
Вопрос интересный, и на сколько я уже успел понять - бесплатные проекты не всегда есть гуд. Хотя недавно мониторил у себя при помощи Munin. Устанавливается легко, правда почему-то в упор отказался формировать графики по мускулу. А еще при генерировании красивых графиков уж очень сильно напрягает всю систему.
Re: Мониторинг Linux-системы : софт
Мониторинг - такое же искусство, как и ваяние баз данных или создание сайтов.
Ни одна система мониторинга не работает нормально из коробки. Ее все равно надо доводить под свои задачи. Тот же NAGIOS для тестов использует модули. Если не полениться и почитать документацию, то можно увидеть, что модули настраиваются. Те же тайм-ауты там выставляются, кол-во срабатываний при которых засчитывается ошибка. Надо все читать, вникать, понимать как это работает и как коррелируется с реальной жизнью. Вот тогда будет счастье. Тогда будет успех.
Ни одна система мониторинга не работает нормально из коробки. Ее все равно надо доводить под свои задачи. Тот же NAGIOS для тестов использует модули. Если не полениться и почитать документацию, то можно увидеть, что модули настраиваются. Те же тайм-ауты там выставляются, кол-во срабатываний при которых засчитывается ошибка. Надо все читать, вникать, понимать как это работает и как коррелируется с реальной жизнью. Вот тогда будет счастье. Тогда будет успех.
Re: Мониторинг Linux-системы : софт
>> Те же тайм-ауты там выставляются, кол-во срабатываний при которых засчитывается ошибка.
Если есть такая возможность, можно подробнее написать про это на примере check_command - check_ping .
Если есть такая возможность, можно подробнее написать про это на примере check_command - check_ping .
Re: Мониторинг Linux-системы : софт
Коллега, ну давайте конструктивно, а? Я же сказал, что читать надо. И читать самостоятельно!
Первая же ссылка в Гугле ведет сюда: http://nagiosplugins.org/man/check_ping
Прочитайте, что не понятно спрашивайте.
Первая же ссылка в Гугле ведет сюда: http://nagiosplugins.org/man/check_ping
Прочитайте, что не понятно спрашивайте.
Re: Мониторинг Linux-системы : софт
Было дело, в гугле искал, это понятно. Интересует формат команды в конфиге:
check_command check_ping!100.0,20%!500.0,60%
Какой параметр , за что отвечает, и какой формат. Настройки для конфига по выше указанной ссылке не подходят.
check_command check_ping!100.0,20%!500.0,60%
Какой параметр , за что отвечает, и какой формат. Настройки для конфига по выше указанной ссылке не подходят.
Re: Мониторинг Linux-системы : софт
Я бы вам настоятельно рекомендовал почитать как работают плагины в Nagios. Как они запускаются и как Nagios интерпретирует результаты, которые эти плагины возвращают.
Конкретно на этом примере отвечаю, что плагин check_ping возвращает строку из двух параметров. Время отклика и кол-во потерь пакетов.
Конструкция !100.0,20%!500.0,60% означает, что допустимым параметром является время отклика до 100 милисек или 20% потерь пакетов. Недопустимым параметром является время отклика более 500 милисек или 60% потерь пакетов.
Соответственно в зависимости от результатов вы либо получите от Nagios уведомление о проблеме, либо он будет вам рисовать, что все хорошо.
Начните чтение отсюда: http://ru.wikipedia.org/wiki/Nagios
Официальную документацию читать до дыр! Потом все остальное. Поверьте, поняв как внутри все устроено вы быстро поймете что к чему. И то, что казалось сложным станет архи простым и понятным.
Конкретно на этом примере отвечаю, что плагин check_ping возвращает строку из двух параметров. Время отклика и кол-во потерь пакетов.
Конструкция !100.0,20%!500.0,60% означает, что допустимым параметром является время отклика до 100 милисек или 20% потерь пакетов. Недопустимым параметром является время отклика более 500 милисек или 60% потерь пакетов.
Соответственно в зависимости от результатов вы либо получите от Nagios уведомление о проблеме, либо он будет вам рисовать, что все хорошо.
Начните чтение отсюда: http://ru.wikipedia.org/wiki/Nagios
Официальную документацию читать до дыр! Потом все остальное. Поверьте, поняв как внутри все устроено вы быстро поймете что к чему. И то, что казалось сложным станет архи простым и понятным.
Re: Мониторинг Linux-системы : софт
Огромное спасибо, буду читать.
А ещё вопрос, я там видел картинку с графиком http://ru.wikipedia.org/wiki/Файл:Nagios.png
Там есть графики, например "DNS Response Time" - как такие можно получить?
А ещё вопрос, я там видел картинку с графиком http://ru.wikipedia.org/wiki/Файл:Nagios.png
Там есть графики, например "DNS Response Time" - как такие можно получить?
Re: Мониторинг Linux-системы : софт
Заменил в /etc/nagios/minimal.cfg в определении define service
check_command check_ping!100.0,20%!500.0,60%
на
check_command check_ping!180.0,20%!500.0,60%
Птотом сделал
/etc/init.d/nagios stop
/etc/init.d/nagios start
А сообщение на почту о "PING WARNING - Packet loss = 0%, RTA = 103.73 ms" продолжают приходить.
Что я не так делаю ?
check_command check_ping!100.0,20%!500.0,60%
на
check_command check_ping!180.0,20%!500.0,60%
Птотом сделал
/etc/init.d/nagios stop
/etc/init.d/nagios start
А сообщение на почту о "PING WARNING - Packet loss = 0%, RTA = 103.73 ms" продолжают приходить.
Что я не так делаю ?
Re: Мониторинг Linux-системы : софт
Графики рисуются через плагин, который работает с RRDtools. На сайте с плагинами поройся.
Неверная настройка видимо связано с неверной работой самого плагина (может быть исправлено в более свежих версиях Nagios, либо ты что-то не заметил. Надо тщательнее рыть конфиг.
Неверная настройка видимо связано с неверной работой самого плагина (может быть исправлено в более свежих версиях Nagios, либо ты что-то не заметил. Надо тщательнее рыть конфиг.
Re: Мониторинг Linux-системы : софт
Ок! Спасибо.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 40 гостей