Мониторинг Linux-системы : софт

На доскональное знание данной темы, не может претендовать, пожалуй ни один спец, из ныне живущих на земле. ;-)
Так поможем друг другу.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
denvor
Junior member
Сообщения: 15
Зарегистрирован: 21 янв 2007, 18:03
Откуда: Москва

Мониторинг Linux-системы : софт

Сообщение denvor » 24 ноя 2008, 22:00

Добрый день!

Имеется 1U сервер (вашей сборки :) ) с двумя блоками питания, проц Quad, SATA RAID 10

Уже полгода работает как часы (тьфу-тьфу-тьфу-). Но, хотелось бы получить предупреждение о том что:

- вылетел один из БП
- проблемы с RAID
- проблемы с температурным режимом
- проблемы с фаном

Какой софт можете посоветовать чайнику под Linux?, чтобы предупреждал о проблемах? Что еще надо бы мониторить?

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 24 ноя 2008, 23:05


Аватара пользователя
setar
Site Admin
Site Admin
Сообщения: 1990
Зарегистрирован: 22 авг 2002, 12:03
Откуда: St. Petersburg

Сообщение setar » 26 ноя 2008, 11:18

Tivoli Monitoring и будет вам счастье.
денежек стоит

utandr
Junior member
Сообщения: 12
Зарегистрирован: 03 июн 2009, 17:02
Откуда: Moscow

Re: Мониторинг Linux-системы : софт

Сообщение utandr » 03 июн 2009, 17:18

Одно из самых универсальных решений: NAGIOS (последняя версия: 3).

Умеет опрашивать статус других серверов (NRPE, SNMP), куча плугинов под различное железо, lmsensors на ура и т.п.

Gh0st
Junior member
Сообщения: 16
Зарегистрирован: 22 авг 2009, 01:06
Откуда: Санкт-Петербург

Re: Мониторинг Linux-системы : софт

Сообщение Gh0st » 01 сен 2009, 22:13

Nagios - больше предназначен для мониторинга сети, в условиях локальной сети показывает себя прекрасно, но в условиях интернета очень много ложных срабатываний. А есть ещё cacti (в работе не видел) и Munin ( у знакомых стояло - память, загрузка сети, винча).

Аватара пользователя
RedScorp
Advanced member
Сообщения: 158
Зарегистрирован: 24 июл 2003, 11:01
Откуда: Западный Казахстан, г.Уральск
Контактная информация:

Re: Мониторинг Linux-системы : софт

Сообщение RedScorp » 02 окт 2009, 09:03

Вопрос интересный, и на сколько я уже успел понять - бесплатные проекты не всегда есть гуд. Хотя недавно мониторил у себя при помощи Munin. Устанавливается легко, правда почему-то в упор отказался формировать графики по мускулу. А еще при генерировании красивых графиков уж очень сильно напрягает всю систему.

and3008
Заслуженный сетевик
Сообщения: 1109
Зарегистрирован: 03 янв 2004, 23:30
Откуда: Н.Новгород

Re: Мониторинг Linux-системы : софт

Сообщение and3008 » 05 окт 2009, 19:05

Мониторинг - такое же искусство, как и ваяние баз данных или создание сайтов.

Ни одна система мониторинга не работает нормально из коробки. Ее все равно надо доводить под свои задачи. Тот же NAGIOS для тестов использует модули. Если не полениться и почитать документацию, то можно увидеть, что модули настраиваются. Те же тайм-ауты там выставляются, кол-во срабатываний при которых засчитывается ошибка. Надо все читать, вникать, понимать как это работает и как коррелируется с реальной жизнью. Вот тогда будет счастье. Тогда будет успех.

Gh0st
Junior member
Сообщения: 16
Зарегистрирован: 22 авг 2009, 01:06
Откуда: Санкт-Петербург

Re: Мониторинг Linux-системы : софт

Сообщение Gh0st » 07 окт 2009, 06:39

>> Те же тайм-ауты там выставляются, кол-во срабатываний при которых засчитывается ошибка.
Если есть такая возможность, можно подробнее написать про это на примере check_command - check_ping .

and3008
Заслуженный сетевик
Сообщения: 1109
Зарегистрирован: 03 янв 2004, 23:30
Откуда: Н.Новгород

Re: Мониторинг Linux-системы : софт

Сообщение and3008 » 07 окт 2009, 23:24

Коллега, ну давайте конструктивно, а? Я же сказал, что читать надо. И читать самостоятельно!
Первая же ссылка в Гугле ведет сюда: http://nagiosplugins.org/man/check_ping

Прочитайте, что не понятно спрашивайте.

Gh0st
Junior member
Сообщения: 16
Зарегистрирован: 22 авг 2009, 01:06
Откуда: Санкт-Петербург

Re: Мониторинг Linux-системы : софт

Сообщение Gh0st » 08 окт 2009, 22:37

Было дело, в гугле искал, это понятно. Интересует формат команды в конфиге:
check_command check_ping!100.0,20%!500.0,60%

Какой параметр , за что отвечает, и какой формат. Настройки для конфига по выше указанной ссылке не подходят.

and3008
Заслуженный сетевик
Сообщения: 1109
Зарегистрирован: 03 янв 2004, 23:30
Откуда: Н.Новгород

Re: Мониторинг Linux-системы : софт

Сообщение and3008 » 08 окт 2009, 23:57

Я бы вам настоятельно рекомендовал почитать как работают плагины в Nagios. Как они запускаются и как Nagios интерпретирует результаты, которые эти плагины возвращают.

Конкретно на этом примере отвечаю, что плагин check_ping возвращает строку из двух параметров. Время отклика и кол-во потерь пакетов.

Конструкция !100.0,20%!500.0,60% означает, что допустимым параметром является время отклика до 100 милисек или 20% потерь пакетов. Недопустимым параметром является время отклика более 500 милисек или 60% потерь пакетов.

Соответственно в зависимости от результатов вы либо получите от Nagios уведомление о проблеме, либо он будет вам рисовать, что все хорошо.

Начните чтение отсюда: http://ru.wikipedia.org/wiki/Nagios

Официальную документацию читать до дыр! Потом все остальное. Поверьте, поняв как внутри все устроено вы быстро поймете что к чему. И то, что казалось сложным станет архи простым и понятным.

Gh0st
Junior member
Сообщения: 16
Зарегистрирован: 22 авг 2009, 01:06
Откуда: Санкт-Петербург

Re: Мониторинг Linux-системы : софт

Сообщение Gh0st » 11 окт 2009, 07:18

Огромное спасибо, буду читать.
А ещё вопрос, я там видел картинку с графиком http://ru.wikipedia.org/wiki/Файл:Nagios.png
Там есть графики, например "DNS Response Time" - как такие можно получить?

Gh0st
Junior member
Сообщения: 16
Зарегистрирован: 22 авг 2009, 01:06
Откуда: Санкт-Петербург

Re: Мониторинг Linux-системы : софт

Сообщение Gh0st » 12 окт 2009, 08:54

Заменил в /etc/nagios/minimal.cfg в определении define service
check_command check_ping!100.0,20%!500.0,60%
на
check_command check_ping!180.0,20%!500.0,60%
Птотом сделал
/etc/init.d/nagios stop
/etc/init.d/nagios start

А сообщение на почту о "PING WARNING - Packet loss = 0%, RTA = 103.73 ms" продолжают приходить. :(
Что я не так делаю ?

and3008
Заслуженный сетевик
Сообщения: 1109
Зарегистрирован: 03 янв 2004, 23:30
Откуда: Н.Новгород

Re: Мониторинг Linux-системы : софт

Сообщение and3008 » 12 окт 2009, 18:05

Графики рисуются через плагин, который работает с RRDtools. На сайте с плагинами поройся.

Неверная настройка видимо связано с неверной работой самого плагина (может быть исправлено в более свежих версиях Nagios, либо ты что-то не заметил. Надо тщательнее рыть конфиг.

Gh0st
Junior member
Сообщения: 16
Зарегистрирован: 22 авг 2009, 01:06
Откуда: Санкт-Петербург

Re: Мониторинг Linux-системы : софт

Сообщение Gh0st » 13 окт 2009, 23:29

Ок! Спасибо.

Ответить

Вернуться в «Серверы - ПО, Unix подобные системы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 13 гостей