ошибка, read-only файловая система на SuSe

На доскональное знание данной темы, не может претендовать, пожалуй ни один спец, из ныне живущих на земле. ;-)
Так поможем друг другу.

Модераторы: Trinity admin`s, Free-lance moderator`s

George Shot
member
Сообщения: 22
Зарегистрирован: 30 июн 2007, 09:12
Откуда: Samara

ошибка, read-only файловая система на SuSe

Сообщение George Shot » 30 июн 2007, 09:21

пытаюсь ввести в строй новый сервер
ставлю испробованную на десятке других объектов OpenSuse 10.2
это мне вполне удается, но
через сутки работы файловая система на сервере становится read-only
системных сообщений для root не посылается
в логах ничего полезного тоже подчерпнуть не могу
последними записями в messages являются вот такие символы
..........
.........

после перезагрузки все опять хорошо, дебильные точки сменяются вполне невинными сообщениями, и на момент падения опять никакой информации извлечь нельзя
железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
вариантов я так вижу несколько - глючит контроллер, глючит SuSe, глюки у меня
дайте совет для расследования ситуации..

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Re: ошибка, read-only файловая система на SuSe

Сообщение Oleg2 » 30 июн 2007, 11:28

George Shot писал(а):пытаюсь ввести в строй новый сервер
ставлю испробованную на десятке других объектов OpenSuse 10.2
это мне вполне удается, но
через сутки работы файловая система на сервере становится read-only
системных сообщений для root не посылается
в логах ничего полезного тоже подчерпнуть не могу
последними записями в messages являются вот такие символы
..........
.........

после перезагрузки все опять хорошо, дебильные точки сменяются вполне невинными сообщениями, и на момент падения опять никакой информации извлечь нельзя
железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
вариантов я так вижу несколько - глючит контроллер, глючит SuSe, глюки у меня
дайте совет для расследования ситуации..
Подразумеваем, что все прошивки (BIOS, BMC, FRUSDR матери, Firmware RAID контроллера) и драйвера оборудования у Вас последние.
Я бы попробовал перенаправить syslog сообщения на другой диск (например, прицепил бы к набортовому контроллеру по временной схеме SATA диск).  Можно также посмотреть логи SAS контроллера на предмет ошибок.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: ошибка, read-only файловая система на SuSe

Сообщение Stranger03 » 02 июл 2007, 14:29

George Shot писал(а):железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
Я так понимаю, что это не контроллер, а полное барахло, причем софтово зависимое. Поставьте нормальный 3варь или Адаптек.

George Shot
member
Сообщения: 22
Зарегистрирован: 30 июн 2007, 09:12
Откуда: Samara

Re: ошибка, read-only файловая система на SuSe

Сообщение George Shot » 02 июл 2007, 15:46

Stranger03 писал(а):
George Shot писал(а):железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
Я так понимаю, что это не контроллер, а полное барахло, причем софтово зависимое. Поставьте нормальный 3варь или Адаптек.
безусловно сильное заявление
LSI уже не котируются?
поменять не могу, деньги заплачены

кстате прицепил на /var/log/ отдельный винт
особого просветления не наступило
сообщается об ошибке при попытке записи в массив данных
поскольку он read-only
тобишь получается от OS это не зависит

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Re: ошибка, read-only файловая система на SuSe

Сообщение Oleg2 » 02 июл 2007, 16:20

George Shot писал(а):
Stranger03 писал(а):
George Shot писал(а):железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
Я так понимаю, что это не контроллер, а полное барахло, причем софтово зависимое. Поставьте нормальный 3варь или Адаптек.
безусловно сильное заявление
LSI уже не котируются?
поменять не могу, деньги заплачены

кстате прицепил на /var/log/ отдельный винт
особого просветления не наступило
сообщается об ошибке при попытке записи в массив данных
поскольку он read-only
тобишь получается от OS это не зависит
Давайте определимся, что мы говорим об одном и том же.
Вы создали RAID на контроллере, который оформлен в виде
PCI-Express карточки, в которую Вы дополнительно установили
память и таблетку-ключ (RAID activation key).
Если да, то это полноценный аппаратный SAS RAID.
А программный RAID для этой матерински тоже существует и
создаётся на наборотовом (т.е. распаянном на матери)
SATA или SAS (в зависимости от модификации матери)
контроллере. Вот там RAID, AFAIK, действительно программный.

Уточните, пожалуйста, какой у RAID контроллер в Вашем случае и
будем разбираться с проблемой дальше.

George Shot
member
Сообщения: 22
Зарегистрирован: 30 июн 2007, 09:12
Откуда: Samara

Re: ошибка, read-only файловая система на SuSe

Сообщение George Shot » 02 июл 2007, 16:34

Oleg2 писал(а):
Давайте определимся, что мы говорим об одном и том же.
Вы создали RAID на контроллере, который оформлен в виде
PCI-Express карточки, в которую Вы дополнительно установили
память и таблетку-ключ (RAID activation key).
именно так, аппаратный контроллер SROMBSAS18E выполненный в виде карточки PCI-E
на нем и собран 50й мой SAS-RAID массив
для этого и понадобился ключ активации
Intel® RAID Activation key enables full intelligent SAS RAID
и память Samsung DDR2 400Mhz

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: ошибка, read-only файловая система на SuSe

Сообщение Stranger03 » 02 июл 2007, 16:37

George Shot писал(а):безусловно сильное заявление
LSI уже не котируются?
А какое заявление вы хотите? В самом начале вы писали про SROMBSAS18E, я так понимаю это встроенный в мать адаптер? И при чем здесь тогда LSI?
Ну и почитайте вот здесь:
http://www.intel.com/support/ru/motherb ... 023463.htm
А котнроллер этот, встроенный в мать, полное говно. Нормальный контроллер с памятью и батарейкой стоит бачков 500, как ваша мать.

George Shot
member
Сообщения: 22
Зарегистрирован: 30 июн 2007, 09:12
Откуда: Samara

Re: ошибка, read-only файловая система на SuSe

Сообщение George Shot » 02 июл 2007, 16:52

Stranger03 писал(а): В самом начале вы писали про SROMBSAS18E, я так понимаю это встроенный в мать адаптер?
И при чем здесь тогда LSI?
Ну и почитайте вот здесь:
http://www.intel.com/support/ru/motherb ... 023463.htm
неправильно понимаете - SROMBSAS18E это аппаратный внешний PCI-E контроллер на базе электроники от LSI
и кстате по вашей ссылке - у меня "правильная" серия
не подверженая описанной ошибке

+есть мысль
а влияет ли на работоспособность SAS-RAID наличие в системе еще и SATA винтов, подключенных к распаянному на мамке софт-контроллеру?

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Re: ошибка, read-only файловая система на SuSe

Сообщение Oleg2 » 02 июл 2007, 19:13

George Shot писал(а):
именно так, аппаратный контроллер SROMBSAS18E выполненный в виде карточки PCI-E
на нем и собран 50й мой SAS-RAID массив
для этого и понадобился ключ активации
Intel® RAID Activation key enables full intelligent SAS RAID
и память Samsung DDR2 400Mhz

Отлично. С железом определились.
Теперь давайте определяться с софтом. Проверьте пожалуйста:
версии прошивок материнской платы (BIOS, BMC, FRUSDR)   версии прошивок корзин, если они есть, версии прошивок RAID контроллера (BIOS и Firmware). Какие версии драйверов Вы используете?

Всё это смотреть на страничке посвящённой StarLake:
http://support.intel.com/support/mother ... /index.htm
раздел Software and Drivers.

Там же можно найти диагностику для материнской платы, которую  полезно прогнать.

Полезно зайти в раздел FAQ на этом форуме и вытащить из RAID контроллера содержимое NVRAM лога. Также полезно проверить модуль памяти, установленный в RAID контроллере по листу совместимости
http://download.intel.com/support/mothe ... rev_21.pdf, ну и попробовать его погонять где нибудь ещё (вдруг он сбойный).
кстате прицепил на /var/log/ отдельный винт
особого просветления не наступило
сообщается об ошибке при попытке записи в массив данных
поскольку он read-only
тобишь получается от OS это не зависит
А вот эту часть просьба описать подробнее.
Что за массив? Где он находится? Пропали ли точки в логах?
Максимум деталей пожалуйста.

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: ошибка, read-only файловая система на SuSe

Сообщение Stranger03 » 02 июл 2007, 19:38

George Shot писал(а):неправильно понимаете - SROMBSAS18E это аппаратный внешний PCI-E контроллер на базе электроники от LSI
Ну отлично, а я должен об этом догадываться? Сорри, но все телепаты в отпуске. Какой был вопрос, такой и был ответ.
Собственно остальное мой коллега уже написал. Давайте детали.

Аватара пользователя
CrazyFrog
Advanced member
Сообщения: 210
Зарегистрирован: 16 авг 2005, 23:09
Откуда: Мурманск

Сообщение CrazyFrog » 04 июл 2007, 22:22

Файловая система на linux становится RO в случае ошибок ввода-вывода на ней. Такое поведение можно менять параметром error=, есть разные варианты в зависимости от ФС (продолжить/впасть в панику/и тд).

Ошибки I/O могут проявлятся под нагрузкой, поэтому на мелких инсталляциях есть именно такой эффект - linux завели, а утром он весь в ошибках. Причина - запускаемый еженочно по cron процесс обновления базы locate(1).  Если запустить любой дисковый бенчмарк (bonnie,iozone), то можно наблюдать это в живую, недожидаясь ночи.

Для снятия логов, лучше использовать не второй диск (если ошибка в контроллере, то и на него ничего не запишется), а отправлять сообщения на другую машину по syslog (kern.notice @machine в syslog.conf). В ман на него написано.

Другой хороший вариант - сконфигурировать сериальную консоль и подключить подозрительный узел по нуль-модемному кабелю к компьютеру c терминальной программой. Тогда можно будет точно сохранить сообщения об ошибках, выводимых на консоль. Даже если весь I/O отсохнет: и диски и сеть. Инвестиции копеечные, а выход грандиозный. Про серийную консоль на tldp.org есть вполне разумный howto.

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Сообщение Oleg2 » 04 июл 2007, 23:35

CrazyFrog писал(а): Для снятия логов, лучше использовать не второй диск (если ошибка в контроллере, то и на него ничего не запишется), а отправлять сообщения на другую машину по syslog (kern.notice @machine в syslog.conf). В ман на него написано.
Коллега!
Я имел в виду диск, подключенный к ДРУГОМУ контроллеру. Если же ошибки одного дискового контроллера начнут влиять на работу другого дискового контроллера, то такую систему надо отправлять в помойку. ИМХО, конечно.

George Shot
member
Сообщения: 22
Зарегистрирован: 30 июн 2007, 09:12
Откуда: Samara

вот такие подробности..

Сообщение George Shot » 23 июл 2007, 08:33

удалось наконец продолжить мучить сервер, вот что нарыл далее:

все прошивки биоса мамки, контроллера и корзины устанавливаю распоследние с оф.сайта:
S5000PSL_XSL_XVN_RA_DOS_Firmware_Update8.zip
ir3_FW_v1.03.00-0211.zip
6BPE_v205_SAS.zip

в биосе аппаратного RAID собираю 50 рэйд массив, все значения по умолчанию

на получившийся дисковый массив устанавливаю ОС Suse10.2

обновляю драйвер рэйда в suse из архива ir3_sles9-sles10_drv_v00.00.03.07-1.zip
устанавливаю пакет RAID_Web_Console_2 из архива ir3_Linux_RWC2_v1.19-00.zip

система работает дня три отлично а потом переходит в состояние read-only

того же эффекта добиваюсь при попытке тестировать контроллер утилитой от LSI из пакета MegaCli-1.01.26-0.i386.rpm

во вложениях выводы из логфайлов
messages при загрузке и после запуска ./MegaCli -AdpDiag -a0
и lastevents последние события из хранилища логов самого контроллера

P.S. радиатор на аппаратном контроллере греется как утюг, рука не терпит
при этом сервер продувается 2мя вентиляторами - корпусным и на корзине, ну и плюс два процессорных и БП соответственно
и стоит в кондиционируемом помещении
так и должно быть с грелкой на контроллере?
Вложения
messages.txt
(12.15 КБ) 1083 скачивания
lastevents.txt
(4.58 КБ) 1041 скачивание

Oleg2
Заслуженный сетевик
Сообщения: 494
Зарегистрирован: 15 окт 2004, 17:47
Откуда: Москва

Re: вот такие подробности..

Сообщение Oleg2 » 23 июл 2007, 10:52

George Shot писал(а):удалось наконец продолжить мучить сервер, вот что нарыл далее:

все прошивки биоса мамки, контроллера и корзины устанавливаю распоследние с оф.сайта:
S5000PSL_XSL_XVN_RA_DOS_Firmware_Update8.zip
ir3_FW_v1.03.00-0211.zip
6BPE_v205_SAS.zip

в биосе аппаратного RAID собираю 50 рэйд массив, все значения по умолчанию

на получившийся дисковый массив устанавливаю ОС Suse10.2

обновляю драйвер рэйда в suse из архива ir3_sles9-sles10_drv_v00.00.03.07-1.zip
устанавливаю пакет RAID_Web_Console_2 из архива ir3_Linux_RWC2_v1.19-00.zip

система работает дня три отлично а потом переходит в состояние read-only

того же эффекта добиваюсь при попытке тестировать контроллер утилитой от LSI из пакета MegaCli-1.01.26-0.i386.rpm

во вложениях выводы из логфайлов
messages при загрузке и после запуска ./MegaCli -AdpDiag -a0
и lastevents последние события из хранилища логов самого контроллера

P.S. радиатор на аппаратном контроллере греется как утюг, рука не терпит
при этом сервер продувается 2мя вентиляторами - корпусным и на корзине, ну и плюс два процессорных и БП соответственно
и стоит в кондиционируемом помещении
так и должно быть с грелкой на контроллере?
Гм. А можно всё таки NVRAM лог контроллера вывесить?
Прогон диагностики это, конечно, полезно, но хочется посмотреть
именно лог работы контроллера.

George Shot
member
Сообщения: 22
Зарегистрирован: 30 июн 2007, 09:12
Откуда: Samara

Re: вот такие подробности..

Сообщение George Shot » 29 июл 2007, 20:12

Oleg2 писал(а): Гм. А можно всё таки NVRAM лог контроллера вывесить?
lastevents последние события из хранилища логов самого контроллера
не оно разве?
см вложение моего предыдущего сообщения

Ответить

Вернуться в «Серверы - ПО, Unix подобные системы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 14 гостей