ошибка, read-only файловая система на SuSe
Модераторы: Trinity admin`s, Free-lance moderator`s
-
- member
- Сообщения: 22
- Зарегистрирован: 30 июн 2007, 09:12
- Откуда: Samara
ошибка, read-only файловая система на SuSe
пытаюсь ввести в строй новый сервер
ставлю испробованную на десятке других объектов OpenSuse 10.2
это мне вполне удается, но
через сутки работы файловая система на сервере становится read-only
системных сообщений для root не посылается
в логах ничего полезного тоже подчерпнуть не могу
последними записями в messages являются вот такие символы
..........
.........
после перезагрузки все опять хорошо, дебильные точки сменяются вполне невинными сообщениями, и на момент падения опять никакой информации извлечь нельзя
железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
вариантов я так вижу несколько - глючит контроллер, глючит SuSe, глюки у меня
дайте совет для расследования ситуации..
ставлю испробованную на десятке других объектов OpenSuse 10.2
это мне вполне удается, но
через сутки работы файловая система на сервере становится read-only
системных сообщений для root не посылается
в логах ничего полезного тоже подчерпнуть не могу
последними записями в messages являются вот такие символы
..........
.........
после перезагрузки все опять хорошо, дебильные точки сменяются вполне невинными сообщениями, и на момент падения опять никакой информации извлечь нельзя
железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
вариантов я так вижу несколько - глючит контроллер, глючит SuSe, глюки у меня
дайте совет для расследования ситуации..
Re: ошибка, read-only файловая система на SuSe
Подразумеваем, что все прошивки (BIOS, BMC, FRUSDR матери, Firmware RAID контроллера) и драйвера оборудования у Вас последние.George Shot писал(а):пытаюсь ввести в строй новый сервер
ставлю испробованную на десятке других объектов OpenSuse 10.2
это мне вполне удается, но
через сутки работы файловая система на сервере становится read-only
системных сообщений для root не посылается
в логах ничего полезного тоже подчерпнуть не могу
последними записями в messages являются вот такие символы
..........
.........
после перезагрузки все опять хорошо, дебильные точки сменяются вполне невинными сообщениями, и на момент падения опять никакой информации извлечь нельзя
железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
вариантов я так вижу несколько - глючит контроллер, глючит SuSe, глюки у меня
дайте совет для расследования ситуации..
Я бы попробовал перенаправить syslog сообщения на другой диск (например, прицепил бы к набортовому контроллеру по временной схеме SATA диск). Можно также посмотреть логи SAS контроллера на предмет ошибок.
- Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: ошибка, read-only файловая система на SuSe
Я так понимаю, что это не контроллер, а полное барахло, причем софтово зависимое. Поставьте нормальный 3варь или Адаптек.George Shot писал(а):железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
-
- member
- Сообщения: 22
- Зарегистрирован: 30 июн 2007, 09:12
- Откуда: Samara
Re: ошибка, read-only файловая система на SuSe
безусловно сильное заявлениеStranger03 писал(а):Я так понимаю, что это не контроллер, а полное барахло, причем софтово зависимое. Поставьте нормальный 3варь или Адаптек.George Shot писал(а):железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
LSI уже не котируются?
поменять не могу, деньги заплачены
кстате прицепил на /var/log/ отдельный винт
особого просветления не наступило
сообщается об ошибке при попытке записи в массив данных
поскольку он read-only
тобишь получается от OS это не зависит
Re: ошибка, read-only файловая система на SuSe
Давайте определимся, что мы говорим об одном и том же.George Shot писал(а):безусловно сильное заявлениеStranger03 писал(а):Я так понимаю, что это не контроллер, а полное барахло, причем софтово зависимое. Поставьте нормальный 3варь или Адаптек.George Shot писал(а):железо - intel s5000psl + 50й SAS-RAID на intel же контроллере SROMBSAS18E
LSI уже не котируются?
поменять не могу, деньги заплачены
кстате прицепил на /var/log/ отдельный винт
особого просветления не наступило
сообщается об ошибке при попытке записи в массив данных
поскольку он read-only
тобишь получается от OS это не зависит
Вы создали RAID на контроллере, который оформлен в виде
PCI-Express карточки, в которую Вы дополнительно установили
память и таблетку-ключ (RAID activation key).
Если да, то это полноценный аппаратный SAS RAID.
А программный RAID для этой матерински тоже существует и
создаётся на наборотовом (т.е. распаянном на матери)
SATA или SAS (в зависимости от модификации матери)
контроллере. Вот там RAID, AFAIK, действительно программный.
Уточните, пожалуйста, какой у RAID контроллер в Вашем случае и
будем разбираться с проблемой дальше.
-
- member
- Сообщения: 22
- Зарегистрирован: 30 июн 2007, 09:12
- Откуда: Samara
Re: ошибка, read-only файловая система на SuSe
именно так, аппаратный контроллер SROMBSAS18E выполненный в виде карточки PCI-EOleg2 писал(а):
Давайте определимся, что мы говорим об одном и том же.
Вы создали RAID на контроллере, который оформлен в виде
PCI-Express карточки, в которую Вы дополнительно установили
память и таблетку-ключ (RAID activation key).
на нем и собран 50й мой SAS-RAID массив
для этого и понадобился ключ активации
Intel® RAID Activation key enables full intelligent SAS RAID
и память Samsung DDR2 400Mhz
- Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: ошибка, read-only файловая система на SuSe
А какое заявление вы хотите? В самом начале вы писали про SROMBSAS18E, я так понимаю это встроенный в мать адаптер? И при чем здесь тогда LSI?George Shot писал(а):безусловно сильное заявление
LSI уже не котируются?
Ну и почитайте вот здесь:
http://www.intel.com/support/ru/motherb ... 023463.htm
А котнроллер этот, встроенный в мать, полное говно. Нормальный контроллер с памятью и батарейкой стоит бачков 500, как ваша мать.
-
- member
- Сообщения: 22
- Зарегистрирован: 30 июн 2007, 09:12
- Откуда: Samara
Re: ошибка, read-only файловая система на SuSe
неправильно понимаете - SROMBSAS18E это аппаратный внешний PCI-E контроллер на базе электроники от LSIStranger03 писал(а): В самом начале вы писали про SROMBSAS18E, я так понимаю это встроенный в мать адаптер?
И при чем здесь тогда LSI?
Ну и почитайте вот здесь:
http://www.intel.com/support/ru/motherb ... 023463.htm
и кстате по вашей ссылке - у меня "правильная" серия
не подверженая описанной ошибке
+есть мысль
а влияет ли на работоспособность SAS-RAID наличие в системе еще и SATA винтов, подключенных к распаянному на мамке софт-контроллеру?
Re: ошибка, read-only файловая система на SuSe
George Shot писал(а):
именно так, аппаратный контроллер SROMBSAS18E выполненный в виде карточки PCI-E
на нем и собран 50й мой SAS-RAID массив
для этого и понадобился ключ активации
Intel® RAID Activation key enables full intelligent SAS RAID
и память Samsung DDR2 400Mhz
Отлично. С железом определились.
Теперь давайте определяться с софтом. Проверьте пожалуйста:
версии прошивок материнской платы (BIOS, BMC, FRUSDR) версии прошивок корзин, если они есть, версии прошивок RAID контроллера (BIOS и Firmware). Какие версии драйверов Вы используете?
Всё это смотреть на страничке посвящённой StarLake:
http://support.intel.com/support/mother ... /index.htm
раздел Software and Drivers.
Там же можно найти диагностику для материнской платы, которую полезно прогнать.
Полезно зайти в раздел FAQ на этом форуме и вытащить из RAID контроллера содержимое NVRAM лога. Также полезно проверить модуль памяти, установленный в RAID контроллере по листу совместимости
http://download.intel.com/support/mothe ... rev_21.pdf, ну и попробовать его погонять где нибудь ещё (вдруг он сбойный).
А вот эту часть просьба описать подробнее.кстате прицепил на /var/log/ отдельный винт
особого просветления не наступило
сообщается об ошибке при попытке записи в массив данных
поскольку он read-only
тобишь получается от OS это не зависит
Что за массив? Где он находится? Пропали ли точки в логах?
Максимум деталей пожалуйста.
- Stranger03
- Сотрудник Тринити
- Сообщения: 12979
- Зарегистрирован: 14 ноя 2003, 16:25
- Откуда: СПб, Екатеринбург
- Контактная информация:
Re: ошибка, read-only файловая система на SuSe
Ну отлично, а я должен об этом догадываться? Сорри, но все телепаты в отпуске. Какой был вопрос, такой и был ответ.George Shot писал(а):неправильно понимаете - SROMBSAS18E это аппаратный внешний PCI-E контроллер на базе электроники от LSI
Собственно остальное мой коллега уже написал. Давайте детали.
Файловая система на linux становится RO в случае ошибок ввода-вывода на ней. Такое поведение можно менять параметром error=, есть разные варианты в зависимости от ФС (продолжить/впасть в панику/и тд).
Ошибки I/O могут проявлятся под нагрузкой, поэтому на мелких инсталляциях есть именно такой эффект - linux завели, а утром он весь в ошибках. Причина - запускаемый еженочно по cron процесс обновления базы locate(1). Если запустить любой дисковый бенчмарк (bonnie,iozone), то можно наблюдать это в живую, недожидаясь ночи.
Для снятия логов, лучше использовать не второй диск (если ошибка в контроллере, то и на него ничего не запишется), а отправлять сообщения на другую машину по syslog (kern.notice @machine в syslog.conf). В ман на него написано.
Другой хороший вариант - сконфигурировать сериальную консоль и подключить подозрительный узел по нуль-модемному кабелю к компьютеру c терминальной программой. Тогда можно будет точно сохранить сообщения об ошибках, выводимых на консоль. Даже если весь I/O отсохнет: и диски и сеть. Инвестиции копеечные, а выход грандиозный. Про серийную консоль на tldp.org есть вполне разумный howto.
Ошибки I/O могут проявлятся под нагрузкой, поэтому на мелких инсталляциях есть именно такой эффект - linux завели, а утром он весь в ошибках. Причина - запускаемый еженочно по cron процесс обновления базы locate(1). Если запустить любой дисковый бенчмарк (bonnie,iozone), то можно наблюдать это в живую, недожидаясь ночи.
Для снятия логов, лучше использовать не второй диск (если ошибка в контроллере, то и на него ничего не запишется), а отправлять сообщения на другую машину по syslog (kern.notice @machine в syslog.conf). В ман на него написано.
Другой хороший вариант - сконфигурировать сериальную консоль и подключить подозрительный узел по нуль-модемному кабелю к компьютеру c терминальной программой. Тогда можно будет точно сохранить сообщения об ошибках, выводимых на консоль. Даже если весь I/O отсохнет: и диски и сеть. Инвестиции копеечные, а выход грандиозный. Про серийную консоль на tldp.org есть вполне разумный howto.
Коллега!CrazyFrog писал(а): Для снятия логов, лучше использовать не второй диск (если ошибка в контроллере, то и на него ничего не запишется), а отправлять сообщения на другую машину по syslog (kern.notice @machine в syslog.conf). В ман на него написано.
Я имел в виду диск, подключенный к ДРУГОМУ контроллеру. Если же ошибки одного дискового контроллера начнут влиять на работу другого дискового контроллера, то такую систему надо отправлять в помойку. ИМХО, конечно.
-
- member
- Сообщения: 22
- Зарегистрирован: 30 июн 2007, 09:12
- Откуда: Samara
вот такие подробности..
удалось наконец продолжить мучить сервер, вот что нарыл далее:
все прошивки биоса мамки, контроллера и корзины устанавливаю распоследние с оф.сайта:
S5000PSL_XSL_XVN_RA_DOS_Firmware_Update8.zip
ir3_FW_v1.03.00-0211.zip
6BPE_v205_SAS.zip
в биосе аппаратного RAID собираю 50 рэйд массив, все значения по умолчанию
на получившийся дисковый массив устанавливаю ОС Suse10.2
обновляю драйвер рэйда в suse из архива ir3_sles9-sles10_drv_v00.00.03.07-1.zip
устанавливаю пакет RAID_Web_Console_2 из архива ir3_Linux_RWC2_v1.19-00.zip
система работает дня три отлично а потом переходит в состояние read-only
того же эффекта добиваюсь при попытке тестировать контроллер утилитой от LSI из пакета MegaCli-1.01.26-0.i386.rpm
во вложениях выводы из логфайлов
messages при загрузке и после запуска ./MegaCli -AdpDiag -a0
и lastevents последние события из хранилища логов самого контроллера
P.S. радиатор на аппаратном контроллере греется как утюг, рука не терпит
при этом сервер продувается 2мя вентиляторами - корпусным и на корзине, ну и плюс два процессорных и БП соответственно
и стоит в кондиционируемом помещении
так и должно быть с грелкой на контроллере?
все прошивки биоса мамки, контроллера и корзины устанавливаю распоследние с оф.сайта:
S5000PSL_XSL_XVN_RA_DOS_Firmware_Update8.zip
ir3_FW_v1.03.00-0211.zip
6BPE_v205_SAS.zip
в биосе аппаратного RAID собираю 50 рэйд массив, все значения по умолчанию
на получившийся дисковый массив устанавливаю ОС Suse10.2
обновляю драйвер рэйда в suse из архива ir3_sles9-sles10_drv_v00.00.03.07-1.zip
устанавливаю пакет RAID_Web_Console_2 из архива ir3_Linux_RWC2_v1.19-00.zip
система работает дня три отлично а потом переходит в состояние read-only
того же эффекта добиваюсь при попытке тестировать контроллер утилитой от LSI из пакета MegaCli-1.01.26-0.i386.rpm
во вложениях выводы из логфайлов
messages при загрузке и после запуска ./MegaCli -AdpDiag -a0
и lastevents последние события из хранилища логов самого контроллера
P.S. радиатор на аппаратном контроллере греется как утюг, рука не терпит
при этом сервер продувается 2мя вентиляторами - корпусным и на корзине, ну и плюс два процессорных и БП соответственно
и стоит в кондиционируемом помещении
так и должно быть с грелкой на контроллере?
- Вложения
-
- messages.txt
- (12.15 КБ) 1083 скачивания
-
- lastevents.txt
- (4.58 КБ) 1041 скачивание
Re: вот такие подробности..
Гм. А можно всё таки NVRAM лог контроллера вывесить?George Shot писал(а):удалось наконец продолжить мучить сервер, вот что нарыл далее:
все прошивки биоса мамки, контроллера и корзины устанавливаю распоследние с оф.сайта:
S5000PSL_XSL_XVN_RA_DOS_Firmware_Update8.zip
ir3_FW_v1.03.00-0211.zip
6BPE_v205_SAS.zip
в биосе аппаратного RAID собираю 50 рэйд массив, все значения по умолчанию
на получившийся дисковый массив устанавливаю ОС Suse10.2
обновляю драйвер рэйда в suse из архива ir3_sles9-sles10_drv_v00.00.03.07-1.zip
устанавливаю пакет RAID_Web_Console_2 из архива ir3_Linux_RWC2_v1.19-00.zip
система работает дня три отлично а потом переходит в состояние read-only
того же эффекта добиваюсь при попытке тестировать контроллер утилитой от LSI из пакета MegaCli-1.01.26-0.i386.rpm
во вложениях выводы из логфайлов
messages при загрузке и после запуска ./MegaCli -AdpDiag -a0
и lastevents последние события из хранилища логов самого контроллера
P.S. радиатор на аппаратном контроллере греется как утюг, рука не терпит
при этом сервер продувается 2мя вентиляторами - корпусным и на корзине, ну и плюс два процессорных и БП соответственно
и стоит в кондиционируемом помещении
так и должно быть с грелкой на контроллере?
Прогон диагностики это, конечно, полезно, но хочется посмотреть
именно лог работы контроллера.
-
- member
- Сообщения: 22
- Зарегистрирован: 30 июн 2007, 09:12
- Откуда: Samara
Re: вот такие подробности..
lastevents последние события из хранилища логов самого контроллераOleg2 писал(а): Гм. А можно всё таки NVRAM лог контроллера вывесить?
не оно разве?
см вложение моего предыдущего сообщения
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 14 гостей