aac0: COMMAND 0xff... проблема HDD или ??

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Blinds
Junior member
Сообщения: 5
Зарегистрирован: 11 ноя 2008, 12:47
Откуда: Санкт-Петербург

aac0: COMMAND 0xff... проблема HDD или ??

Сообщение Blinds » 12 ноя 2008, 13:19

Доброго времени суток.
Надеюсь на подсказку профессионалов. Где грабли и куда наступать.

Значит имеем в наличии вот такой сервер:
SuperMicro® 5015B-MT
CPU Intel®  Q6600
Memory 1GB DDR2 800MHz, PC6400, ECC x 2
SAS RAID Adaptec RAID 3405
HDD ATA Seagate 500GB Barracuda 7200.11, ST3500320AS x 4
Винты собраны в RAID5

Пробовал поставить FreeBSD 7.0 получал - SMP: AP CPU #1 Launched
на стадии установки и никакие пляски с бубном не помогли. Примерно как в этой теме.
Поставил FreeBSD 6.3 (amd64) с подпихиванием актуальных на тот момент дров адаптека.  Сервер отработал 2.5 месяца нормально.
В выходные он упал. Я так понимаю, что ушел в перезагрузку(почему не знаю) и на стадии загрузки контроллера заругался, что проблема с array и надо бы почекить.
Зашел и с помощью тулзы адаптека проверил рейд. После перезагрузки в messages увидел:

kernel: hptrr: no controller detected.

/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4757654 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4757669 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4757699 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4922398 (484160 should be 484128) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4922400 (44 should be 36) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4922583 (20160 should be 20256) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=43625955 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=44725698 (108 should be 100) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=44725712 (4 should be 0) (CORRECTED)

На данный момент имеем следующее:
1.Постоянный спам - kernel: aac0: COMMAND 0xffffffff86c9bf80 TIMEOUT AFTER 33 SECONDS
2.Сервер периодически "подвисает" секунд на 10-20. При этом индикатор одного диска постоянно(!) горит. Затем его "отпускает" и работа возобновляется.
3.Диск пока не проверял. Прошил свежий фирмварь на контроллер.

Вопрос. Правильно ли я понимаю, что проблема скорее всего в этом диске? Что можно ещё сделать для устранения ошибок?

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 12 ноя 2008, 13:25

Blinds
Правильно ли я понимаю, что проблема скорее всего в этом диске?
Правильно ли я понимаю, что Вы не поставили Adaptec Storage manager и не знаете, в каком состоянии сейчас находится RAID-массив?

Andrey N. Oktyabrski
Advanced member
Сообщения: 229
Зарегистрирован: 25 окт 2005, 09:30
Откуда: Краснодар

Сообщение Andrey N. Oktyabrski » 12 ноя 2008, 14:18

А разве он на фре живет? И куда-ж его ставить, если ОС не грузится?

По-моему так: перед началом загрузки фри нажать Ctrl+A, войти в адаптековский сетуп, посмотреть, что он скажет про диски и про массив. В случае необходимости отребилдить массив НЕ в фоновом режиме.

После этого, когда будет уверенность в том, что с железом все нормально, можно ковырять систему - как минимум, стОит взять 6.4-RC2 (ftp://ftp.freebsd.org/pub/FreeBSD/relea ... -disc1.iso), загрузиться с него и, если она увидит массив, прогнать fsck на всех файловых системах.

А, если не секрет, зачем amd64? Поставьте i386, там с большой вероятностью все будет нормально. К тому же, работать будет быстрее.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 12 ноя 2008, 14:20

Andrey N. Oktyabrski
А разве он на фре живет?
http://www.adaptec.com/en-US/downloads/ ... +RAID+3405

И куда-ж его ставить, если ОС не грузится?
Ставить надо сразу, а не когда все сломалось.

Andrey N. Oktyabrski
Advanced member
Сообщения: 229
Зарегистрирован: 25 окт 2005, 09:30
Откуда: Краснодар

Сообщение Andrey N. Oktyabrski » 12 ноя 2008, 14:32

exLH писал(а):Andrey N. Oktyabrski
А разве он на фре живет?
http://www.adaptec.com/en-US/downloads/ ... +RAID+3405
О, это хорошая новость. Давно я туда не заглядывал, надо запомнить.
И куда-ж его ставить, если ОС не грузится?
Ставить надо сразу, а не когда все сломалось.
И как сейчас применить этот полезнейший совет?

Blinds
Junior member
Сообщения: 5
Зарегистрирован: 11 ноя 2008, 12:47
Откуда: Санкт-Петербург

Сообщение Blinds » 12 ноя 2008, 14:54

exLH

Правильно понимаете.
Другой вопрос, что - The ASM installer for FreeBSD is available as a Web release only.

Andrey N. Oktyabrski

нажать Ctrl+A, войти в адаптековский сетуп, посмотреть, что он скажет про диски и про массив

Это уже сделано после падения. Пишет, что с рейдом всё гуд.


А, если не секрет, зачем amd64? Поставьте i386, там с большой вероятностью все будет нормально. К тому же, работать будет быстрее

Не секрет. Я же написал, что хотел 7ку, но она не встала вообще. Ни i386, ни amd64 вставать туда не хотели категорически(ошибку я описал в первом посте). С 6.3 i386 под нагрузкой сервер еле шевелился, а с amd64 забегал нормально.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 12 ноя 2008, 15:11

Andrey N. Oktyabrski
И как сейчас применить этот полезнейший совет?
Вот Вы, например, поставите и благодаря этому возможно не попадете в ситуацию, в которую попал автор.

Blinds
Junior member
Сообщения: 5
Зарегистрирован: 11 ноя 2008, 12:47
Откуда: Санкт-Петербург

Сообщение Blinds » 12 ноя 2008, 15:20

exLH

А будут ли какие-то советы от профи, кроме "вот если бы было...то тогда бы.."? Вы же понимаете, что если бы оно не сломалось, а я был бы гуру во всем, что шевелится, то я бы конечно бы ничего бы не спрашивал...бы

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 12 ноя 2008, 15:38

Если контроллер считает, что все в порядке, но система не работает, то с контроллером бодаться бесполезно - надо все разломать, проверить, починить и раскатывать бэкап.

Аватара пользователя
exLH
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 5061
Зарегистрирован: 11 фев 2004, 15:49
Откуда: Москва
Контактная информация:

Сообщение exLH » 12 ноя 2008, 15:39

Blinds
А будут ли какие-то советы от профи
Будут.
Если сейчас система грузится, то надо поставить ASM.
Если система не грузится, то можно запусться с LiveCD с ASM и посмотреть, что и как с массивом.
Если Вы уверены, что контроллер говорит, что с массивом все хорошо, то это проблема софтовая, соответственно, нужно разбираться с целостностью файловой системы.

Andrey N. Oktyabrski
Advanced member
Сообщения: 229
Зарегистрирован: 25 окт 2005, 09:30
Откуда: Краснодар

Сообщение Andrey N. Oktyabrski » 12 ноя 2008, 18:37

exLH писал(а):Andrey N. Oktyabrski
И как сейчас применить этот полезнейший совет?
Вот Вы, например, поставите и благодаря этому возможно не попадете в ситуацию, в которую попал автор.
Не-а, не поставлю :-) Я вообще фрю не поставлю без крайней необходимости. Ибо чревато описанным. Кривая она, зараза, стала :-(
Пишет, что с рейдом всё гуд.
А с диском? А пробовали диск вынуть/вставить (в идеале - вставить другой)?

Мне кажется, проблема скорее всего в дровах. Все же попробуйте более новую версию системы загрузить с CD и проверить ФС. По-моему, должно помочь.

Blinds
Junior member
Сообщения: 5
Зарегистрирован: 11 ноя 2008, 12:47
Откуда: Санкт-Петербург

Сообщение Blinds » 12 ноя 2008, 19:47

gs
exLH

Спасибо за советы. Подниму резервный сервант, а с этим буду разбираться.

Andrey N. Oktyabrski
Я вообще фрю не поставлю без крайней необходимости. Ибо чревато описанным.

Фря вполне хороша для определенного круга задач. Согласитесь, что файловая система, диск и т.д. могут упасть на любой системе.

Andrey N. Oktyabrski
Advanced member
Сообщения: 229
Зарегистрирован: 25 окт 2005, 09:30
Откуда: Краснодар

Сообщение Andrey N. Oktyabrski » 13 ноя 2008, 10:08

Диск - да, ФС - нет.

Blinds
Junior member
Сообщения: 5
Зарегистрирован: 11 ноя 2008, 12:47
Откуда: Санкт-Петербург

Сообщение Blinds » 13 ноя 2008, 17:35

Оказалось всё дело в сдохшем винте (собственно как и предполагалось). При тесте выяснилось, что он обильно порос бэдами.

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя