aac0: COMMAND 0xff... проблема HDD или ??
Модераторы: Trinity admin`s, Free-lance moderator`s
aac0: COMMAND 0xff... проблема HDD или ??
Доброго времени суток.
Надеюсь на подсказку профессионалов. Где грабли и куда наступать.
Значит имеем в наличии вот такой сервер:
SuperMicro® 5015B-MT
CPU Intel® Q6600
Memory 1GB DDR2 800MHz, PC6400, ECC x 2
SAS RAID Adaptec RAID 3405
HDD ATA Seagate 500GB Barracuda 7200.11, ST3500320AS x 4
Винты собраны в RAID5
Пробовал поставить FreeBSD 7.0 получал - SMP: AP CPU #1 Launched
на стадии установки и никакие пляски с бубном не помогли. Примерно как в этой теме.
Поставил FreeBSD 6.3 (amd64) с подпихиванием актуальных на тот момент дров адаптека. Сервер отработал 2.5 месяца нормально.
В выходные он упал. Я так понимаю, что ушел в перезагрузку(почему не знаю) и на стадии загрузки контроллера заругался, что проблема с array и надо бы почекить.
Зашел и с помощью тулзы адаптека проверил рейд. После перезагрузки в messages увидел:
kernel: hptrr: no controller detected.
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4757654 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4757669 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4757699 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4922398 (484160 should be 484128) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4922400 (44 should be 36) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4922583 (20160 should be 20256) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=43625955 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=44725698 (108 should be 100) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=44725712 (4 should be 0) (CORRECTED)
На данный момент имеем следующее:
1.Постоянный спам - kernel: aac0: COMMAND 0xffffffff86c9bf80 TIMEOUT AFTER 33 SECONDS
2.Сервер периодически "подвисает" секунд на 10-20. При этом индикатор одного диска постоянно(!) горит. Затем его "отпускает" и работа возобновляется.
3.Диск пока не проверял. Прошил свежий фирмварь на контроллер.
Вопрос. Правильно ли я понимаю, что проблема скорее всего в этом диске? Что можно ещё сделать для устранения ошибок?
Надеюсь на подсказку профессионалов. Где грабли и куда наступать.
Значит имеем в наличии вот такой сервер:
SuperMicro® 5015B-MT
CPU Intel® Q6600
Memory 1GB DDR2 800MHz, PC6400, ECC x 2
SAS RAID Adaptec RAID 3405
HDD ATA Seagate 500GB Barracuda 7200.11, ST3500320AS x 4
Винты собраны в RAID5
Пробовал поставить FreeBSD 7.0 получал - SMP: AP CPU #1 Launched
на стадии установки и никакие пляски с бубном не помогли. Примерно как в этой теме.
Поставил FreeBSD 6.3 (amd64) с подпихиванием актуальных на тот момент дров адаптека. Сервер отработал 2.5 месяца нормально.
В выходные он упал. Я так понимаю, что ушел в перезагрузку(почему не знаю) и на стадии загрузки контроллера заругался, что проблема с array и надо бы почекить.
Зашел и с помощью тулзы адаптека проверил рейд. После перезагрузки в messages увидел:
kernel: hptrr: no controller detected.
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4757654 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4757669 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4757699 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4922398 (484160 should be 484128) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4922400 (44 should be 36) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=4922583 (20160 should be 20256) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=43625955 (4 should be 0) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=44725698 (108 should be 100) (CORRECTED)
/dev/aacd0s1g: INCORRECT BLOCK COUNT I=44725712 (4 should be 0) (CORRECTED)
На данный момент имеем следующее:
1.Постоянный спам - kernel: aac0: COMMAND 0xffffffff86c9bf80 TIMEOUT AFTER 33 SECONDS
2.Сервер периодически "подвисает" секунд на 10-20. При этом индикатор одного диска постоянно(!) горит. Затем его "отпускает" и работа возобновляется.
3.Диск пока не проверял. Прошил свежий фирмварь на контроллер.
Вопрос. Правильно ли я понимаю, что проблема скорее всего в этом диске? Что можно ещё сделать для устранения ошибок?
-
- Advanced member
- Сообщения: 229
- Зарегистрирован: 25 окт 2005, 09:30
- Откуда: Краснодар
А разве он на фре живет? И куда-ж его ставить, если ОС не грузится?
По-моему так: перед началом загрузки фри нажать Ctrl+A, войти в адаптековский сетуп, посмотреть, что он скажет про диски и про массив. В случае необходимости отребилдить массив НЕ в фоновом режиме.
После этого, когда будет уверенность в том, что с железом все нормально, можно ковырять систему - как минимум, стОит взять 6.4-RC2 (ftp://ftp.freebsd.org/pub/FreeBSD/relea ... -disc1.iso), загрузиться с него и, если она увидит массив, прогнать fsck на всех файловых системах.
А, если не секрет, зачем amd64? Поставьте i386, там с большой вероятностью все будет нормально. К тому же, работать будет быстрее.
По-моему так: перед началом загрузки фри нажать Ctrl+A, войти в адаптековский сетуп, посмотреть, что он скажет про диски и про массив. В случае необходимости отребилдить массив НЕ в фоновом режиме.
После этого, когда будет уверенность в том, что с железом все нормально, можно ковырять систему - как минимум, стОит взять 6.4-RC2 (ftp://ftp.freebsd.org/pub/FreeBSD/relea ... -disc1.iso), загрузиться с него и, если она увидит массив, прогнать fsck на всех файловых системах.
А, если не секрет, зачем amd64? Поставьте i386, там с большой вероятностью все будет нормально. К тому же, работать будет быстрее.
- exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
- Контактная информация:
Andrey N. Oktyabrski
А разве он на фре живет?
http://www.adaptec.com/en-US/downloads/ ... +RAID+3405
И куда-ж его ставить, если ОС не грузится?
Ставить надо сразу, а не когда все сломалось.
А разве он на фре живет?
http://www.adaptec.com/en-US/downloads/ ... +RAID+3405
И куда-ж его ставить, если ОС не грузится?
Ставить надо сразу, а не когда все сломалось.
-
- Advanced member
- Сообщения: 229
- Зарегистрирован: 25 окт 2005, 09:30
- Откуда: Краснодар
О, это хорошая новость. Давно я туда не заглядывал, надо запомнить.exLH писал(а):Andrey N. Oktyabrski
А разве он на фре живет?
http://www.adaptec.com/en-US/downloads/ ... +RAID+3405
И как сейчас применить этот полезнейший совет?И куда-ж его ставить, если ОС не грузится?
Ставить надо сразу, а не когда все сломалось.
exLH
Правильно понимаете.
Другой вопрос, что - The ASM installer for FreeBSD is available as a Web release only.
Andrey N. Oktyabrski
нажать Ctrl+A, войти в адаптековский сетуп, посмотреть, что он скажет про диски и про массив
Это уже сделано после падения. Пишет, что с рейдом всё гуд.
А, если не секрет, зачем amd64? Поставьте i386, там с большой вероятностью все будет нормально. К тому же, работать будет быстрее
Не секрет. Я же написал, что хотел 7ку, но она не встала вообще. Ни i386, ни amd64 вставать туда не хотели категорически(ошибку я описал в первом посте). С 6.3 i386 под нагрузкой сервер еле шевелился, а с amd64 забегал нормально.
Правильно понимаете.
Другой вопрос, что - The ASM installer for FreeBSD is available as a Web release only.
Andrey N. Oktyabrski
нажать Ctrl+A, войти в адаптековский сетуп, посмотреть, что он скажет про диски и про массив
Это уже сделано после падения. Пишет, что с рейдом всё гуд.
А, если не секрет, зачем amd64? Поставьте i386, там с большой вероятностью все будет нормально. К тому же, работать будет быстрее
Не секрет. Я же написал, что хотел 7ку, но она не встала вообще. Ни i386, ни amd64 вставать туда не хотели категорически(ошибку я описал в первом посте). С 6.3 i386 под нагрузкой сервер еле шевелился, а с amd64 забегал нормально.
- exLH
- Сотрудник Тринити
- Сообщения: 5061
- Зарегистрирован: 11 фев 2004, 15:49
- Откуда: Москва
- Контактная информация:
Blinds
А будут ли какие-то советы от профи
Будут.
Если сейчас система грузится, то надо поставить ASM.
Если система не грузится, то можно запусться с LiveCD с ASM и посмотреть, что и как с массивом.
Если Вы уверены, что контроллер говорит, что с массивом все хорошо, то это проблема софтовая, соответственно, нужно разбираться с целостностью файловой системы.
А будут ли какие-то советы от профи
Будут.
Если сейчас система грузится, то надо поставить ASM.
Если система не грузится, то можно запусться с LiveCD с ASM и посмотреть, что и как с массивом.
Если Вы уверены, что контроллер говорит, что с массивом все хорошо, то это проблема софтовая, соответственно, нужно разбираться с целостностью файловой системы.
-
- Advanced member
- Сообщения: 229
- Зарегистрирован: 25 окт 2005, 09:30
- Откуда: Краснодар
Не-а, не поставлю :-) Я вообще фрю не поставлю без крайней необходимости. Ибо чревато описанным. Кривая она, зараза, стала :-(exLH писал(а):Andrey N. Oktyabrski
И как сейчас применить этот полезнейший совет?
Вот Вы, например, поставите и благодаря этому возможно не попадете в ситуацию, в которую попал автор.
А с диском? А пробовали диск вынуть/вставить (в идеале - вставить другой)?Пишет, что с рейдом всё гуд.
Мне кажется, проблема скорее всего в дровах. Все же попробуйте более новую версию системы загрузить с CD и проверить ФС. По-моему, должно помочь.
gs
exLH
Спасибо за советы. Подниму резервный сервант, а с этим буду разбираться.
Andrey N. Oktyabrski
Я вообще фрю не поставлю без крайней необходимости. Ибо чревато описанным.
Фря вполне хороша для определенного круга задач. Согласитесь, что файловая система, диск и т.д. могут упасть на любой системе.
exLH
Спасибо за советы. Подниму резервный сервант, а с этим буду разбираться.
Andrey N. Oktyabrski
Я вообще фрю не поставлю без крайней необходимости. Ибо чревато описанным.
Фря вполне хороша для определенного круга задач. Согласитесь, что файловая система, диск и т.д. могут упасть на любой системе.
-
- Advanced member
- Сообщения: 229
- Зарегистрирован: 25 окт 2005, 09:30
- Откуда: Краснодар
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя