Как реагировать на ошибки BadBlock, при этом SMART молчит
Модераторы: Trinity admin`s, Free-lance moderator`s
Как реагировать на ошибки BadBlock, при этом SMART молчит
Добрый день,
RAID 10
HDD 4x Seagate ST3600057SS
Adaptec 6805
Проблема: контроллер начал рассылать последние 2 дня сотни/тысячи сообщений о том, что найден Bad Block. Посмотрел на статистику дисков и обнаружил, что есть диск который имеет подозрительную статистику [1]
Возникли вопросы
1. Почему Adaptec не пометил его сбойным, ведь 65535 MediumErrors это более чем достаточно (другие диски около нуля или ноль имеют)?
2. Почему SMART молчит? На некоторых дисках других моделей есть SMART вкладка со статистикой, но тут только короткое SMART Warnings = 0 без деталей?
3. Как на самом деле вычислить на Adaptec какой диск рассылает сообщения BadBlock Discovered если в рассылке нет конкретного указания на диск.
4. Самый главный: Как реагировать на текущую ситуацию имея все эти вопросы выше?
Спасибо заранее за любую помощь.
[1] http://prnt.sc/dgg7ei
RAID 10
HDD 4x Seagate ST3600057SS
Adaptec 6805
Проблема: контроллер начал рассылать последние 2 дня сотни/тысячи сообщений о том, что найден Bad Block. Посмотрел на статистику дисков и обнаружил, что есть диск который имеет подозрительную статистику [1]
Возникли вопросы
1. Почему Adaptec не пометил его сбойным, ведь 65535 MediumErrors это более чем достаточно (другие диски около нуля или ноль имеют)?
2. Почему SMART молчит? На некоторых дисках других моделей есть SMART вкладка со статистикой, но тут только короткое SMART Warnings = 0 без деталей?
3. Как на самом деле вычислить на Adaptec какой диск рассылает сообщения BadBlock Discovered если в рассылке нет конкретного указания на диск.
4. Самый главный: Как реагировать на текущую ситуацию имея все эти вопросы выше?
Спасибо заранее за любую помощь.
[1] http://prnt.sc/dgg7ei
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Как реагировать на ошибки BadBlock, при этом SMART молчи
1. Видимо не превышен размер резерва для этой модели диска.
2. Странно. Диск есть в HCL этого контроллера? Прошивка свежая?
3. Ну на картинке же видно.
4. Для начала бэкап и замена диска. А этот можно повесить на HBA и посмотреть обычными смартосмотрелками. Но скорее всего кирдык ему.
2. Странно. Диск есть в HCL этого контроллера? Прошивка свежая?
3. Ну на картинке же видно.
4. Для начала бэкап и замена диска. А этот можно повесить на HBA и посмотреть обычными смартосмотрелками. Но скорее всего кирдык ему.
- gs
- Сотрудник Тринити
- Сообщения: 16650
- Зарегистрирован: 23 авг 2002, 17:34
- Откуда: Москва
- Контактная информация:
Re: Как реагировать на ошибки BadBlock, при этом SMART молчи
Ну и это... кэш диска лучше бы выключить, во избежание...
- Tert
- Advanced member
- Сообщения: 4233
- Зарегистрирован: 19 янв 2003, 08:09
- Откуда: Москва
- Контактная информация:
Re: Как реагировать на ошибки BadBlock, при этом SMART молчи
indlg0
MediumError - это часто ошибки подключения. Проверяйте разъем, кабель и т.п. Часто просто окисляется контакт и помогает удаление и вставление диска обратно.
После этого можно вытащить диск и проверить его утилитой от Seagate.
Если утилита не найдет проблем, то переткнуть кабель, который идет от контроллера к корзине (это можно в любом случае сделать).
Если число ошибок продолжит увеличиваться, то уже надо смотреть, что с корзиной и пробовать менять кабель.
Диск все же работает, хотя и плохо.1. Почему Adaptec не пометил его сбойным, ведь 65535 MediumErrors это более чем достаточно (другие диски около нуля или ноль имеют)?
MediumError - это часто ошибки подключения. Проверяйте разъем, кабель и т.п. Часто просто окисляется контакт и помогает удаление и вставление диска обратно.
Там же наверху указано, что за диск (номер слота). К тому же диск в корзине можно всегда подсветить.3. Как на самом деле вычислить на Adaptec какой диск рассылает сообщения BadBlock Discovered если в рассылке нет конкретного указания на диск.
Вначале сделать копии всех важных данных куда-нибудь в другое место. Потом запустить проверку целостности массива.4. Самый главный: Как реагировать на текущую ситуацию имея все эти вопросы выше?
После этого можно вытащить диск и проверить его утилитой от Seagate.
Если утилита не найдет проблем, то переткнуть кабель, который идет от контроллера к корзине (это можно в любом случае сделать).
Если число ошибок продолжит увеличиваться, то уже надо смотреть, что с корзиной и пробовать менять кабель.
Re: Как реагировать на ошибки BadBlock, при этом SMART молчи
Спасибо! Проверю.gs писал(а): 2. Странно. Диск есть в HCL этого контроллера? Прошивка свежая?
Мопед по наследству достался, еще предстоит исследовать, но на 90% уверен что HCL не учитывался.
Тут скорее хотел спросить, как из письма от адаптера понять http://prntscr.com/dhaie3 , что речь именно об этом диске? Вот такие письма не информативные. На контроллере есть другие массивы которые тоже могут рассылать жалобные письма, но самый несчастный именно Seagate мне показался. На цифра, обозначенная стрелкой на скриншоте, изменяется в письмах.gs писал(а): 3. Ну на картинке же видно.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 23 гостя