LSI MegeRaid SCSI 320-1 Пропадают и выпадают диски Винда пад

Конфигурирование, планирование RAID систем, возможности, технологии, теория. Qlogic, LSI Logic, Adaptec ...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
niichavo
Junior member
Сообщения: 8
Зарегистрирован: 29 май 2007, 09:27
Откуда: Маасква

LSI MegeRaid SCSI 320-1 Пропадают и выпадают диски Винда пад

Сообщение niichavo » 29 май 2007, 10:24

Здравствуйте и помогите! Я новенький во всех ентих делах, т.ч. не судите строго.

Проблема следующая. Стоит 2-х процессорный сервер с win2003 EE R2 SP2 (контроллер домена). Сервак питается от ИБП APC Smart-Ups 1500. Где-то через неделю и иногда больше система перегружается. При загрузке, RAID пишет, что 1 или 2 диска failed. Бывает написано, что degraded. А иногда контроллер ваще не может найти диски. А если и находит, то, бывает, определить их не может (марка, номер и т.п.). Дальше загрузка не идёт. Приходится либо тупо перезагружать несколько раз, пока Raid-контроллер не начнёт видеть (случай, когда он не видит диски) или вручную запускать Rebuild для случая failed/degraded (резервных дисков hot spare или как_там_его нет) В логах винды, кроме неожиданной перезагрузки ничего информативного нет. В логах MegaRaid Client тоже ничего подозрительного нет, кроме лога «NVRAM». Там имеются такие строчки:

«EVENT … 0x382 Category: Firmware error event…» и
«EVENT … 0x22 Channel 0, Target 1, Lun 0. Category: Physical Device error event…»

Check Consistency ничего не выявил.

Конфигурация такая:

Channel 1-RAID
(0)A3-1-Seagate ST336607LC 35 Gb
(1)A1-1-Seagate ST336607LC 35 Gb
(2)A1-2-Seagate ST336607LC 35 Gb
(3)A2-1-Seagate ST336607LC 35 Gb
(4)A2-2-Seagate ST336607LW 35 Gb

Adapter
-Array 1-2
--LD 1: RAID 1: 70004 Mb
-Array 3
--LD 2: RAID 0: 35002 Mb – здесь винда
-Global Hot Spare Pool

Помогитя, не проходите мимо, пожалуйста!

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Сообщение Tert » 29 май 2007, 11:16

niichavo
Судя по вашим дискам, в сервере на одной шине висит корзина для дисков горячей замены и обычный 68-пиновый диск.
Как это все расположено, мне трудно судить. Но в любом случае наиболее вероятная причина проблемы - эта описанная выше кривая конфигурация SCSI шины.

niichavo
Junior member
Сообщения: 8
Зарегистрирован: 29 май 2007, 09:27
Откуда: Маасква

Сообщение niichavo » 29 май 2007, 11:39

Tert писал(а):niichavo
Судя по вашим дискам, в сервере на одной шине висит корзина для дисков горячей замены и обычный 68-пиновый диск.
Как это все расположено, мне трудно судить. Но в любом случае наиболее вероятная причина проблемы - эта описанная выше кривая конфигурация SCSI шины.
Шина и канал контроллера - эта не одно и тоже? Просто если это одно и то же, то по другому у меня и быть не может, т.к. LSI MegeRaid SCSI 320-1 одноканальный (1 ch). Или я не прав? То что обычный диск оказался в массиве RAID 1 - это не есть хорошо, кнешна, но что имеем, то имеем. Потом всё переделаю.

Вы не могли бы мне приблизительно написать, как оптимально сконфигурировать то, что я имею. Главное, чтоб один логический диск был бы или RAID 1 или RAID 10. Или дайте, пожалуйста, ссылку, где можно почитать об этом (желательно на русском).

И вот ещё вопросик. Вот у меня написано, что имеется RAID 1. Для получения RAID 10 нужно вначале создать два RAID 1, а потом их "объединять", а не наоборот, как видимо было в моём случае?

ЗЫ. Касательно самой проблемы. Вся эта конфигурация работала довольно длительное (где-то полгода) время без видимых ошибок. Какие ещё могут быть причины (Ваше мнение о дурацкой конфигурации я учту)? Эти симптомы характерны для аппаратных проблем или программных (связянных с виндовз)? Может сам контроллер барахлит?

ЗЗЫ. Если это окажется полезным - прошивка контроллера 1L47

Аватара пользователя
Tert
Advanced member
Сообщения: 4233
Зарегистрирован: 19 янв 2003, 08:09
Откуда: Москва
Контактная информация:

Сообщение Tert » 29 май 2007, 12:04

niichavo
Вы опишите в какой последовательности к контроллеру подключены ваши диски и корзина. А заодно и всю конфигурацию сервера.
И вот ещё вопросик. Вот у меня написано, что имеется RAID 1. Для получения RAID 10 нужно вначале создать два RAID 1, а потом их "объединять"
Да. Так и надо делать. Объединение - это span в терминах LSI.
Эти симптомы характерны для аппаратных проблем или программных (связянных с виндовз)? Может сам контроллер барахлит?
Это аппаратные проблемы. Чем они вызваныю пока сказать сложно.
Поломка самого контроллера также возможна, хотя и маловероятна.

niichavo
Junior member
Сообщения: 8
Зарегистрирован: 29 май 2007, 09:27
Откуда: Маасква

Сообщение niichavo » 29 май 2007, 12:56

Tert писал(а):Вы опишите в какой последовательности к контроллеру подключены ваши диски и корзина. А заодно и всю конфигурацию сервера."
т.е. вскрыть корпус и посмотреть?  :) или можно обойтись информацией из св-в адаптера? Вот эта инфа:

Код: Выделить всё

Number Of Logical Drives: 2. 
 
Logical Drive 1
State                : Optimal 
RAID TYPE            : 1 
Write Policy         : Write Thru 
Read Policy          : Normal 
Cache Policy         : Direct I/O 
Stripe Size          : 64K Bytes
No. of Stripes       : 2 
Size                 : 70004MB 
Component Physical Drives : 
 
SPAN 0 
        CHANNEL : 1, ID : 1 
        CHANNEL : 1, ID : 2 
SPAN 1 
        CHANNEL : 1, ID : 3 
        CHANNEL : 1, ID : 4 
 
Logical Drive 2
State                : Optimal 
RAID TYPE            : 0 
Write Policy         : Write Thru 
Read Policy          : Normal 
Cache Policy         : Direct I/O 
Stripe Size          : 64K Bytes
No. of Stripes       : 1 
Size                 : 35002MB 
Component Physical Drives : 
 
SPAN 0 
        CHANNEL : 1, ID : 0 
Конфигурация сервера:

Код: Выделить всё

2 штуки Intel Xeon 2.6 ГГц
память 1 Гб (2*512 Kingston EEC REG PC2100)
системная плата - Supermicro X5DAL-G
видео - AGP 32 Mb ATI Radeon 7000 DDR
корпус - ATX Bigtower Supermicro SC-742s 420W (SCA Backplane)
контроллер - LSI MegaRaid SCSI 320-1 1ch, 64 Mb, U320
шлейф - U320 INT LVD на 4 устройства + терминатор
диски - Seagate ST336607LC 35 Gb 80 pin (4 штуки) 
диски - Seagate ST336607LW 35 Gb 68 pin (1 штука)

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 29 май 2007, 13:01

Уберите терминатор - корзина имеет встроенный.

niichavo
Junior member
Сообщения: 8
Зарегистрирован: 29 май 2007, 09:27
Откуда: Маасква

Сообщение niichavo » 29 май 2007, 13:10

gs писал(а):Уберите терминатор - корзина имеет встроенный.
А как выглядит терминатор и где его искать? На шлейфе? Я предупреждал, что я тупой  :) ... [Оправдываясь] Но лучше уж спросить, чем с умным видом промолчать ...

ЗЫ. А то что Seagate ST336607LW 35 Gb 68 pin стоит сам по себе не в корзине - это ничего не меняет? Корзина - это то, где находятся контейнеры для дисков, которые можно вынимать не выключая компутер (hot swap)?  :oops:

Аватара пользователя
gs
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 16650
Зарегистрирован: 23 авг 2002, 17:34
Откуда: Москва
Контактная информация:

Сообщение gs » 29 май 2007, 13:38

Корзина - да.
Отдельный диск без корзины - очень плохо, но не смертельно.

Терминатор - хреновинка на конце кабеля.

niichavo
Junior member
Сообщения: 8
Зарегистрирован: 29 май 2007, 09:27
Откуда: Маасква

Сообщение niichavo » 14 ноя 2007, 10:10

Вот я опять вернулся с проблемой выпадения логических дисков из массива. Я решил переустановить сервер. Собрал из 4-х 80-пиновых дисков Seagate ST336607LC 35 Gb RAID 10 как написано в http://www.3nity.ru/viewtopic.htm?t=4842. Создал ещё RAID 1 из 2-х Seagate ST336607LC 35 Gb (80 pin), на который установил систему. все эти диски в корзине. Создал ещё RAID 0 из одного Seagate ST336607LW 35 Gb 68 pin. Корзина и 68-пиновый диск сидят на одной шине. Терминатор я, как и советовали в предыдущем посте, убрал.

Проблемы начались сразу во время установки Windows Server 2003. Появился синий экран. Вылетел RAID 1, сразу 2 диска. Систему я со второго раза таки поставил. Но периодически этот системный RAID 1 выпадает. Бывает во время работы винды, а бывает (что вроде как чаще) когда включаешь сервер. Пишет, что 1 Logical Drive(s) Failed и система естественно не грузится. Check Consistency делал (ошибок нет). Никаких bad блоков не нашёл. Только в логах «NVRAM» есть ошибки:

Event 0x200 и 0x1C Physical Device Error Event

ЗЫ.

Код: Выделить всё

Number Of Logical Drives: 3. 
 
Logical Drive 1
State                : Optimal 
RAID TYPE            : 1  
Write Policy         : Write Thru 
Read Policy          : Normal 
Cache Policy         : Direct I/O 
Stripe Size          : 64K Bytes
No. of Stripes       : 2 
Size                 : 70004MB 
Component Physical Drives : 
 
SPAN 0 
        CHANNEL : 1, ID : 0 
        CHANNEL : 1, ID : 1 
SPAN 1 
        CHANNEL : 1, ID : 2 
        CHANNEL : 1, ID : 3 

(так это всё-таки RAID 10 получился или нет?)

Код: Выделить всё

Logical Drive 2
State                : Degraded
(ребуилдится)

Код: Выделить всё

RAID TYPE            : 1 
Write Policy         : Write Thru 
Read Policy          : Normal 
Cache Policy         : Direct I/O 
Stripe Size          : 64K Bytes
No. of Stripes       : 2 
Size                 : 35002MB 
Component Physical Drives : 
 
SPAN 0 
        CHANNEL : 1, ID : 4 
        CHANNEL : 1, ID : 6 
 
Logical Drive 3
State                : Optimal 
RAID TYPE            : 0 
Write Policy         : Write Thru 
Read Policy          : Normal 
Cache Policy         : Direct I/O 
Stripe Size          : 32K Bytes
No. of Stripes       : 1 
Size                 : 35002MB 
Component Physical Drives : 
 
SPAN 0 
        CHANNEL : 1, ID : 8
Изображение

:cry:  В чём может быть причина? Что посоветуете?

LocDog
Advanced member
Сообщения: 112
Зарегистрирован: 07 авг 2006, 22:59

Сообщение LocDog » 14 ноя 2007, 13:31

может кабеля скази поменять ?
у меня как то был капризный сервер, который временами плющило...
проблема решилась заменой бэкплейна....
-------
если выкинуть винты из рейд1 и заменить их винтами из рейд 10 ?
просто для проверки - все ли ОК с самими дисками...
-------
заодно оставить на серваке толко 2 включеных жестких диска - именно этот первый рейд на котором система и посмотреть - будет ли сервер работать нормально или все равно сбоить?
-------
и с самим сервером все ок ? БП например...
запустить утилиту от производителя сервера для тестирования (обычно идет на диске)
-------
как вариант еще - прошивку контроллера обновить...

Ответить

Вернуться в «Массивы - RAID технологии.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 27 гостей