Проблема с Xyratex RR-0812-LVD-RAID

Поломалось, посыпалось, не работает...

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
Аватара пользователя
selivano
Junior member
Сообщения: 5
Зарегистрирован: 09 дек 2004, 16:02
Откуда: Москва

Проблема с Xyratex RR-0812-LVD-RAID

Сообщение selivano » 09 дек 2004, 16:45

Что есть:
Intel SRSH4 (о 4-х Xeon MP 2.0, HT включён, W2K3 Ent)
2-х канальная AIC-7902 на борту
на первый канал 2хSeagate ST373307LC (программное зеркало, системный)
на второй канал Xyratex RR-0812-LVD-RAID (8 дисков ST373307LC в RAID5, Stand-Alone Dual Port)
Информация по JSS122:
Firmware revision:        L425
Baselevel:             L425R01
Board revision:              C
CPLD revision:              07
CPLD2 revision:             05
Loader revision:         6.013
Product ID:             JSS122
Daughterboard ID:         NONE
Backplane ID:                4
Controller ID:               A
Data Memory:            128 MB
Buffer SDRAM ECC:           On

Как W2K3 видит устройства:
В Disk Drivers есть
1. CNSi JSS122 SCSI Disk Device (дрова от Microsoft 01.10.2002 v.5.2.3790.0)
2. CNSi JSS122 SCSI Processor Device (дрова от Xyratex Ltd 11.12.2003 v.1.0.10.0)
+ два 2хSeagate ST373307LC на первом канале которые

В SCSI and RAID Controllers:
Два канала AIC-7902
D344PRT SCSI Controller (Generic 20.12.2003 v.3.44.0.0)

Проблема:
Периодически при активной работой с логическим диском на стойке (копирование больших файлов) в Event Log'е в системном журнале всплывает ошибка:
Event Type: Error
Event Source: adpu320
Event Category: None
Event ID: 9
Date: 09.12.2004
Time: 14:24:39
User: N/A
Computer:
Description:
The device, \Device\Scsi\adpu3202, did not respond within the timeout period.

For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
Data:
0000: 00 00 10 00 01 00 68 00   ......h.
0008: 00 00 00 00 09 00 04 c0   .......À
0010: 01 01 00 50 00 00 00 00   ...P....
0018: 00 00 00 00 00 00 00 00   ........
0020: 00 00 00 00 00 00 00 00   ........
0028: 00 00 00 00 00 00 00 00   ........
0030: 01 00 00 00 07 00 00 00   ........

Это режет глаз, но вроде бы не приводит к каким-либо последствиям для работоспособности сервера.
Но иногда вылетает такая ошибка:
Event Type: Warning
Event Source: Disk
Event Category: None
Event ID: 51
Date: 06.12.2004
Time: 12:57:34
User: N/A
Computer:
Description:
An error was detected on device \Device\Harddisk2 during a paging operation.

For more information, see Help and Support Center at http://go.microsoft.com/fwlink/events.asp.
Data:
0000: 03 00 68 00 01 00 ba 00   ..h...º.
0008: 00 00 00 00 33 00 04 80   ....3..?
0010: 2d 01 00 00 00 00 00 00   -.......
0018: 00 00 00 00 00 00 00 00   ........
0020: 00 ce d0 ad 10 00 00 00   .ÎЭ....
0028: 6e a7 0c 00 00 00 00 00   n§......
0030: ff ff ff ff 03 00 00 00   ÿÿÿÿ....
0038: 40 00 00 84 02 00 00 01   @..?....
0040: 91 20 0a 12 42 07 60 40   ? ..B.`@
0048: 00 00 00 00 0a 00 00 00   ........
0050: 00 b0 d9 08 c8 49 b8 89   .°Ù.ÈI¸?
0058: 00 00 00 00 c8 cb d0 87   ....ÈËÐ?
0060: f0 e9 4f 8a 67 e8 56 08   ðéOŠgèV.
0068: 28 00 08 56 e8 67 00 00   (..Vèg..
0070: 08 00 00 00 00 00 00 00   ........
0078: 70 00 06 00 00 00 00 0a   p.......
0080: 00 00 00 00 29 02 00 00   ....)...
0088: 00 00 00 00 00 00 00 00   ........

Всё, после этого сервер переходит в состояние нирваны (банально намертво зависает).
Что можете посоветовать для решения этой проблемы? Знаю, есть обновление для firmware JSS122, но не думаю, что в этом проблемы.

С уважением, Алексей.

P.S. Стойка куплена в Тринити.
P.P.S. Кроме встроеного Chaparral Disk Array Administrator есть средства мониторинга и управления для данного устройства? Желательно бесплатного :D .
Последний раз редактировалось selivano 09 дек 2004, 17:16, всего редактировалось 1 раз.

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 09 дек 2004, 16:53

Что в логах самого массива ? Если ничего - нужно менять кабель - свяжитесь, заменим по гарантии.

Аватара пользователя
selivano
Junior member
Сообщения: 5
Зарегистрирован: 09 дек 2004, 16:02
Откуда: Москва

Сообщение selivano » 09 дек 2004, 17:17

Логи стойки за последние 2 месяца примерно.


10/12 12:06:00   CONFIG CHANGED   Reason Code:  35 SeqNum:       13
10/28 19:33:25   BATT TEMP WARN   Pack temp range. V: 1.80 B: 0.05
10/28 20:33:50   BATT TEMP WARN   Pack temp range. V: 1.80 B: 0.05
10/28 21:36:25   BATT TEMP WARN   Pack temp range. V: 1.80 B: 0.05
10/28 22:37:25   BATT TEMP WARN   Pack temp range. V: 1.80 B: 0.05
10/28 23:38:05   BATT TEMP WARN   Pack temp range. V: 1.79 B: 0.05
10/29 00:38:10   BATT TEMP WARN   Pack temp range. V: 1.79 B: 0.05
10/29 01:38:25   BATT TEMP WARN   Pack temp range. V: 1.79 B: 0.05
10/29 02:38:40   BATT TEMP WARN   Pack temp range. V: 1.78 B: 0.05
10/29 03:39:00   BATT TEMP WARN   Pack temp range. V: 1.78 B: 0.05
10/29 04:39:25   BATT TEMP WARN   Pack temp range. V: 1.78 B: 0.05
10/29 05:39:35   BATT TEMP WARN   Pack temp range. V: 1.77 B: 0.05
10/29 06:39:45   BATT TEMP WARN   Pack temp range. V: 1.78 B: 0.05
10/29 07:39:55   BATT TEMP WARN   Pack temp range. V: 1.77 B: 0.05
10/29 08:40:05   BATT TEMP WARN   Pack temp range. V: 1.77 B: 0.05
12/06 07:15:03   POWER UP         L425R01          Controller A
12/06 07:15:06   CACHE INIT DONE  Cache clean.
12/06 07:15:08   CONFIG CHANGED   Reason Code:  22 SeqNum:        3
12/06 07:15:08   RESCAN BUS DONE
12/06 07:15:08   CONFIG CHANGED   Reason Code:  22 SeqNum:        5
12/06 07:15:08   RESCAN BUS DONE
12/06 07:16:08   ENCLOSURE ALERT  Flags: 01h       0:14             FAIL DTECTD
12/06 07:16:08   ENCLOSURE ALERT  Flags: 01h       1:14             FAIL DTECTD
12/06 07:19:10   CONFIG CHANGED   Reason Code:  22 SeqNum:        7
12/06 07:19:10   RESCAN BUS DONE
12/06 07:26:43   BATT CHARGE CPLT
12/09 14:08:38   CONFIG CHANGED   Reason Code:  24 SeqNum:        9
12/09 14:08:38   RESCAN BUS DONE
12/09 17:04:23   SET DATE/TIME

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 09 дек 2004, 17:26

12/06 07:16:08   ENCLOSURE ALERT  Flags: 01h       0:14             FAIL DTECTD
12/06 07:16:08   ENCLOSURE ALERT  Flags: 01h       1:14             FAIL DTECTD
12/06 07:19:10   CONFIG CHANGED   Reason Code:  22 SeqNum:        7
12/06 07:19:10   RESCAN BUS DONE
12/06 07:26:43   BATT CHARGE CPLT
12/09 14:08:38   CONFIG CHANGED   Reason Code:  24 SeqNum:        9
12/09 14:08:38   RESCAN BUS DONE
Вот это вот что было ? Два винта отказывали (12/06) ? Их, я так понимаю, заменили потом ? Или  - что за изменения конфигурации 12/06 и 12/09  ?

Аватара пользователя
selivano
Junior member
Сообщения: 5
Зарегистрирован: 09 дек 2004, 16:02
Откуда: Москва

Сообщение selivano » 09 дек 2004, 17:35

В том-то и дело, что ничего не меняли и при этом все диски были On-Line... Изменений конфигураций не было - 06/12 стойка просто была выключена при выключеном сервере, а после включена. Сегодня конфигурация менялась - время было поправлено на местное.

Аватара пользователя
selivano
Junior member
Сообщения: 5
Зарегистрирован: 09 дек 2004, 16:02
Откуда: Москва

Сообщение selivano » 09 дек 2004, 18:18

Вот дополнительная информация:
VCC:  5.14 V
12V: 12.11 V
BACK:  3.29 V
V_BATT_TEMP:  1.92 V
V_BATT_N:  0.01 V
V_BATT_P:  4.21 V
CPU TEMP:    53 C
ON_BOARD TEMP:    26 C
2nd ON_BOARD TEMP:    34 C
Battery Voltage:  4.21 V
Battery Status: Full charged.
Battery Age: 8 Months
Write-back cache power status: Enabled.

ymv2000
Junior member
Сообщения: 1
Зарегистрирован: 03 ноя 2005, 06:00

Сообщение ymv2000 » 07 ноя 2005, 13:27

У нас аналогичная проблема
Решилась ли Ваша?

Аватара пользователя
selivano
Junior member
Сообщения: 5
Зарегистрирован: 09 дек 2004, 16:02
Откуда: Москва

Сообщение selivano » 07 ноя 2005, 13:43

ymv2000 писал(а):У нас аналогичная проблема
Решилась ли Ваша?
Нет, я просто снизил нагрузку на стойку - убрал с неё логи Exchange.

dnk
Junior member
Сообщения: 11
Зарегистрирован: 14 ноя 2003, 12:00
Откуда: Moscow
Контактная информация:

Сообщение dnk » 10 дек 2008, 12:50

подобное решилось заменой SCSI контроллера.
был какой-то в виде платы расширения - перевел на штатный на плате.
cd /pub && get beer && more beer

Ответить

Вернуться в «Массивы - Технические вопросы, решение проблем.»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 21 гость