ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

У вас сложности? Наши специалисты постараются помочь вам. Если вы сами сталкивались с похожими проблемами - поделитесь опытом.

Модераторы: Trinity admin`s, Free-lance moderator`s

rtk
Junior member
Сообщения: 2
Зарегистрирован: 13 июн 2014, 16:04
Откуда: Санкт-Петербург

ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение rtk » 13 июн 2014, 16:46

Здравствуйте!

На сервере c установленным ESXi 5.5.0 1331820, при активном вводе/выводе в одной из виртуальных машин в течении 1.5 - 2.5 часов от сервера отваливается контроллер Adaptec 6405.


Железо:
Supermicro X9DRD-iF/LF
CPU 1 x E5-2630
RAM 32GB
Adaptec 6405 ( firmware 19144 )
HDD 2 x 300GB ( HUS156030VLS600 )


ESXi 5.5.0 1331820
ESXi и вирт. машины установлены на единственное зеркало.
Для Adaptec'а установлены драйвер scsi-aacraid, а также arcconf и arcsmis

Код: Выделить всё

~ # esxcli software vib list
Name                           Version                               Vendor       Acceptance Level  Install Date
-----------------------------  ------------------------------------  -----------  ----------------  ------------
scsi-aacraid                   5.5.5.2.1.40301-1OEM.550.0.0.1331820  Adaptec_Inc  VMwareCertified   2014-04-13  
arcconf                        1.00-1                                Adaptec      unknown           2014-06-10  
arcsmis                        1.00-1                                Adaptec      unknown           2014-06-10

Код: Выделить всё

~ # esxcli software vib get

Adaptec_Inc_bootbank_scsi-aacraid_5.5.5.2.1.40301-1OEM.550.0.0.1331820
   Name: scsi-aacraid
   Version: 5.5.5.2.1.40301-1OEM.550.0.0.1331820
   Type: bootbank
   Vendor: Adaptec_Inc
   Acceptance Level: VMwareCertified
   Summary: aacraid: scsi driver for VMware ESX
   Description: Adaptec HBA Driver
   ReferenceURLs: 
   Creation Date: 2013-10-31
   Depends: vmkapi_2_2_0_0, com.vmware.driverAPI-9.2.2.0
   Conflicts: 
   Replaces: 
   Provides: 
   Maintenance Mode Required: True
   Hardware Platforms Required: 
   Live Install Allowed: False
   Live Remove Allowed: False
   Stateless Ready: False
   Overlay: False
   Tags: driver, module
   Payloads: scsi-aac


Adaptec_bootbank_arcconf_1.00-1
   Name: arcconf
   Version: 1.00-1
   Type: bootbank
   Vendor: Adaptec
   Acceptance Level: unknown
   Summary: ARC CLI provider: ESX release
   Description: ARC CLI provider
   ReferenceURLs: 
   Creation Date: 2014-02-17
   Depends: 
   Conflicts: 
   Replaces: 
   Provides: 
   Maintenance Mode Required: False
   Hardware Platforms Required: 
   Live Install Allowed: True
   Live Remove Allowed: True
   Stateless Ready: False
   Overlay: False
   Tags: 
   Payloads: arcconf

Adaptec_bootbank_arcsmis_1.00-1
   Name: arcsmis
   Version: 1.00-1
   Type: bootbank
   Vendor: Adaptec
   Acceptance Level: unknown
   Summary: ARC SMIS provider: ESX release
   Description: ARC SMIS provider
   ReferenceURLs: 
   Creation Date: 2014-02-17
   Depends: 
   Conflicts: 
   Replaces: 
   Provides: 
   Maintenance Mode Required: False
   Hardware Platforms Required: 
   Live Install Allowed: True
   Live Remove Allowed: True
   Stateless Ready: False
   Overlay: False
   Tags: 
   Payloads: arcsmis


После установки сервер стабильно проработал месяц, затем потерял контроллер, примерно через месяц ситуация повторилась.
Начали искать источник проблем.
В виртуальной машине запустили тест на рандомный read при помощи fio. Примерно через полтора часа после начала теста в логах ESXi стали сыпаться ошибки

Код: Выделить всё

2014-06-12T22:15:02.874Z esxi vmkernel: cpu9:32993)<3>aacraid: Host adapter abort request (1,0,0,0) 
2014-06-12T22:15:02.874Z esxi vmkernel: cpu9:32993)WARNING: LinScsi: SCSILinuxAbortCommands:1837: Failed, Driver aacraid, for vmhba2

Datastore в ESXi стал недоступен со всеми виртуальными машинами, при этом на сам ESXi можно залогиниться к примеру по ssh.

Повторный тест дал аналогичный результат, только на этот раз сервер продержался 2.5 часа.

Информацию с контроллера начали снимать утилитой arcconf раз в пять минут с параметрами (GETCONFIG 1, GETSTATUS 1, PHYERRORLOG 1 DEVICE ALL, GETLOGS 1 DEAD, GETLOGS 1 DEVICE, GETLOGS 1 EVENT, GETSMARTSTATS 1 )
Запустили тест заново, контроллер отвалился, при этом получили информацию в момент перед зависанием и после перезагрузки
- за 2 минуты до зависания, контроллер под нагрузкой ( файл 20140613_0215.txt в аттачменте)
- сразу после перезагрузки ( 20140613_0943.txt)

В результате заметили, что после подвисания и перезагрузки в GETLOGS 1 EVENT появляется три новых EVENT'а:

Код: Выделить всё

<event Date="1402637834"
eventType="FSA_EM_EXPANDED_EVENT"
eventCode="0x10000000"
groupType="FSA_EXE_SCSI_GROUP"
groupCode="2"
priority="3"
subType="FSA_EXE_SCSI_SENSE_DATA"
subTypeCode="12"
cdb="00 00 00 00 00 00 00 00 00 00 00 00"
data="70 00 06 00 00 00 00 00 00 00 00 00 29 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00"
lun="0"
controllerID="0"
channelID="0"
deviceID="0"/>

<event Date="1402637834"
eventType="FSA_EM_EXPANDED_EVENT"
eventCode="0x10000000"
groupType="FSA_EXE_SCSI_GROUP"
groupCode="2"
priority="3"
subType="FSA_EXE_SCSI_SENSE_DATA"
subTypeCode="12"
cdb="00 00 00 00 00 00 00 00 00 00 00 00"
data="70 00 06 00 00 00 00 00 00 00 00 00 29 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00"
lun="0"
controllerID="0"
channelID="0"
deviceID="1"/>

<event Date="1402637863"
eventType="FSA_EM_BATTERY_CHANGE"
eventCode="0x4000"
batteryEventType="FSA_BATTERY_DEAD"
batteryEventCode="1"
priorState="0"
currentState="0"
controllerID="0"/>
Подскажите пожалуйста что может быть причиной данных проблем?
Вложения
20140613_0943.txt
(15.27 КБ) 681 скачивание
20140613_0215.txt
(14.31 КБ) 655 скачиваний

KAI
Advanced member
Сообщения: 450
Зарегистрирован: 10 окт 2006, 18:35
Откуда: Киев
Контактная информация:

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение KAI » 16 июн 2014, 20:09

BIOS материнки? Обновляли?

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение Stranger03 » 17 июн 2014, 11:50

rtk писал(а):Здравствуйте!
Укажите город в профиле.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

FessAectan
Junior member
Сообщения: 17
Зарегистрирован: 29 июн 2014, 21:27
Откуда: Новокузнецк

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение FessAectan » 29 июн 2014, 21:30

Присоеденяюсь к ТС.
Ровно такое же поведение, но контроллер Adaptec RAID 6805Q.

Очень жду каких-либо рекомендаций.

FessAectan
Junior member
Сообщения: 17
Зарегистрирован: 29 июн 2014, 21:27
Откуда: Новокузнецк

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение FessAectan » 30 июн 2014, 00:11

rtk писал(а):Здравствуйте!

На сервере c установленным ESXi 5.5.0 1331820, при активном вводе/выводе в одной из виртуальных машин в течении 1.5 - 2.5 часов от сервера отваливается контроллер Adaptec 6405.

.....
Так и не понял возможно ли здесь отправлять личные сообщения, rtk, если вдруг загляните в ветку, отпишите получилось ли у Вас решить проблему.

Accel
Power member
Сообщения: 45
Зарегистрирован: 25 окт 2013, 17:18
Откуда: Екатеринбург

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение Accel » 05 авг 2014, 18:55

Наблюдаю подобную картину на похожей материнке на одном из серверов (ESXi чуть посвежее) при бэкапе по сети (а там всего 600-700 Мбит/с). В планах было подключать iSCSI 10G, а теперь уже и не знаю. Вопрос у автора как-то решился?

FessAectan
Junior member
Сообщения: 17
Зарегистрирован: 29 июн 2014, 21:27
Откуда: Новокузнецк

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение FessAectan » 05 авг 2014, 19:15

А мне сказали
"Обращайтесь в VMware"

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение Stranger03 » 06 авг 2014, 08:43

всем
Попробуйте обновится до: http://www.adaptec.com/en-us/downloads/ ... +6405.html
Драйвер: http://www.adaptec.com/en-us/downloads/ ... +6405.html (у топикстартера драйвер последний).
Кроме того надо понимать, как подключены диски. Проверить кабеля. Проверить бекплейн если есть. Если был перегревы, смотреть внимательно, вдруг там чего не так.
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

Аватара пользователя
Stranger03
Сотрудник Тринити
Сотрудник Тринити
Сообщения: 12979
Зарегистрирован: 14 ноя 2003, 16:25
Откуда: СПб, Екатеринбург
Контактная информация:

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение Stranger03 » 06 авг 2014, 08:45

Проверить биос на матери: http://www.supermicro.nl/products/mothe ... drd-if.cfm
С уважением Геннадий
ICQ 116164373
eburg@trinitygroup.ru

FessAectan
Junior member
Сообщения: 17
Зарегистрирован: 29 июн 2014, 21:27
Откуда: Новокузнецк

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение FessAectan » 06 авг 2014, 11:21

Обращался в саппорт адаптека, мне прислали новый драйвер.
Попробуйте, я пока не пытался.
"В данный момент единственное, что я могу Вам предложить - это установить и протестировать систему с более новым драйвером контроллера под ESXi 5.5. Версия драйвера: 40700, и скачать его можно здесь: http://www.adaptec.com/en-us/support/pass/

Filename: aacraid_vmware_drivers_1.2.1-40700.tgz
Password: shuttle
"

Это самый последний.

maverlife
Advanced member
Сообщения: 186
Зарегистрирован: 28 янв 2014, 08:31
Откуда: Иркутск

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение maverlife » 06 авг 2014, 11:41

40700 уже доступен официально на странице поддержки продуктов.

FessAectan
Junior member
Сообщения: 17
Зарегистрирован: 29 июн 2014, 21:27
Откуда: Новокузнецк

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение FessAectan » 06 авг 2014, 12:31

maverlife писал(а):40700 уже доступен официально на странице поддержки продуктов.
ну хорошо коли так, я не смотрел

MaTpockuH-koT
member
Сообщения: 21
Зарегистрирован: 08 май 2014, 15:06
Откуда: Зеленоград

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение MaTpockuH-koT » 12 авг 2014, 18:33

Можете попытаться с новым драйвером, но бесполезно.
Уже проверено, ситуация ровно такая же :(
В адаптек отписано, в ответ: они работают над проблемой, ожидайте :yo:

s_ivanov
Junior member
Сообщения: 1
Зарегистрирован: 20 авг 2014, 11:37

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение s_ivanov » 24 авг 2014, 18:00

Точно такая же проблема решилась только заменой контроллера на LSI. Никакие замены драйверов, прошивок на Adaptec и материнской плате ничего не дали.

FessAectan
Junior member
Сообщения: 17
Зарегистрирован: 29 июн 2014, 21:27
Откуда: Новокузнецк

Re: ESXi 5.5.0 под нагрузкой i/o отваливается Adaptec 6405

Сообщение FessAectan » 08 сен 2014, 12:53

А мне вот что ответили:
"В данный момент, увы, новый драйвер предоставить не можем. Но, в данный момент ясно, что проблематика связанна с материнскими платами Supermicro и процессорами Intel V2. Если взять процессор V1, то проблема исчезает."

Ответить

Вернуться в «Серверы - Решение проблем»

Кто сейчас на конференции

Сейчас этот форум просматривают: Google [Bot] и 61 гость