Solaris 10 x86 + Adaptec 2120S

На доскональное знание данной темы, не может претендовать, пожалуй ни один спец, из ныне живущих на земле. ;-)
Так поможем друг другу.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
shellcode
Junior member
Сообщения: 9
Зарегистрирован: 24 окт 2005, 15:56
Откуда: Москва

Solaris 10 x86 + Adaptec 2120S

Сообщение shellcode » 24 окт 2005, 16:07

Было
1) зеркало (2 винта по 36 гб U320 10k фуджики)
на этом мироре стоит система.

2) рейд 10
состоял из 2х хитачей 72 гб U320 10k + 2 hp-compaq 73 гб U320 10k
на нем лежали данные.

система работала в среднем сутки, при интенсивном IO она просто висла (halted, смог повторить ситуацию и увидел в консоли мол скази тайм аут i give up, причем не к отдельному масиву а ко всему разом)
в логах сендмыла (в остальных чистота никаких ошибок) проскачила ошибка Async IO error
сделал вывод что неполучица тут рэйд 10, видимо винты не дружат
сделал 2 отдельных мирора хитачи+хитачи и компаки+компаки.
да кстати Adaptec 2120S прошивка обновлена до последней.
и вот уже без 10го рейда машина снова повисла, без всяких логов и т.п. причом машина вешаеца не под нагрузкой!!!! под нагрузкой как трактор пашет. (+ запускал стресс тесты - пофиг не вешаеца)
при висюке она исправно пингуеца, при конекте на ssh отлупа нету а просто все висит, после ребута никаких ошибок ни у одного демона нету, ни кор дампов _ничего_!
з.ы. подключая монитор в дата центре к уже повисшей машинке ничего не видно и клава не реагирует..
-----------------------------
з.ы. мой контроллер есть в HCL для солярки и не просто есть а имеет тест левел 2, т.е. оттестирован самими сантехниками.... я уже и незнаю на что думать  :cry:
з.ы.ы
м.б. имеет смысл для каждой фс установить вместо onerror=panic onerror=lock ?
и как проверить в винтах ли дело, м.б. каконть скриптик хитрый который бы перехватывал то что система пишет в консоль и отправлял куданибуть....

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 25 окт 2005, 11:07

Позвольте поинтересоваться - а чего в этом сервере делают
2 hp-compaq 73 гб U320 10k ?  :insane:
Второй момент - а приведите конфигурацию сервера полностью, пожалуйста.
Да, кстати - и винты эти все в корзине или на шлейфе ? Или еще как-то подключены ?

shellcode
Junior member
Сообщения: 9
Зарегистрирован: 24 окт 2005, 15:56
Откуда: Москва

Сообщение shellcode » 25 окт 2005, 11:12

во тчто он пишет в консоли когда зависает
WARNING : /pci@0,0/pci1022,7450@b/pci9005,286@3/sd@1,0(sd1)
SCSI transport failed: reasons "time out" giving up
WARNING : /pci@0,0/pci1022,7450@b/pci9005,286@3/sd@1,0(sd2)
SCSI transport failed: reasons "time out" giving up
---------------------------------------------------------------
MB Thunder K8S Pro (S2882)
http://tyan.com/products/html/thunderk8spro.html
CPU Opteron 242 1.6 Ghz x2
ram 2Gb ddr 2100 ecc reg kingston
Adaptec 2120S SCISI RAID
винты
2 фуджка U320 10 000 rpm 36 gb - в мироре 80pin в хот свап корзине
2 хитачи U320 10 000 rpm 73 gb - в мироре 80pin в хот свап корзине
2 hp-compaq U320 10 000 rpm 73 gb - в мироре 80pin в хот свап корзине
------------------------------------------------------------------
Последний раз редактировалось shellcode 25 окт 2005, 11:26, всего редактировалось 1 раз.

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 25 окт 2005, 11:19

ОК, но сообщите пожалуйста конфигурацию сервера полностью, а также - как именно подключены к контроллеру винты.
Штатные телепаты у нас в перманентном отпуске.

shellcode
Junior member
Сообщения: 9
Зарегистрирован: 24 окт 2005, 15:56
Откуда: Москва

Сообщение shellcode » 25 окт 2005, 11:27

сори долго писал =)
т.е. отваливаеца второй массив состоящий из 2х хитачей, винты абсолютно новые.... в тойже самой корзине стоят и хп-компаки...
на мамку и контроллер накатаны последние прошивки.

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Сообщение apelsin » 25 окт 2005, 12:40

чисто субъективное мнение:

из опыта знаю что подобные зависания у *никсов происходят когда ОСь не может писать/читать в корневой раздел файловой системы.  

Я думаю что причина в контроллере а не в винтах или драйверах, возможно тепловой режим корпусе или что еще.

Аватара пользователя
a_shats
Advanced member
Сообщения: 5010
Зарегистрирован: 27 авг 2002, 10:55
Откуда: Москва
Контактная информация:

Сообщение a_shats » 25 окт 2005, 12:59

Причина была в неправильном подключении корзин ;) Мы уже по аське пообщались.

Ответить

Вернуться в «Серверы - ПО, Unix подобные системы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 10 гостей