Solaris 10 x86 + Adaptec 2120S
Модераторы: Trinity admin`s, Free-lance moderator`s
Solaris 10 x86 + Adaptec 2120S
Было
1) зеркало (2 винта по 36 гб U320 10k фуджики)
на этом мироре стоит система.
2) рейд 10
состоял из 2х хитачей 72 гб U320 10k + 2 hp-compaq 73 гб U320 10k
на нем лежали данные.
система работала в среднем сутки, при интенсивном IO она просто висла (halted, смог повторить ситуацию и увидел в консоли мол скази тайм аут i give up, причем не к отдельному масиву а ко всему разом)
в логах сендмыла (в остальных чистота никаких ошибок) проскачила ошибка Async IO error
сделал вывод что неполучица тут рэйд 10, видимо винты не дружат
сделал 2 отдельных мирора хитачи+хитачи и компаки+компаки.
да кстати Adaptec 2120S прошивка обновлена до последней.
и вот уже без 10го рейда машина снова повисла, без всяких логов и т.п. причом машина вешаеца не под нагрузкой!!!! под нагрузкой как трактор пашет. (+ запускал стресс тесты - пофиг не вешаеца)
при висюке она исправно пингуеца, при конекте на ssh отлупа нету а просто все висит, после ребута никаких ошибок ни у одного демона нету, ни кор дампов _ничего_!
з.ы. подключая монитор в дата центре к уже повисшей машинке ничего не видно и клава не реагирует..
-----------------------------
з.ы. мой контроллер есть в HCL для солярки и не просто есть а имеет тест левел 2, т.е. оттестирован самими сантехниками.... я уже и незнаю на что думать
з.ы.ы
м.б. имеет смысл для каждой фс установить вместо onerror=panic onerror=lock ?
и как проверить в винтах ли дело, м.б. каконть скриптик хитрый который бы перехватывал то что система пишет в консоль и отправлял куданибуть....
1) зеркало (2 винта по 36 гб U320 10k фуджики)
на этом мироре стоит система.
2) рейд 10
состоял из 2х хитачей 72 гб U320 10k + 2 hp-compaq 73 гб U320 10k
на нем лежали данные.
система работала в среднем сутки, при интенсивном IO она просто висла (halted, смог повторить ситуацию и увидел в консоли мол скази тайм аут i give up, причем не к отдельному масиву а ко всему разом)
в логах сендмыла (в остальных чистота никаких ошибок) проскачила ошибка Async IO error
сделал вывод что неполучица тут рэйд 10, видимо винты не дружат
сделал 2 отдельных мирора хитачи+хитачи и компаки+компаки.
да кстати Adaptec 2120S прошивка обновлена до последней.
и вот уже без 10го рейда машина снова повисла, без всяких логов и т.п. причом машина вешаеца не под нагрузкой!!!! под нагрузкой как трактор пашет. (+ запускал стресс тесты - пофиг не вешаеца)
при висюке она исправно пингуеца, при конекте на ssh отлупа нету а просто все висит, после ребута никаких ошибок ни у одного демона нету, ни кор дампов _ничего_!
з.ы. подключая монитор в дата центре к уже повисшей машинке ничего не видно и клава не реагирует..
-----------------------------
з.ы. мой контроллер есть в HCL для солярки и не просто есть а имеет тест левел 2, т.е. оттестирован самими сантехниками.... я уже и незнаю на что думать
з.ы.ы
м.б. имеет смысл для каждой фс установить вместо onerror=panic onerror=lock ?
и как проверить в винтах ли дело, м.б. каконть скриптик хитрый который бы перехватывал то что система пишет в консоль и отправлял куданибуть....
во тчто он пишет в консоли когда зависает
WARNING : /pci@0,0/pci1022,7450@b/pci9005,286@3/sd@1,0(sd1)
SCSI transport failed: reasons "time out" giving up
WARNING : /pci@0,0/pci1022,7450@b/pci9005,286@3/sd@1,0(sd2)
SCSI transport failed: reasons "time out" giving up
---------------------------------------------------------------
MB Thunder K8S Pro (S2882)
http://tyan.com/products/html/thunderk8spro.html
CPU Opteron 242 1.6 Ghz x2
ram 2Gb ddr 2100 ecc reg kingston
Adaptec 2120S SCISI RAID
винты
2 фуджка U320 10 000 rpm 36 gb - в мироре 80pin в хот свап корзине
2 хитачи U320 10 000 rpm 73 gb - в мироре 80pin в хот свап корзине
2 hp-compaq U320 10 000 rpm 73 gb - в мироре 80pin в хот свап корзине
------------------------------------------------------------------
WARNING : /pci@0,0/pci1022,7450@b/pci9005,286@3/sd@1,0(sd1)
SCSI transport failed: reasons "time out" giving up
WARNING : /pci@0,0/pci1022,7450@b/pci9005,286@3/sd@1,0(sd2)
SCSI transport failed: reasons "time out" giving up
---------------------------------------------------------------
MB Thunder K8S Pro (S2882)
http://tyan.com/products/html/thunderk8spro.html
CPU Opteron 242 1.6 Ghz x2
ram 2Gb ddr 2100 ecc reg kingston
Adaptec 2120S SCISI RAID
винты
2 фуджка U320 10 000 rpm 36 gb - в мироре 80pin в хот свап корзине
2 хитачи U320 10 000 rpm 73 gb - в мироре 80pin в хот свап корзине
2 hp-compaq U320 10 000 rpm 73 gb - в мироре 80pin в хот свап корзине
------------------------------------------------------------------
Последний раз редактировалось shellcode 25 окт 2005, 11:26, всего редактировалось 1 раз.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 2 гостя