Какие то чудеса????

На доскональное знание данной темы, не может претендовать, пожалуй ни один спец, из ныне живущих на земле. ;-)
Так поможем друг другу.

Модераторы: Trinity admin`s, Free-lance moderator`s

Ответить
antona
Junior member
Сообщения: 6
Зарегистрирован: 05 окт 2006, 16:09

Какие то чудеса????

Сообщение antona » 05 окт 2006, 16:16

Подскажите???
Linux kernel 2.6.15.4 smp
Cистема стоит на raid adaptec-2130 (raid5 - 4 диска) драйвера на raid из ядра.
Есть еще один диск SATA.
Система может загружаться, а может и не грузится - останавливается при проверке SATA диска. При этом если система загружаестя, то в /proc/scsi/scsi:
Attached devices:
Host: scsi0 Channel: 00 Id: 00 Lun: 00
 Vendor: Adaptec  Model: 2130S RAID5      Rev: V1.0
 Type:   Direct-Access                    ANSI SCSI revision: 02
Host: scsi0 Channel: 01 Id: 00 Lun: 00
 Vendor: SEAGATE  Model: ST336807LW       Rev: 0C01
 Type:   Direct-Access                    ANSI SCSI revision: 03
Host: scsi0 Channel: 01 Id: 01 Lun: 00
 Vendor: SEAGATE  Model: ST336807LW       Rev: 0C01
 Type:   Direct-Access                    ANSI SCSI revision: 03
Host: scsi0 Channel: 01 Id: 02 Lun: 00
 Vendor: SEAGATE  Model: ST336807LW       Rev: 0C01
 Type:   Direct-Access                    ANSI SCSI revision: 03
Host: scsi0 Channel: 01 Id: 04 Lun: 00
 Vendor: SEAGATE  Model: ST336807LW       Rev: 0C01
 Type:   Direct-Access                    ANSI SCSI revision: 03
Host: scsi1 Channel: 00 Id: 00 Lun: 00
 Vendor: ATA      Model: ST3200822AS      Rev: 3.01
 Type:   Direct-Access                    ANSI SCSI revision: 05
, а если останавливается во время проверки SATA то видим в /proc/scsi/scsi:
Attached devices:
Host: scsi0 Channel: 00 Id: 00 Lun: 00
 Vendor: Adaptec  Model: 2130S RAID5      Rev: V1.0
 Type:   Direct-Access                    ANSI SCSI revision: 02
Host: scsi1 Channel: 00 Id: 00 Lun: 00
 Vendor: ATA      Model: ST3200822AS      Rev: 3.01
 Type:   Direct-Access                    ANSI SCSI revision: 05
Какие то чудеса????
Т.е. ОС может загрузится, а может и остановить загрузку на проверке SATA. При этом SATA монтируется вручную.

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Сообщение apelsin » 05 окт 2006, 16:52

а в логах что?  
похоже на глюк scsi или модуля для адаптека,  сказать точнее без лога низя.

PS:  а что за ОСь?

antona
Junior member
Сообщения: 6
Зарегистрирован: 05 окт 2006, 16:09

Сообщение antona » 05 окт 2006, 18:03

OC - ASP linux 10
Вопрос стал еще более интересным.
Я заметил, что загрузка не всегда зависает на проверке SATA, но привожу 2 разных dmesg (во вложении).

Файлы разные, но ведь система одна!!!
dmesg.bad - не всегда успешная загрузка;
dmesg.good - успешная (но возможно это совпадение).
Вложения
dmesg.bad.txt
(15.69 КБ) 885 скачиваний
dmesg.good.txt
(17.21 КБ) 888 скачиваний

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Сообщение apelsin » 06 окт 2006, 12:32

логи это хорошо!
есть идеи, но  прежде хотелось бы выяснить 3 вещи:

1. cat /proc/mounts;  после того как система загрузится нормально
2. cat /etc/fstab
3. зачем вам нужет самосборный кернел?

antona
Junior member
Сообщения: 6
Зарегистрирован: 05 окт 2006, 16:09

Сообщение antona » 06 окт 2006, 12:50

/proc/mounts
rootfs / rootfs rw 0 0
/dev /dev tmpfs rw 0 0
/dev/root / ext3 rw,data=ordered 0 0
/proc /proc proc rw,nodiratime 0 0
/proc/bus/usb /proc/bus/usb usbfs rw 0 0
/sys /sys sysfs rw 0 0
none /dev/pts devpts rw 0 0
/dev/sdb1 /mnt/sdb1 ext3 rw,data=ordered 0 0
/dev/sdb2 /mnt/sdb2 ext3 rw,data=ordered 0 0
none /proc/sys/fs/binfmt_misc binfmt_misc rw 0 0
sunrpc /var/lib/nfs/rpc_pipefs rpc_pipefs rw 0 0
/etc/fstab
/dev/sda5       none            swap    sw                                                      0       0
/dev/sda1       /               ext3    defaults,errors=remount-ro                             0       1
proc            /proc           proc    defaults                                                0       0
none            /dev/pts        devpts  gid=5,mode=620                                          0       0

/dev/hda        /media/cdrom    auto    pamconsole,iocharset=koi8-r,ro,exec,noauto,managed      0       0
LABEL=sata1     /mnt/sdb1       ext3    defaults                                                1       2
LABEL=sata2     /mnt/sdb2       ext3    defaults                                                1       3
3. зачем вам нужет самосборный кернел?
А с родным ядром тоже самое происходит.

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Сообщение apelsin » 06 окт 2006, 14:40

таки оба варианта выглядят нормально, с небольшим различием

смотрим в фстаб:
массив рэйд у нас устройство sda,  где есть партиции  sda1 - /<система>, sda2, и в sda2  вложена extended партиция sda5 - свап.

далее, в варианте "бэд":
EXT3 FS on sda1, internal journal ;  инициализировалась /<система> на сда1, как и положено
...
kjournald starting.  Commit interval 5 seconds
EXT3 FS on sdb1, internal journal ; инициализировалася ваш сата диск, партиция sata1
EXT3-fs: mounted filesystem with ordered data mode.
kjournald starting.  Commit interval 5 seconds
EXT3 FS on sdb2, internal journal  инициализировалася ваш сата диск, партиция sata1
EXT3-fs: mounted filesystem with ordered data mode.
Adding 4200956k swap on /dev/sda5.  Priority:-1 extents:1 across:4200956k;  свап тоже ОК


вариант "гут":
EXT3 FS on sda1, internal journal
...
kjournald starting.  Commit interval 5 seconds
EXT3 FS on sdf1, internal journal
EXT3-fs: mounted filesystem with ordered data mode.
kjournald starting.  Commit interval 5 seconds
EXT3 FS on sdf2, internal journal
EXT3-fs: mounted filesystem with ordered data mode.
Adding 4200956k swap on /dev/sda5.  Priority:-1 extents:1 across:4200956k

заметьте, таже картина -- то есть  все партиции инициализируются и подключаются правильно. Почему система у вас останавливается мне не ясно., так как все файловые системы монтируются нормально в обоих случаях.  Что пишется в консоль в момент остановки загрузки?

Единственное отличие  "гут" от "бэд" это то что контроллер  адаптек, кроме того что показывает рейд массив как сутройство sda,   показывает еще и каждый диск в отдельности как устройства sdb,sdc,sdd, sde, что думается есть правильное поведение, т.к. диски по отдельности нужны для S.M.A.R.T мониторинга и проч.

Почему контроллер ведет себя по разному?  .. хз, адаптек его знает :twisted: .  баг в аacraid, баг в фирмвари, дефект  контроллере или какая-то комбинация вышеуказанного.   Выяснить подробнее можно включив  CONFIG_SCSI_DEBUG и  посмотреть на лог scsi комманд.    Мое подозрение что это возможно баг вирмвари и/или контроллера.    Советую обратится в тех-поддержку производителя сервера.
А с родным ядром тоже самое происходит.
 тем более поменяйте обратно на нормальное ядро.     Самосборные ядра это для разработчиков ядра и тех кто хочет протестировать код не вошедший в состав ядра.  То что под линуксом пересобрать ядро это просто вовсе не означает того что это нужно делать каждуму сисадмину на продакшен системах.

antona
Junior member
Сообщения: 6
Зарегистрирован: 05 окт 2006, 16:09

Сообщение antona » 06 окт 2006, 15:23

система останавливается при:
fsck.ext3: unable to resolve 'LABEL=sata1'
и
control-D
при этом в /proc/scsi/scsi мы видим 2 устроиства: RAID и SATA.
Но на 2.6.15 после перехода в консоль Я могу вручную смонтировать SATA, а на родном 2.6.9 нет.
Может вопрос с драиверами под SATA???
Еще деталь - драйвера SATA подгружаются,
может пересобрать initrd.img c драйверами SATA.

А почему Вы советуете не пользоваться самосборным Ядром?
Ведь разрабатывают его для устранения багов в преведущих ядрах???

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Сообщение apelsin » 06 окт 2006, 15:52

antona писал(а):А почему Вы советуете не пользоваться самосборным Ядром?
Ведь разрабатывают его для устранения багов в преведущих ядрах???
вы заблуждаетесь

САТА драйвера видят диски, ошибок не дают. диски доступны.  Что еще должны делать сата драйвера?  не, это мимо.

если система виснет на fsck,  поставьте  0 на проверку у sata1 и sata2,  далее при загрузке в "bad" режим запусите фсчк вручную чтобы понять в чем всетаки дело.

И еще я вам настоятельно советую обратится в тех-поддержку по поводу странного поведения контроллера.

antona
Junior member
Сообщения: 6
Зарегистрирован: 05 окт 2006, 16:09

Сообщение antona » 09 окт 2006, 10:01

apelsin писал(а):САТА драйвера видят диски, ошибок не дают. диски доступны.  Что еще должны делать сата драйвера?  не, это мимо.

если система виснет на fsck,  поставьте  0 на проверку у sata1 и sata2,  далее при загрузке в "bad" режим запусите фсчк вручную чтобы понять в чем всетаки дело.
Возможно это и не SATA драйвера, а сам диск виноват.
Но fsck воспользоваться нельзя т.к. команда:
fdisk /dev/sdb
говорит:
Unable to open /dev/sdb
Следовательно его вообще нет, хотя во время загрузки мы видим:
ata1: SATA max UDMA/133 cmd 0xCE80 ctl 0xCE02 bmdma 0xCC80 irq 193
ata2: SATA max UDMA/133 cmd 0xCD80 ctl 0xCD02 bmdma 0xCC88 irq 193
ata1: dev 0 cfg 49:2f00 82:346b 83:7d01 84:4003 85:3469 86:3c01 87:4003 88:207f
ata1: dev 0 ATA, max UDMA/133, 390721968 sectors: lba48
ata1: dev 0 configured for UDMA/133
scsi1 : ata_piix
ata2: SATA port has no device.
scsi2 : ata_piix
 Vendor: ATA       Model: ST3200822AS       Rev: 3.01
 Type:   Direct-Access                      ANSI SCSI revision: 05
SCSI device sdb: 390721968 512-byte hdwr sectors (200050 MB)
SCSI device sdb: drive cache: write back
sdb: sdb1 sdb2
Attached scsi disk sdb at scsi1, channel 0, id 0, lun 0

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Сообщение apelsin » 09 окт 2006, 12:26

в случае когда фсчк/фдиск отвечает "cannot open", запустите fsck.ext3 и fdisk через strace:
#strace fdisk /dev/sdb
#strace fsck.ext3 /dev/sdb
тогда станет ясно почему недоступен диск.

ЗЫ: не думаю что это в самом диске дело, т.к. файловая система на него монтируестя без проблем в другом случае.

antona
Junior member
Сообщения: 6
Зарегистрирован: 05 окт 2006, 16:09

Сообщение antona » 09 окт 2006, 13:56

Спасибо за подсказку про strace, но это не помогает решить проблему т.к.
нет файла /dev/sdb вообще.
Т.е. в /var/log/dmesg мы видим:
SCSI device sdb: 390721968 512-byte hdwr sectors (200050 MB)
SCSI device sdb: drive cache: write back
sdb: sdb1 sdb2
Attached scsi disk sdb at scsi1, channel 0, id 0, lun 0
а после загрузки устройства /dev/sdb - нет.

Может что еще подскажите????(Заранее благодарен!!!)

Аватара пользователя
apelsin
Advanced member
Сообщения: 470
Зарегистрирован: 09 окт 2004, 12:32

Сообщение apelsin » 09 окт 2006, 14:35


я вам подсказываю, в третий и последний раз: поменяйте кернел на стандартный, далее можно будет разобраться


Применение самосборного кернела возможно в некоторых случаях, но это подразумевает как минимум следующее:  

администратор четко знает зачем это надо, и далее в соответствии со своими служебными обязанностями отвечает за своевременное обновление прог. обеспечения
- вот у вас кернел 2.6.15.4, а сейчас 2.6.18.xx, пожалуйста обновите и не забудьте обновить пакеты udev, init-tools, ну вы сами должны знать.  Не обновили – пренебрегли своими служ. обязанностями ...

В случае с самосборным кернелом системный администратор отказывается от официального суппорта производителя ОС, т.к. самосборные кернелы никем не поддерживаются, и в суппорте полагается на поддержку инженеров-разработчиков ядра, но это подразумевает что системный админист­ратор может общаться сними на “одном языке”, т.е. у сисадмина есть необходимая тех. подготовка.

я предполагая что device entries у вас не создаются из за того что udev у вас старая, но разбираться мне лень. Поменяйте кернел и тогда продолжим если есть желание

Ответить

Вернуться в «Серверы - ПО, Unix подобные системы»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 12 гостей