Üdv mindenkinek!
Adott egy Primergy TX200 szerver LSI MegaRAID SCSI 320-X raid vezérlővel.
A szerveren Red Hat Enterprise Linux ES release 3 fut (2.4.21-27.0.1.ELsmp kernellel).
Kb. két éve gond nélkül üzemel, azonban legutóbb hirtelen lefagyott, és a konzolról sem lehetett belépni. A konzolra az alábbbi hibaüzenetet írta:
SCSI: aborting command due timeout: pid 3438457, scsi1, channel0, id0, lun0 Read(10) 0000305aef00000800
SCSI1 channel 0: resetting for second half of retries
SCSI bus is being reset for host1 channel 0
megaraid_RESET: 00000000 cmd=28 , flag=1
SCSI host1 channel0 reset (pid 3438458) timed out – trying harder
SCSI bus is being reset for host1 channel 0
megaraid_RESET: 00347779 cmd=28 , flag=6
SCSI host1 reset (pid 3438458) timed out again
probably an unrecoverable SCSI bus or device hang
Reset gombbal lehetett csak újraindítani, azóta viszont gond nélkül üzemel. Viszont ez már a második ilyen gépünk, mely ezt a hibát produkálja (a másik ugyanez a típus volt).
Vajon mi okozhatja ezt?
A /var/log/messages állományba nem került be semmi a hibával kapcsolatban.
üdv mindenkinek:
á.
legutóbbi hsz