Heute haben wir eine Meldung von der HMC bekommen, dass eine der Cache Batterien in unserem VIOS System bald leer ist.
Reporting system: VSPWR01
Machine type-model/serial: 8202-E4B/10BF39P Problem number: 42
Error: 2519-8009
Description: Impending Cache Battery Pack failure.
Last occurred: 10/10/13 4:20 PM
Current status:
PMR number: n/a
Details:
Das heisst, dass wir also eins oder gleich mehrere der Batteriepacks in den nächsten 90 Tagen tauschen müssen.
Das geht meist im laufenden Betrieb und dauert nur 10min.
Informationen einholen
Jetzt muss man natürlich erstmal gucken, welche Batterie das ist.
Das geht wie bei defekten Platten auch über das „diagmenu“.
Dazu meldet man sich auf der HMC als „padmin“ an und ruft das Programm „diagmenu“ auf.
Dann geht man nach „Task Selection (Diagnostics, Advanced Diagnostics, Service Aids, etc.)„, „RAID Array Manager„, „IBM SAS Disk Array Manager“ und dann „Diagnostics and Recovery Options„.
Hier gibts den Punkt „Controller Rechargeable Battery Maintenance“ und darunter „Display Controller Rechargeable Battery Information„.
Hier lässt man sich dann für alle sissasX Controller die aktuellen Batterielaufzeiten anzeigen.
RAID Adapter . . . . . . . . . . . . . : sissas0
Battery Type . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)Â . . . . . . . . . : 827
Adjusted power-on time (days) . . . . . : 827
Estimated time to warning (days)Â . . . : 146
Estimated time to error (days)Â . . . . : 237
Concurrently maintainable battery pack. : No
Battery pack can be safely replaced . . : NoRAID Adapter . . . . . . . . . . . . . : sissas1
Battery Type . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)Â . . . . . . . . . : 827
Adjusted power-on time (days) . . . . . : 827
Estimated time to warning (days)Â . . . : 146
Estimated time to error (days)Â . . . . : 237
Concurrently maintainable battery pack. : No
Battery pack can be safely replaced . . : NoRAID Adapter . . . . . . . . . . . . . : sissas2
Battery Type . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)Â . . . . . . . . . : 825
Adjusted power-on time (days) . . . . . : 825
Estimated time to warning (days)Â . . . : 147
Estimated time to error (days)Â . . . . : 238
Concurrently maintainable battery pack. : Yes
Battery pack can be safely replaced . . : NoRAID Adapter . . . . . . . . . . . . . : sissas3
Battery Type . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)Â . . . . . . . . . : 825
Adjusted power-on time (days) . . . . . : 872
Estimated time to warning (days)Â . . . : 94
Estimated time to error (days)Â . . . . : 180
Concurrently maintainable battery pack. : Yes
Battery pack can be safely replaced . . : NoRAID Adapter . . . . . . . . . . . . . : sissas4
Battery Type . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : Warning condition
Power-on time (days)Â . . . . . . . . . : 923
Adjusted power-on time (days) . . . . . : 973
Estimated time to warning (days)Â . . . : 0
Estimated time to error (days)Â . . . . : 85
Concurrently maintainable battery pack. : Yes
Battery pack can be safely replaced . . : NoRAID Adapter . . . . . . . . . . . . . : sissas5
Battery Type . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)Â . . . . . . . . . : 879
Adjusted power-on time (days) . . . . . : 930
Estimated time to warning (days)Â . . . : 40
Estimated time to error (days)Â . . . . : 126
Concurrently maintainable battery pack. : Yes
Battery pack can be safely replaced . . : No
Unser problematischer Controller ist also der sissas4, der hat „Time to warning=0“ und „Time to Error =85“.
Als nächstes lässt braucht man die Controller Feature Nummern und Locations.
Dazu geht man aus dem „diagmenu“ und in die AIX Console per „oem_setup_env„.
Per „lscfg -vl sissasX“ kann man sich die Controllerinfos anzeigen lassen.
# lscfg -vl sissas0
sissas0Â Â Â Â Â Â Â Â Â U78AA.001.WZSGH0X-P1-T9Â PCI-X266 Planar 3Gb SAS RAID Adapter
ROM Level.(alterable)…….04200037
Customer Card ID Number…..2BE1
Hardware Location Code……U78AA.001.WZSGH0X-P1-T9
# lscfg -vl sissas1
sissas1Â Â Â Â Â Â Â Â Â U78AA.001.WZSGH0X-P1-C19-T1Â PCI-X266 Planar 3Gb SAS RAID Adapter
PCI-X266 Planar 3Gb SAS RAID Adapter           :
Part Number……………..74Y3292
FRU Number………………74Y3344
Serial Number……………YL10P1087017
Manufacture ID…………..000P
EC Level………………..0
ROM Level.(alterable)…….04200037
Customer Card ID Number…..2BD9
Product Specific.(Z1)…….1
Hardware Location Code……U78AA.001.WZSGH0X-P1-C19-T1
# lscfg -vl sissas2
sissas2Â Â Â Â Â Â Â Â Â U5796.001.16824A3-P1-C1-T1Â PCI-X266 Ext Tri-x4 3Gb SAS RAID Adapter
PCI-X266 Ext Tri-x4 3Gb SAS RAID Adapter       :
Part Number……………..74Y7489
FRU Number………………74Y8749
Serial Number……………YL10D1063030
Manufacture ID…………..000D
EC Level………………..0
ROM Level.(alterable)…….04210037
Customer Card ID Number…..572F
Product Specific.(Z1)…….1
Hardware Location Code……U5796.001.16824A3-P1-C1-T1
# lscfg -vl sissas3
sissas3Â Â Â Â Â Â Â Â Â U5796.001.16824A3-P1-C2-T1Â PCI-X266 Auxiliary Cache Adapter
PCI-X266 Auxiliary Cache Adapter               :
Part Number……………..74Y8313
FRU Number………………74Y8749
Serial Number……………YL10D1063030
Manufacture ID…………..000D
EC Level………………..0
ROM Level.(alterable)…….04200037
Customer Card ID Number…..575C
Product Specific.(Z1)…….1
Hardware Location Code……U5796.001.16824A3-P1-C2-T1
# lscfg -vl sissas4
sissas4Â Â Â Â Â Â Â Â Â U5796.001.16824A3-P1-C4-T1Â PCI-X266 Ext Tri-x4 3Gb SAS RAID Adapter
PCI-X266 Ext Tri-x4 3Gb SAS RAID Adapter       :
Part Number……………..44V4579
FRU Number………………74Y7207
Serial Number……………YL10D0269040
Manufacture ID…………..000D
EC Level………………..0
ROM Level.(alterable)…….04210037
Customer Card ID Number…..572F
Product Specific.(Z1)…….1
Hardware Location Code……U5796.001.16824A3-P1-C4-T1
# lscfg -vl sissas5
sissas5Â Â Â Â Â Â Â Â Â U5796.001.16824A3-P1-C5-T1Â PCI-X266 Auxiliary Cache Adapter
PCI-X266 Auxiliary Cache Adapter               :
Part Number……………..44V4577
FRU Number………………74Y7207
Serial Number……………YL10D0269040
Manufacture ID…………..000D
EC Level………………..0
ROM Level.(alterable)…….04200037
Customer Card ID Number…..575C
Product Specific.(Z1)…….1
Hardware Location Code……U5796.001.16824A3-P1-C5-T1
Jetzt haben wir für alle Controller die Locations, Batterielaufzeiten und die Feature Nummer, bzw. die „Customer Card ID Number“.
Mit den Infos kann man jetzt den IBM Hardware Service anrufen und einen Austauschtermin ausmachen.
Wenn eine weitere Batterie wie hier in 40 Tagen ausläuft, dann wird diese meist direkt mitgetauscht, damit man nächsten Monat nicht schon wieder einen Techniker braucht.
Batterie tauschen
Das geht ähnlich einfach wie bei den Platten übers „diagmenu„.
Dann geht man nach „Task Selection (Diagnostics, Advanced Diagnostics, Service Aids, etc.)„, „RAID Array Manager„, „IBM SAS Disk Array Manager“ und dann „Diagnostics and Recovery Options„.
Dann „Controller Rechargeable Battery Maintenance“ und mit „Force Controller Rechargeable Battery Error“ den Cache leeren.
Das dauert ein wenig, danach kann man das Batteriepack tauschen.
Zum Schluss muss man dann per „Start Adapter Cache“ den Cache wieder aktivieren.