Cache Batterien tauschen bei einem IBM i VIOS/AIX System

Heute haben wir eine Meldung von der HMC bekommen, dass eine der Cache Batterien in unserem VIOS System bald leer ist.

Reporting system: VSPWR01

Machine type-model/serial: 8202-E4B/10BF39P Problem number: 42

Error: 2519-8009

Description: Impending Cache Battery Pack failure.

Last occurred: 10/10/13 4:20 PM

Current status:

PMR number: n/a

Details:

Das heisst, dass wir also eins oder gleich mehrere der Batteriepacks in den nächsten 90 Tagen tauschen müssen.
Das geht meist im laufenden Betrieb und dauert nur 10min.

Informationen einholen

Jetzt muss man natürlich erstmal gucken, welche Batterie das ist.

Das geht wie bei defekten Platten auch über das „diagmenu“.

Dazu meldet man sich auf der HMC als „padmin“ an und ruft das Programm „diagmenu“ auf.

Dann geht man nach „Task Selection (Diagnostics, Advanced Diagnostics, Service Aids, etc.)„, „RAID Array Manager„, „IBM SAS Disk Array Manager“ und dann „Diagnostics and Recovery Options„.

Hier gibts den Punkt „Controller Rechargeable Battery Maintenance“ und darunter „Display Controller Rechargeable Battery Information„.

 

Hier lässt man sich dann für alle sissasX Controller die aktuellen Batterielaufzeiten anzeigen.

RAID Adapter  . . . . . . . . . . . . . : sissas0
Battery Type  . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)  . . . . . . . . . : 827
Adjusted power-on time (days) . . . . . : 827
Estimated time to warning (days)  . . . : 146
Estimated time to error (days)  . . . . : 237
Concurrently maintainable battery pack. : No
Battery pack can be safely replaced . . : No

RAID Adapter  . . . . . . . . . . . . . : sissas1
Battery Type  . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)  . . . . . . . . . : 827
Adjusted power-on time (days) . . . . . : 827
Estimated time to warning (days)  . . . : 146
Estimated time to error (days)  . . . . : 237
Concurrently maintainable battery pack. : No
Battery pack can be safely replaced . . : No

RAID Adapter  . . . . . . . . . . . . . : sissas2
Battery Type  . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)  . . . . . . . . . : 825
Adjusted power-on time (days) . . . . . : 825
Estimated time to warning (days)  . . . : 147
Estimated time to error (days)  . . . . : 238
Concurrently maintainable battery pack. : Yes
Battery pack can be safely replaced . . : No

RAID Adapter  . . . . . . . . . . . . . : sissas3
Battery Type  . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)  . . . . . . . . . : 825
Adjusted power-on time (days) . . . . . : 872
Estimated time to warning (days)  . . . : 94
Estimated time to error (days)  . . . . : 180
Concurrently maintainable battery pack. : Yes
Battery pack can be safely replaced . . : No

RAID Adapter  . . . . . . . . . . . . . : sissas4
Battery Type  . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : Warning condition
Power-on time (days)  . . . . . . . . . : 923
Adjusted power-on time (days) . . . . . : 973
Estimated time to warning (days)  . . . : 0
Estimated time to error (days)  . . . . : 85
Concurrently maintainable battery pack. : Yes
Battery pack can be safely replaced . . : No

RAID Adapter  . . . . . . . . . . . . . : sissas5
Battery Type  . . . . . . . . . . . . . : Lithium Ion (LiIon)
Battery State . . . . . . . . . . . . . : No battery warning/error
Power-on time (days)  . . . . . . . . . : 879
Adjusted power-on time (days) . . . . . : 930
Estimated time to warning (days)  . . . : 40
Estimated time to error (days)  . . . . : 126
Concurrently maintainable battery pack. : Yes
Battery pack can be safely replaced . . : No

Unser problematischer Controller ist also der sissas4, der hat „Time to warning=0“ und „Time to Error =85“.

 

Als nächstes lässt braucht man die Controller Feature Nummern und Locations.

Dazu geht man aus dem „diagmenu“ und in die AIX Console per „oem_setup_env„.

 

Per „lscfg -vl sissasX“ kann man sich die Controllerinfos anzeigen lassen.

# lscfg -vl sissas0

sissas0          U78AA.001.WZSGH0X-P1-T9  PCI-X266 Planar 3Gb SAS RAID Adapter

ROM Level.(alterable)…….04200037

Customer Card ID Number…..2BE1

Hardware Location Code……U78AA.001.WZSGH0X-P1-T9

# lscfg -vl sissas1

sissas1          U78AA.001.WZSGH0X-P1-C19-T1  PCI-X266 Planar 3Gb SAS RAID Adapter

PCI-X266 Planar 3Gb SAS RAID Adapter            :

Part Number……………..74Y3292

FRU Number………………74Y3344

Serial Number……………YL10P1087017

Manufacture ID…………..000P

EC Level………………..0

ROM Level.(alterable)…….04200037

Customer Card ID Number…..2BD9

Product Specific.(Z1)…….1

Hardware Location Code……U78AA.001.WZSGH0X-P1-C19-T1

# lscfg -vl sissas2

sissas2          U5796.001.16824A3-P1-C1-T1  PCI-X266 Ext Tri-x4 3Gb SAS RAID Adapter

PCI-X266 Ext Tri-x4 3Gb SAS RAID Adapter        :

Part Number……………..74Y7489

FRU Number………………74Y8749

Serial Number……………YL10D1063030

Manufacture ID…………..000D

EC Level………………..0

ROM Level.(alterable)…….04210037

Customer Card ID Number…..572F

Product Specific.(Z1)…….1

Hardware Location Code……U5796.001.16824A3-P1-C1-T1

# lscfg -vl sissas3

sissas3          U5796.001.16824A3-P1-C2-T1  PCI-X266 Auxiliary Cache Adapter

PCI-X266 Auxiliary Cache Adapter                :

Part Number……………..74Y8313

FRU Number………………74Y8749

Serial Number……………YL10D1063030

Manufacture ID…………..000D

EC Level………………..0

ROM Level.(alterable)…….04200037

Customer Card ID Number…..575C

Product Specific.(Z1)…….1

Hardware Location Code……U5796.001.16824A3-P1-C2-T1

# lscfg -vl sissas4

sissas4          U5796.001.16824A3-P1-C4-T1  PCI-X266 Ext Tri-x4 3Gb SAS RAID Adapter

PCI-X266 Ext Tri-x4 3Gb SAS RAID Adapter        :

Part Number……………..44V4579

FRU Number………………74Y7207

Serial Number……………YL10D0269040

Manufacture ID…………..000D

EC Level………………..0

ROM Level.(alterable)…….04210037

Customer Card ID Number…..572F

Product Specific.(Z1)…….1

Hardware Location Code……U5796.001.16824A3-P1-C4-T1

# lscfg -vl sissas5

sissas5          U5796.001.16824A3-P1-C5-T1  PCI-X266 Auxiliary Cache Adapter

PCI-X266 Auxiliary Cache Adapter                :

Part Number……………..44V4577

FRU Number………………74Y7207

Serial Number……………YL10D0269040

Manufacture ID…………..000D

EC Level………………..0

ROM Level.(alterable)…….04200037

Customer Card ID Number…..575C

Product Specific.(Z1)…….1

Hardware Location Code……U5796.001.16824A3-P1-C5-T1

 

Jetzt haben wir für alle Controller die Locations, Batterielaufzeiten und die Feature Nummer, bzw. die „Customer Card ID Number“.

Mit den Infos kann man jetzt den IBM Hardware Service anrufen und einen Austauschtermin ausmachen.

Wenn eine weitere Batterie wie hier in 40 Tagen ausläuft, dann wird diese meist direkt mitgetauscht, damit man nächsten Monat nicht schon wieder einen Techniker braucht.

 

Batterie tauschen

Das geht ähnlich einfach wie bei den Platten  übers „diagmenu„.

Dann geht man nach „Task Selection (Diagnostics, Advanced Diagnostics, Service Aids, etc.)„, „RAID Array Manager„, „IBM SAS Disk Array Manager“ und dann „Diagnostics and Recovery Options„.

Dann „Controller Rechargeable Battery Maintenance“ und mit „Force Controller Rechargeable Battery Error“ den Cache leeren.

Das dauert ein wenig, danach kann man das Batteriepack tauschen.

Zum Schluss muss man dann per „Start Adapter Cache“ den Cache wieder aktivieren.