Under Construction

Vom Problem über einen Ifix zum offiziellen Fix

Um ein besseres Verständnis zu den Begriffen APAR, Interim Fix (Ifix) und Program Temporary Fix (PTF) zu bekommen, ist es hilfreich den Weg von einem aufgetretenen Problem bis zur offiziellen Lösung zu verfolgen.

Nachfolgend ist dies für einen konkreten Fall beschrieben, bei dem wir persönlich beteiligt waren. Bei dem Problem geht es um das Auftreten einer Filesystem-Korruption bei einem JFS2 Dateisystem im Zusammenhang mit einem vollen Dateisystem. Der Fehler tritt nur unter sehr speziellen Umständen auf und ist seit einigen Jahren behoben.

Wir starten mit einer kurzen Beschreibung wie es zu dem Problem kam:

Zur Vorbereitung eines SAP-Kernelupdates wurde der SAP-Kernel in ein Verzeichnis kopiert. Dann wurden teilweise Dateien ersetzt und neue Dateien hinzugefügt. Dabei kam es zu einem vollen Dateisystem. Das Dateisystem wurde unmittelbar um 2 GB erweitert. Danach wurde eine Korruption des Dateisystems gemeldet und das Dateisystem war nur noch Read-Only gemountet. Im Error-Report waren dazu die folgenden Einträge zu finden:

Jun 9 15:41:40 SYSJ2 I J2_FS_FULL Filesystem /dev/lvXXXXXXXX, /sapmnt/XXX Device 00730004
Jun 9 15:44:31 SYSJ2 I J2_FSCK_REQUIRED Device 00730004 ECORRUPT

Hinweis: Der Name des LV und des Dateisystems wurde geändert.

Es wurde ein Case bei IBM zu dem Problem eröffnet, mit einer entsprechenden Fehlerbeschreibung. Vom IBM Support wurde dann ein Snap angefordert. Der Snap wurde vom AIX Kernel Development Team analysiert, und es konnte ein möglicher Fehler identifiziert werden: bei hoher Dateisystemaktivität kann in seltenen Fällen bei einer Dateisystem-Erweiterung ein Fehler auftreten, der zu einer Dateisystem-Korruption führt. IBM hat dazu weitere Untersuchungen gestartet und ist zu dem Schluß gekommen, dass eine Änderung des Codes nötig ist. Es wurden dafür die folgenden Authorized Program Analysis Reports (APAR) angelegt:

IJ35563: JFS2 FILE SYSTEM CAN GET MARKED CORRUPT AFTER EXTENDING FS. APPLIES TO AIX 7100-05

IJ36237: JFS2 FILE SYSTEM CAN GET MARKED CORRUPT AFTER EXTENDING FS. APPLIES TO AIX 7200-05

IJ37202: JFS2 FILE SYSTEM CAN GET MARKED CORRUPT AFTER EXTENDING FS. APPLIES TO AIX 7300-00

IJ37205: JFS2 FILE SYSTEM CAN GET MARKED CORRUPT AFTER EXTENDING FS. APPLIES TO AIX 7300-01

IJ38487: JFS2 FILE SYSTEM CAN GET MARKED CORRUPT AFTER EXTENDING FS. APPLIES TO AIX 7200-04

Das betroffene Fileset ist bos.mp64.

Da der Zeitraum bis zum Erscheinen des nächsten Service Packs einige Monate dauern kann, wird typischerweise ein sogenannter Interim Fix oder kurz Ifix von IBM erzeugt. Da in dem betroffenen Umfeld zu diesem Zeitpunkt hauptsächlich AIX 7200-05-02 im Einsatz war, wurde ein Ifix für diese Version zum Download bereitgestellt:

IJ36237s2a.72TL05SP02.211122.epkg.Z

Das Problem wurde dann in 7200-05-05 behoben:

# installp -Ad SP720505 bos.mp64 | grep -p IJ36237

  ----------------------------------------------------------------------------
        Fix information for bos.mp64 7.2.5.201
  ----------------------------------------------------------------------------

fix:
        name = IJ36237
        abstract = JFS2 FILE SYSTEM CAN  GET MARKED CORRUPT AFTER EXTENDING FS.
        type = f
        filesets = "bos.adt.include:7.2.5.200\n\
bos.mp64:7.2.5.200\n\
bos.sysmgt.trace:7.2.5.200\n\
"
        symptom = " An FS could be incorrectly marked corrupt soon after it was\n\
extended. J2_DMAP_CORRUPT and J2_FSCK_REQUIRED entries would\n\
be found in the errpt. They could be immediately preceeded by\n\
a J2_FS_FULL log.\n\
"

#

To be continued …