Mittwoch, 17. Dezember 2008

OPAL am 17.12. kurzzeitig down

OPAL war heute (Mittwoch, 17.12.) Morgen leider für ca. 1,5h nicht von außen erreichbar. Wir wurden um 7 Uhr vom automatischen Monitoring benachrichtigt, haben sofort mit der Ursachenforschung begonnen und konnten es schnell auf Probleme im Netzwerk eingrenzen.

Unsere Aufgabe bestand folglich darin, schnell und direkt die verantwortlichen Mitarbeiter des URZ der TU Chemnitz zu kontaktieren, in welchem die OPAL-Server ja gehostet werden. Die Kollegen waren bereits selbst aufmerksam geworden und konnten schnell reagieren. Kurz vor halb neun waren die OPAL-Server dann wieder erreichbar und wir haben das System kontrolliert neu gestartet. Ab 9.30 Uhr funktionierten auch die Portalseiten des BPS wieder.

Wie wir soeben noch erfahren haben, wurden Wartungsarbeiten am Netzwerk-Backbone durchgeführt, und das dafür vorgesehene Fallback-System funktionierte nicht fehlerfrei. Die Ursachenforschung dazu läuft noch, in Zukunft wird das Problem aber wohl nicht erneut auftreten.