CrowdStrike: Neue Details zu massivem IT-Ausfall veröffentlicht
Am 19. Juli 2024 verursachte ein fehlerhaftes Sensor-Update im Falcon-Sicherheitssystem eine Störung, die erhebliche Auswirkungen auf kritische Infrastrukturen weltweit hatte, einschließlich Airlines, Krankenhäuser, Tankstellen und Finanzinstitute. Dieses Update enthielt eine Konfigurationsänderung, welche einen logischen Fehler auslöste und zum berüchtigten „Blue Screen of Death“ (BSOD) auf den betroffenen Windows-Geräten führte. Ein logischer Fehler im Softwarekontext bezeichnet einen Programmierfehler, der zu abnormen Verhaltensweisen oder Systemabstürzen führt.
Millionen Systeme waren betroffenLaut CrowdStrike waren ungefähr 8,5 Millionen Windows-Geräte betroffen, was weniger als ein Prozent aller weltweit genutzten Windows-Systeme ausmacht. Trotz dieses geringen Anteils verursachte der Ausfall erhebliche wirtschaftliche und gesellschaftliche Auswirkungen, da viele Unternehmen und Organisationen, welche auf die Sicherheitsdienste von CrowdStrike angewiesen sind, schwer betroffen waren. Mac- und Linux-Systeme blieben von diesem Vorfall unberührt. CrowdStrike entschuldigte sich öffentlich für den Vorfall und versprach eine gründliche Ursachenanalyse, um ähnliche Fehler in Zukunft zu verhindern.
Technische Details des FehlersDas fehlerhafte Update betraf Falcon-Sensor-Versionen 7.11 und höher, die zwischen 04:09 UTC und 05:27 UTC online waren. Der Fehler wurde durch eine Konfigurationsdatei verursacht, welche als „Channel File 291“ bezeichnet wird und in einem bestimmten Verzeichnis im Windows-System gespeichert ist. Diese Datei sollte neue, bösartige "Named Pipes" identifizieren und blockieren, führte jedoch aufgrund eines logischen Fehlers zu Systemabstürzen. Das Problem wurde relativ schnell identifiziert und behoben.
Microsoft im KrisenmodusIn einem Blogbeitrag äußerte sich David Weston, Vice President, Enterprise and OS Security, zu dem Vorfall. Demnach hielt Microsoft kontinuierlich Kontakt zu seinen Kunden, um sie über den aktuellen Stand der Wiederherstellungsmaßnahmen zu informieren. Über das Azure Status Dashboard wurden regelmäßige Updates bereitgestellt, um Transparenz über den Fortschritt der Fehlerbehebung zu gewährleisten. Microsoft koordinierte sich mit Google Cloud Platform (GCP) und Amazon Web Services (AWS), um den Zustand der betroffenen Systeme zu überwachen und gemeinsam Lösungen zu entwickeln. Weston betonte, dass solche Ereignisse zwar selten sind, aber erhebliche Lernchancen bieten. Der Konzern plant, die gewonnenen Erkenntnisse zu nutzen, um die Resilienz und Sicherheit seiner Systeme weiter zu verbessern.