Cloudflare und Google mit weltweiten Cloudausfällen

Lesezeit
1 Minute
Bis jetzt gelesen

Cloudflare und Google mit weltweiten Cloudausfällen

13.06.2025 - 08:32
Veröffentlicht in:

Schwerwiegende Ausfälle bei Cloudflare und Google haben am 12. Juni zahlreiche Dienste über mehrere Stunden außer Betrieb gesetzt. Betroffen waren bei Cloudflare unter anderem Access, WARP, Gateway, Workers AI, das Cloudflare-Dashboard sowie Zero-Trust- und Sicherheitsfunktionen. Bei Google wiederum gab es unter anderem Probleme mit Cloud Storage, Cloud DNS und Workspace-Produkten wie Gmail und Kalender.

Ein Ausfall in der zugrundeliegenden Speicherinfrastruktur des Cloudflare-Schlüsselprodukts Workers KV – und damit in einem zentralen Baustein des Cloudflare-Ökosystems – hat gestern Abend zahlreiche Cloudflare-Dienste für rund zweieinhalb Stunden lahmgelegt. Cloudflare-Services sind stark auf Workers KV angewiesen, eine verteilte Key-Value-Datenbank, die unter anderem für Authentifizierung, Konfigurationsdaten und die Verteilung von Inhalten genutzt wird.

Drittanbieter-Ausfall als Ursache

Diese Architektur wurde der Plattform nun zum Verhängnis: Ein Drittanbieter, auf den sich das Backend von Workers KV stützt, meldete einen Ausfall – mit weitreichenden Folgen. So kam es weltweit zu Störungen bei der Anmeldung, beim Laden von Webseiten, beim Zugriff auf Zero-Trust-Dienste und bei KI-Anwendungen. Besonders schwer betroffen waren Access-Logins, Browser Isolation, das Videostreaming-Angebot "Stream" und der WARP-Client.

Cloudflare betont, dass es sich nicht um einen Sicherheitsvorfall gehandelt habe und keine Daten verloren gingen. Dennoch sei man sich der Verantwortung für die Abhängigkeiten im eigenen Technologie-Stack bewusst. Der Vorfall zeige laut Unternehmensangaben, dass selbst verteilte Systeme anfällig für zentrale Engpässe sein können – gerade dann, wenn einzelne Komponenten wie Workers KV zum Flaschenhals werden.

Weniger Abhängigkeiten und mehr Ausfallsicherheit

Im Verlauf des fast zweieinhalbstündigen Vorfalls arbeiteten mehrere Engineering-Teams parallel an Notfalllösungen. Zwischenzeitlich wurde überlegt, Access und Gateway auf alternative Speichersysteme umzuleiten. Erst gegen 22:28 Uhr MESZ konnten alle Dienste wieder in den Normalbetrieb übergehen. Cloudflare kündigte unmittelbar danach an, laufende Infrastrukturprojekte zur Resilienzsteigerung zu beschleunigen. Unter anderem soll die Abhängigkeit von Drittanbietern reduziert und die Ausfallsicherheit einzelner Dienste verbessert werden.

Langfristig plant das Unternehmen eine vollständige Migration von Workers KV auf eine eigene Speicherlösung wie Cloudflare R2. Ziel ist es, einzelne Fehlerquellen gezielt zu entkoppeln und kritische Dienste wie Access oder WARP robuster zu gestalten. Trotz Entschuldigung und Transparenz bleiben Fragen offen, wie sich ein so zentraler Ausfall in einem der größten Cloud- und Sicherheitsanbieter der Welt künftig vermeiden lässt – gerade in Zeiten wachsender Abhängigkeit von Zero-Trust-Architekturen.

Google Cloud ebenfalls von Ausfällen betroffen

Fast zeitgleich kämpfte auch Google Cloud mit massiven technischen Problemen: Ein globaler Ausfall im Identity and Access Management (IAM) führte zu weitreichenden Störungen zahlreicher Dienste – darunter Cloud Storage, Bigtable, Vertex AI Search, Cloud Memorystore, Cloud Console und weitere Produkte aus dem Google-Cloud- und Workspace-Portfolio.

Die Ursache war laut Google ein fehlerhaft verteiltes automatisiertes Quoten-Update, das API-Anfragen weltweit blockierte. Während die meisten Regionen nach etwa zwei Stunden wiederhergestellt waren, dauerte die vollständige Entstörung in der Region "us-central1" rund drei Stunden. Auch hier kündigte Google umfassende technische Nachbesserungen an, um derartige Fehler künftig zu verhindern.