Inhaltsverzeichnis:
Der sprichwörtliche "Softwarefehler" hat eine Spirale von schlechten Konfigurationen an andere Systeme gesendet
Nach einem der längeren dienstübergreifenden Ausfälle für Google in jüngster Zeit hat der Such- und Softwareriese eine Entschuldigung und Erklärung für das heutige Geschehen herausgegeben. Laut dem offiziellen Google-Blog ist ein internes System, das Konfigurationsinformationen für darüber hinausgehende Systeme sendet, auf einen Softwarefehler gestoßen, der falsche Befehle an mehrere Bereiche gesendet hat.
Es dauerte erst ab 10:55 Uhr, als der Fehler zum ersten Mal bis 11:02 Uhr auftrat, als Nutzer massive Ausfälle in Google Mail, Google+, Drive und anderen Diensten bemerkten. Ungefähr 12 Minuten später, als die Ingenieure noch dabei waren, herauszufinden, was passierte, hatte sich das ursprüngliche System, das die schlechten Informationen sendete, selbst korrigiert und andere Systeme ordnungsgemäß konfiguriert. Google behauptet, dass fast alle Dienste der Nutzer um 11.30 Uhr wieder verfügbar waren, was im Einklang mit dem allgemeinen Konsens der Nutzer zu stehen scheint.
Wie zu erwarten, enthält der Beitrag einige Details zu den Maßnahmen, mit denen dies in Zukunft verhindert werden soll. Es werden weitere Überprüfungen durchgeführt, damit falsche Konfigurationen, wenn sie durch Fehler generiert werden, nicht so einfach an andere Systeme gesendet werden können. Darüber hinaus plant Google, die gezielte Suche nach Problemen bei Dienstausfällen zu verbessern.
Natürlich glauben wir nicht, dass wir solche Ausfälle häufiger erleben werden, als wir es jetzt schon erleben.
Quelle: Google Blog