Der jüngste Ausfall der AWS erinnert stark an die Risiken, die mit einer zu großen Abhängigkeit von einem einzigen Cloud-Service einhergehen.

Wesentliche Punkte:

  • Amazon Web Services (AWS) erlebte kürzlich einen weitreichenden Ausfall, der sich auf Tausende von Kunden-Websites und -Diensten auswirkte.
  • Wenn Unternehmen IT-Arbeitslasten in die Cloud verlagern, müssen sie als Teil des Übergangs den Grad der erforderlichen IT-Stabilität berücksichtigen.
  • Nicht alle Anwendungen und Dienste erfordern das gleiche Maß an Belastbarkeit.
  • Interdependenz und Überabhängigkeit sind Treiber für die Fragilität der IT. Anti-Fragilität kann für die meisten Situationen ausgelegt werden, selbst bei öffentlichen Cloud-Diensten.

Der jüngste Bericht von Amazon Web Services (AWS), bei denen es zu einem umfangreichen Ausfall gekommen ist, unterstreicht die inhärente Herausforderung öffentlicher Cloud-Dienste. Neben all ihren Vorteilen - und davon gibt es viele - gibt es auch die Risiken und Realitäten des Kontrollverlusts, die berücksichtigt und gemildert werden müssen. Dieser einzelne Ausfall mit Schwerpunkt in Virginia hatte Auswirkungen auf Tausende von Kundenstandorten und -diensten wie Adobe, Roku, Twilio, Autodesk und andere.

Es ist eine Tatsache, dass Cloud-Dienste, wie einige Kritiker sagen würden, nur die Nutzung der Computer anderer Leute sind. Aber obwohl einige IT-Operationen ausgelagert werden können, kann die Verantwortung dafür nicht endgültig ausgelagert werden. Wenn Cloud-Dienste so funktionieren, wie sie konzipiert wurden, gibt es enorme Vorteile, die man umgehen kann. Wenn dies nicht der Fall ist, gerät ihre voneinander abhängige, zerbrechliche Natur schmerzhaft in den Fokus. IT-Architekten von AWS-Kunden (in ähnlicher Weise für andere Cloud-Dienste) entwerfen oft buchstäblich in Single Points of Failure, wenn sie ihre IT-Service-Eier in einen einzigen Rechenkorb legen.

Ironischerweise war das AWS-eigene "Service Health Dashboard" - in dem die AWS die Öffentlichkeit über Serviceprobleme auf dem Laufenden hält - bei diesem Ausfall ausgefallen, weil es von einem zugrunde liegenden Dienst abhängig ist, der ausgefallen ist. Angesichts der Marktpräsenz und der Größe von AWS, die auf 33% des Marktes für öffentliche Cloud-Infrastrukturen geschätzt wird, wurde der Ausfall von einigen, etwas hyperbolisch, als ein Zusammenbruch des Internets beschrieben. Das stimmt zwar nicht ganz - das Web selbst war in Ordnung - aber angesichts der zunehmenden Verlagerung von IT-Arbeitslasten in die Public Cloud, insbesondere in das Triumvirat von AWS, Google und Microsoft Azure, kann dieses inhärente Rätsel der gegenseitigen Abhängigkeit in Bezug auf die Widerstandsfähigkeit nicht ignoriert werden. Beachten Sie, dass nach 451 Untersuchungen, die in Abbildung 1 unten dargestellt sind, 52% der Arbeitslasten - gegenüber 26% im Jahr 2020 - bis 2022 in öffentlichen Cloud-Umgebungen gehostet werden. Dieses "Alles-auf-eine-Karte-Setzen"-Problem wird sich also wahrscheinlich in naher Zukunft noch verschärfen.

AWS-Ausfall.png

Abbildung 1: 451 Forschung - Trends in der IT-Arbeitslastverteilung

Wie können wir die Vorteile der Public Cloud nutzen und gleichzeitig die Risiken für die Widerstandsfähigkeit weiter mindern? Die Nutzung eines einzigen Public-Cloud-Dienstes garantiert keine 100%ige Dienstverfügbarkeit. Aber Ausfallsicherheit kann in fast jedes System eingebaut werden; es ist eher eine Frage des "wie" und "wie viel wird es kosten". Wo soll man anfangen? Zunächst müssen Sie die Belastbarkeitsanforderungen Ihrer Organisation und ihrer Anwendungen ehrlich bewerten. Nicht alle Organisationen und Anwendungen sind gleich geschaffen, und deshalb sollten Sie ihre Belastbarkeitsanforderungen nicht gleich behandeln. Was sind die Anforderungen an die Betriebszeit Ihrer Auftragseingabe-Website im Vergleich zu Ihrem internen Personalverwaltungssystem? Es handelt sich bei beiden Systemen um wichtige Systeme, die jedoch wahrscheinlich nicht die gleiche Bedeutung für Ihr Unternehmen haben, was die Verfügbarkeit betrifft. Kundenbestellungen kommen vielleicht nie wieder zurück, aber Ihre Mitarbeiter wahrscheinlich schon.

Denken Sie an die "9er". Wie viele "9er" brauchen Sie und sind bereit, dafür zu bezahlen? Ein guter Ausgangspunkt ist das Hochverfügbarkeitsdiagramm in Wikipedia, in dem Sie die jährliche Ausfallzeit von einer "9" (90% Verfügbarkeit = 36,53 Tage Ausfallzeit in einem Jahr) bis zu neun "9s" (99,9999999% Verfügbarkeit = 31,56 Millisekunden Ausfallzeit in einem Jahr) sehen können. Mir ist klar, dass die erwarteten "9" eines bestimmten Public-Cloud-Dienstes schwer auszumachen sind (wahrscheinlich irgendwo innerhalb dieser beiden Extreme!), aber dieses Diagramm als Ausgangspunkt zu verwenden, ist eine gute Möglichkeit, Ihre eigenen Anforderungen an die Ausfallsicherheit zu ermitteln und zu überprüfen.

Wenn diese Anforderungen an die Betriebszeit erfüllt sind, haben Ihre IT-Architekten damit den Anfang einer Reihe von Anforderungen, die sie umsetzen können. Vielleicht können sie eine größere Ausfallsicherheit innerhalb des ausgewählten öffentlichen Cloud-Service entwerfen, oder vielleicht muss ein separater Cloud-Service eingerichtet werden, um Ausfallzeiten oder Ausfälle abzudecken. Oder vielleicht sollten einige Dienste gar nicht erst in die Public Cloud verlagert werden. Oder vielleicht ist eine hybride öffentlich/private Cloud-Einrichtung am besten. Die Antwort ist, dass es einfach darauf ankommt. Aber allein die Hoffnung auf eine ausreichende Belastbarkeit der IT ist ein Rezept für böse Überraschungen.

Ein beliebter Dienst im Bereich der Verbesserung der Anwendungsverfügbarkeit ist die E-Mail-Kontinuität. Was würden stundenlange E-Mail-Ausfallzeiten bei einem bestimmten Ausfall für die Produktivität Ihres Unternehmens bedeuten? Wie viele "9er" benötigt Ihre Organisation für ihre E-Mails? Ein Kontinuitätsdienst verleiht Ihrem primären E-Mail-Verwaltungssystem Redundanz und Ausfallsicherheit, unabhängig davon, ob es sich um Microsoft 365, Exchange vor Ort oder etwas anderes handelt. Auf diese Weise kann Ihr Unternehmen im Falle eines geplanten oder ungeplanten Ausfalls von M365 oder von Exchange vor Ort Ihre E-Mails ohne Unterbrechung weiterhin senden, empfangen, archivieren und sichern. Letztendlich kann Ihr Unternehmen nur die Frage beantworten, welcher Grad an IT-Resilience für einen Service oder eine Anwendung erforderlich ist. Aber ein Einheitsansatz ist eindeutig nicht der beste Weg nach vorn.

Sie wollen noch mehr Artikel wie diesen? Abonnieren Sie unseren Blog.

Erhalten Sie alle aktuellen Nachrichten, Tipps und Artikel direkt in Ihren Posteingang

Das könnte Ihnen auch gefallen:

Bösewichte mit guten Algorithmen: 5 Wege, wie Cyberkriminelle KI ausnutzen können

Die schlechte Nachricht ist, dass Cyberkriminelle ein Druckmittel sind...

Die schlechte Nachricht ist, dass Cyberkriminelle KI nutzen, um ... Read More >

Stephanie Overby

von Stephanie Overby

Mitwirkender Verfasser

Veröffentlicht am 25. November 2020

Wahlen verändern die Aussichten für die US-Datenschutzpolitik im Jahr 2021

Nationale Datenschutzpolitik steht auf der Tagesordnung...

Die nationale Datenschutzpolitik steht in Washington auf der Tagesordnung, ein st... Mehr lesen >

Karen Lynch

von Karen Lynch

Mitwirkender Verfasser

Veröffentlicht am 24. November 2020

Mimecast Cloud Archive zum Marktführer im EIA Magic Quadrant 2020 von Gartner ernannt

Im sechsten Jahr in Folge hat Mimecast...

Zum sechsten Mal in Folge hat das Mimecast Cloud Archive die... Mehr lesen >

Garth Landers

von Garth Landers

Produktmarketing-Direktor, Archivierung

Veröffentlicht 19. November 2020