E-mailbeveiliging

    Uitval wijdverspreide Google Workspace serveert een tijdige e-mailcontinuïteitswaarschuwing

    Gemeld authenticatieprobleem leidt tot meerdere uitvaldiensten voor cloudgigant, met wereldwijde productiviteitsverstoring tot gevolg.

    by Richard Botley
    1180387443.jpg

    Zat u maandag in uw pyjama te zweten toen u zich realiseerde dat niet alleen uw Google Nest-thermostaat uit de lucht was, maar dat bijna elke service die Google biedt in feite uit de lucht was? U was niet de enige, want IT-beheerders en gebruikers over de hele wereld werden herinnerd aan het gevaar van een te grote afhankelijkheid van één enkele IT-dienstverlener.

    Tijdens het incident toonde het Google Workspace Status Dashboard dat Gmail, Google Calendar, Docs en een groot aantal andere diensten problemen hadden waardoor gebruikers niet konden worden geauthenticeerd. DownDetector toonde 49.681 piekmeldingen tijdens de uitval. Een woordvoerder van Google zei later dat het authenticatiesysteem ongeveer 45 minuten was uitgevallen vanwege een probleem met interne opslagquota.

    Zelfs bij een relatief korte periode van downtime kan de daaruit voortvloeiende verstoring aanzienlijk zijn - vooral wanneer miljoenen gebruikers over de hele wereld meer dan ooit tevoren op deze instrumenten vertrouwen. De Wall Street Journal berichtte op hoe de Wayne-Westland Community Schools in Westland, Michigan, hun ongeveer 9.800 leerlingen een vrije dag gaven na een ochtend van verstoring. "Dit is de nieuwe sneeuwdag", zei de woordvoerster van de school tegen de verslaggever die zijn verhaal ook per telefoon moest doen terwijl Google plat lag.

    Gelukkig zijn dergelijke grootschalige storingen in de systemen van Google zeldzaam, maar zeker niet onbelangrijk. Google Workspace werd geïntroduceerd in oktober, ter vervanging van het merk G Suite, en werd aangeprezen als "alles wat u nodig hebt om iets gedaan te krijgen, nu op één plek." Google Workspace omvat nu Gmail, Agenda, Drive, Docs, Sheets, Slides, Meet, Chat - allemaal nauwer geïntegreerd dan ooit tevoren.

    Single Point of Failure

    Helaas kan deze nauwe koppeling en dit gedeelde platform ook gepaard gaan met een verhoogd risico op een cascadefalen.

    Authenticatiediensten zouden een bekend potentieel storingspunt moeten zijn voor bedrijfscontinuïteitsprofessionals, en het is niet de eerste keer dat dit soort storingen heeft geleid tot wijdverbreide verstoring. In september werd Microsoft geplaagd door langdurige serviceproblemen die verband hielden met een deel van zijn authenticatiesysteem, Azure Active Directory, waardoor een deel van de gebruikers werd afgesloten van meerdere cloudgebaseerde Microsoft-diensten. Aanvullende uitval van Microsoft in oktober, november en december herhaalde het groeiende productiviteitsprobleem als gevolg van de verborgen complexiteit van cloud-continuïteitsplanning.

    Deze onderbrekingen kunnen een aanzienlijke uitdaging vormen voor de productiviteit van eindgebruikers, de beveiliging en, in sommige gevallen, de compliance. Met e-mail als voorbeeld hebben sommige organisaties zich tot Google gewend als kosteneffectief alternatief voor Microsoft Exchange Online - beschikbaar met Microsoft 365-service. In plaats van hun eigen Exchange-server in een fysieke of virtuele omgeving te onderhouden, vertrouwen ze op hun cloudprovider - in dit geval Google - om hun e-mailservice te beheren.

    Wishful Thinking

    Het probleem is dat in de race naar de cloud steeds meer organisaties, consumenten - en zelfs overheden - afzien van decennia van IT best practice en overgaan tot het bieden van service redundantie. Decennia lang omvatte de gangbare praktijk voor kritieke bedrijfssystemen altijd een plan B. Twee telefoonlijnen, twee onafhankelijke internet service providers, twee data-archieven, een back-up generator; de 'twee parachutes'-gedachte om het voortbestaan van kritieke bedrijfsfuncties te garanderen.

    Maar dit zijn natuurlijk uitdagende tijden. Digitale transformatieprojecten zijn versneld door de COVID-19 pandemie en bijna alle organisaties hebben moeten heroverwegen hoe ze intern en met klanten, partners - of zelfs studenten, zoals in bovenstaand voorbeeld - samenwerken. En dus, anekdotisch, hebben IT-teams onder aanzienlijke tijds- en financiële druk gestaan om nieuwe tools up-and-running te krijgen, vaak met beperkte aandacht - op zijn minst vooraf - voor traditioneel disaster recovery en zelfs security denken.

    Veerkracht Doelstellingen

    Leveranciers van clouddiensten bouwen wel enkele van hun eigen interne redundanties in - maar concentreren deze inspanningen vaak op gegevensintegriteit met een Recovery Point Objective (RPO) van nul (d.w.z. geen gegevensverlies in het geval van enige downtime). Maar er zijn grote lacunes als het gaat om het beschikbaar houden van een dienst waarvoor nog geen enkele aanbieder een oplossing heeft. Hoewel homogeniteit van diensten grote economische voordelen biedt, brengt dit het risico met zich mee van wijdverspreide downtime als systemen of gedeelde diensten degraderen of uitvallen.

    Dit is waar de andere kritische maatstaf, de Recovery Time Objective (RTO), in het spel komt. Elke organisatie moet dit berekenen voor elke clouddienst die zij gebruiken. De RTO is de tijd en het serviceniveau waarbinnen een bedrijfsproces moet worden hersteld na een ramp om onaanvaardbare effecten van een onderbreking in de beschikbaarheid te voorkomen.

    Google zelf biedt een indrukwekkende verhandeling over de architectuur van disaster recovery, maar toch zijn ze niet in staat om uw organisatie een altijd beschikbare dienst te leveren. En het is precies hetzelfde voor Microsoft, AWS - zelfs Mimecast. De laatste biedt een e-mailcontinuïteitsdienst die is ontworpen om te worden ingezet wanneer uw primaire e-maildienst uitvalt. Je kunt niet je eigen YouTube bouwen, maar je kunt er wel voor zorgen dat er een reservekopie van je trainingsvideo's wordt gehost. Op dezelfde manier kunt u de redundantie voor uw kritieke bedrijfsfuncties, zoals de mogelijkheid om virtueel te vergaderen, te bellen en e-mails te versturen, in eigen beheer houden.

    Alleen uw organisatie kan bepalen wat het vereiste niveau van veerkracht is voor elke bedrijfsdienst of IT-applicatie waarvan u afhankelijk bent. Maar elke IT- en risicomanagementprofessional heeft een rol te spelen in het evalueren van deze risico's en het maken van passende plannen vooraf voordat het volgende grote downtime-incident zich voordoet.

    Geen enkele organisatie is immuun voor mislukkingen en daarom gebruiken wij twee parachutes - en waar nodig, twee wolken.

    Abonneer u op Cyber Resilience Insights voor meer artikelen zoals deze

    Ontvang al het laatste nieuws en analyses over de cyberbeveiligingsindustrie rechtstreeks in uw inbox

    Succesvol aanmelden

    Dank u voor uw inschrijving om updates van onze blog te ontvangen

    We houden contact!

    Terug naar boven