Che tu lo sappia o no, sei probabilmente un utente abituale di Amazon Web Services, il cloud estremamente popolare ( e redditizio ) del gigante della vendita al dettaglio . App come Netflix, Zoom, Slack e persino Postmates si affidano ad AWS in un modo o nell’altro per fornire l’infrastruttura del server che alimenta i loro servizi.
Ora, la pandemia di coronavirus in corso sta sottoponendo AWS allo stress test finale.
Mentre l’America corporativa rimanda i dipendenti a casa per lavorare in remoto, stanno usando Zoom, Slack, Cisco WebEx e altri software cloud ospitati da AWS a livelli senza precedenti per svolgere il proprio lavoro.
La buona notizia è che AWS, come il primo grande cloud sul mercato, ha molta esperienza nella gestione di enormi picchi di domanda su vasta scala – Amazon stessa è ospitata da AWS e aiuta l’operazione di vendita al dettaglio a rimanere veloce ed efficace il Black Friday e il seguente Cyber Monday.
Ecco come AWS mantiene attivo il cloud, anche durante le emergenze.
Come funziona l’infrastruttura globale di AWS
I principali cloud come Amazon Web Services, Microsoft Azure e Google Cloud Platform hanno un vantaggio strutturale che aiuta molto quando si tratta di affidabilità.
Ogni piattaforma è ospitata dai data center iper-efficienti propri del rispettivo Titan tecnico, consentendo ai clienti di accedere a potenza di elaborazione, archiviazione e altri servizi per pochi centesimi o dollari all’ora. Se i clienti hanno bisogno di più (o meno) di qualcosa, i cloud come AWS semplificano l’aggiunta di persino centinaia di migliaia di server alla propria infrastruttura.
AWS in particolare ha 22 regioni – il suo nome per le aree geografiche in cui operano i suoi data center – in tutto il mondo. Una di queste regioni è dedicata a lavorare con il governo federale, mentre le altre sono in gran parte destinate ai clienti locali in ogni area o paese.
Ognuna di queste regioni è ulteriormente suddivisa in ciò che chiama zone di disponibilità: insiemi di uno o più data center collegati tra loro tramite reti veloci e appositamente progettate. I clienti possono pagare AWS per avere il loro software ospitato in più delle 69 zone di disponibilità totale, all’interno della stessa regione o tra più aree.
In termini più chiari: più zone di disponibilità vengono utilizzate da un cliente, meno è probabile che la sua app o il suo servizio vadano in crash. Se un data center fosse colpito da un incendio o un terremoto che lo arrestasse, sarebbe comunque disponibile da un’altra zona di disponibilità e continuerebbe a trasportare byte.
“Avere tutta quella larghezza di banda aggiuntiva tra le regioni consente di spostare la domanda in un’altra regione o zona senza uccidere totalmente l’esperienza dell’utente o uccidere totalmente le prestazioni”, ha detto Bartoletti. “È anche l’investimento che hanno fatto in quelle reti per raddoppiare o triplicare la loro capacità di carico della rete.”
Amazon stesso sfrutta il modello della zona di disponibilità. Il prodotto di database Amazon Aurora, una delle sue principali sfide per Oracle, è attualmente ospitato in zone di disponibilità che si estendono in tutto il mondo. In questo modo, se si verifica un’interruzione in una regione, una secondaria può intensificare l’attività.
“La sua piattaforma è già distribuita a livello globale in tutto il mondo”, ha affermato Bartoletti. “È progettato per scalare. È suddiviso in zone di disponibilità e regioni che aiutano a ridurre i guasti. Se fallisce, dovrebbe essere localizzato il più possibile. Hanno l’esperienza di molti anni nel mercato della gestione di carichi di lavoro appuntiti.”
C’è anche molto altro da scoprire, con altre 16 zone di disponibilità e altre cinque regioni AWS pianificate in Indonesia, Italia, Giappone, Sudafrica e Spagna.
Cosa succede durante una pandemia?
AWS dispone già di sistemi per mantenere i data center funzionanti e sicuri, anche in caso di emergenza. AWS afferma che la sua infrastruttura è monitorata 24 ore su 24, 7 giorni su 7 per garantire che i dati archiviati siano sicuri e che i dati che fluiscono attraverso la sua rete globale siano automaticamente crittografati.
Questi siti di data center sono altamente protetti da recinzioni, guardie di sicurezza, tecnologia di rilevamento delle intrusioni e altre misure. E all’interno di questi siti, ci sono molte apparecchiature di alimentazione di backup nel caso in cui le cose vadano male.
Più rilevante per la situazione attuale, AWS ha aggiornato il suo sito Web per dire che ha politiche e procedure di risposta alla pandemia per rispondere a possibili minacce derivanti da un’epidemia, come COVID-19.
Alcune di queste strategie includono la modifica del suo modello di personale, se necessario, un piano di gestione delle crisi per garantire che le operazioni aziendali siano ancora in corso in caso di emergenza e il trasferimento di operazioni critiche in altre regioni, se necessario. Questi piani parlano anche di agenzie e regolamenti sanitari internazionali.
In tutto il mondo, più governi stanno istituendo i propri blocchi, restrizioni e mandati relativi al coronavirus. Ma anche se ci fosse un blocco in una posizione del data center AWS, il sito molto probabilmente rimarrebbe aperto – almeno tra i suoi data center americani.
Questo perché il Dipartimento per la sicurezza interna ha identificato 16 settori di infrastrutture critiche, che sono serviti da linea guida per gli stati degli Stati Uniti che istituiscono ordini di accoglienza sul posto. I data center di Amazon sarebbero considerati critici, in quanto rientrano nel settore della tecnologia dell’informazione . In altre parole, DHS riconosce il ruolo fondamentale che AWS svolge nell’economia di Internet.
In che altro modo AWS si prepara per un’emergenza?
Anche prima della pandemia, AWS afferma che esegue regolarmente test diagnostici su macchine, reti e apparecchiature di backup per assicurarsi che funzionino correttamente e continueranno a farlo in caso di emergenza. Nel frattempo, le persone e i sistemi automatici monitorano sia la temperatura che l’umidità dei siti per prevenire il surriscaldamento e possibili interruzioni del servizio.
“Ci sono picchi che si verificano durante tutto l’anno”, ha detto Bartoletti. “Inoltre, vengono sottoposti a stress test in tempo reale perché AWS ospita migliaia delle applicazioni più ampiamente distribuite, come Netflix. Si tratta di stress test in tempo reale.”
AWS afferma inoltre di disporre di una guida denominata AWS Business Continuity Plan , che delinea i passaggi dettagliati su cosa fare prima, durante e dopo possibili interruzioni e calamità naturali al fine di evitare o ridurre i tempi di inattività.
AWS testa questo piano con esercitazioni che simulano diversi scenari e quindi lavora su come migliorare la sua risposta. Ad esempio, i suoi team di risposta alle crisi possono eseguire esercitazioni su ciò che accadrebbe se un’intera struttura crollasse.
“Poiché dispongono di una rete globale di regioni, possono eseguire vari test con diverse zone di impatto”, ha affermato Bartoletti. “Possiamo vedere la perdita di un data center all’interno di una regione o la perdita di un’intera regione”.
Al di fuori del coronavirus, uno dei maggiori rischi sarebbe un disastro naturale che colpisce durante la pandemia, come un terremoto o un incendio. AWS ha in atto sistemi per prepararsi a minacce ambientali come disastri naturali e incendi, come sensori in grado di rilevare acqua o incendi, pompe automatiche per rimuovere l’acqua e sistemi per avvisare i dipendenti dei problemi. Tuttavia, sarebbe ancora molto per AWS destreggiarsi tra le due crisi contemporaneamente.
Per assicurarsi che sia in grado di gestire adeguatamente questi rischi, AWS crea sistemi automatizzati e assume terze parti per confermare che sono sicure e conformi.