33 ore senza Microsoft 365: diario di un'apocalisse annunciata
Lunedì mattina, Outlook non si apre. Teams non carica. SharePoint è giù. Per 33 ore, migliaia di aziende non possono lavorare. Il problema non è Microsoft. È la monocultura tecnologica.
Lunedì mattina, Outlook non si apre. Teams non carica. SharePoint è giù. Per 33 ore, migliaia di aziende non possono lavorare. Il problema non è Microsoft. Il problema è aver messo tutto in un unico cesto e aver buttato via il cesto di riserva.
Lunedì mattina, ore 8:14
Marco arriva in studio. Caffè alla macchinetta, come ogni lunedì. Accende il computer, apre Outlook.
Niente.
La rotellina gira. E gira. E continua a girare. Nessun messaggio. Nessuna connessione al server. Riavvia. Stessa cosa. Apre Teams per chiedere ai colleghi: Teams non carica. Prova SharePoint per recuperare un fascicolo urgente: pagina bianca.
Prende il telefono. WhatsApp (che invece funziona benissimo). Scrive al "ragazzo dell'IT": "Tutto bloccato, che succede?"
Risposta: "È Microsoft. È giù. Non possiamo fare niente."
Non possiamo fare niente. Sei parole che valgono un intero business case.
Le 33 ore
L'outage di Microsoft 365 di novembre 2024 non è stato un piccolo intoppo. È stato un blackout di circa 33 ore che ha colpito Exchange Online, Teams, SharePoint e OneDrive. Non un servizio: tutti. Contemporaneamente.
Per chi dipendeva interamente da Microsoft, e in Italia sono la maggioranza delle PMI, significava: niente posta, niente chat interna, niente documenti condivisi, niente calendario. In pratica: niente lavoro.
Ho ricevuto diverse telefonate quel lunedì. Non da clienti miei (i miei clienti hanno tutti la posta su server propri). Da conoscenti. Tutti con la stessa domanda. "Possiamo fare qualcosa?"
No. Non potevano fare niente. Non per un limite tecnico momentaneo. Per una scelta architetturale fatta anni prima: mettere tutto (posta, file, comunicazione, calendario) nelle mani di un singolo fornitore, su un'infrastruttura che non controlli, in un data center che non sai dove sia.
La monocultura tecnologica
In agricoltura si chiama monocultura: coltivare un'unica specie su una vasta estensione. È efficiente. Costa meno. Rende di più. Fino a quando arriva un parassita, e distrugge tutto, perché non c'è diversità a fare da barriera.
L'equivalente digitale è identico. Quando usi Microsoft per la posta, i documenti, la comunicazione, il calendario, i backup, l'autenticazione hai creato una monocultura. Un singolo punto di fallimento. Se quel punto cade, cade tutto.
Non è un rischio teorico. È successo. Per trentatré ore.
E non era neanche la prima volta. A luglio 2024, CrowdStrike, un software di sicurezza usato su milioni di computer Windows ha causato il crash di 8,5 milioni di sistemi. Aeroporti, ospedali, banche. Danni stimati per le sole aziende Fortune 500 statunitensi: 5,4 miliardi di dollari. Un singolo aggiornamento difettoso di un singolo fornitore.
Il calcolo che nessuno fa
Ho provato a fare due conti con uno dei conoscenti che mi aveva chiamato. Studio professionale, dodici persone, fatturato medio.
33 ore di fermo. 12 persone. Costo orario medio (comprensivo di contributi, struttura, costi fissi): circa 35 euro l'ora. Fa 33 per 12 per 35. Quasi 14.000 euro. Per un singolo outage. Di un singolo fornitore.
"Ma Alberto, un'alternativa self-hosted può andare giù lo stesso."
Vero. E non solo può: succede. Se il tuo provider, Hetzner, OVH, qualunque altro, ha un'interruzione, sei nella stessa identica situazione. Fermo. In attesa. A guardare una pagina di stato che non controlli. Raccontarla diversamente sarebbe disonesto.
La vera differenza è un'altra: la diversificazione. Quando metti posta, file, chat, calendario e backup tutti su Microsoft 365, un singolo guasto ti spegne tutto. Se invece distribuisci i servizi, posta su un provider, file su un altro, backup in un terzo posto, un'interruzione ti toglie un pezzo, non l'intera azienda. Non è magia: è non mettere tutte le uova nello stesso paniere. Che è esattamente la lezione che queste 33 ore avrebbero dovuto insegnare.
Il mito dell'uptime
Microsoft garantisce il 99,9% di uptime. Sembra tanto. Ma facciamo due conti: il 99,9% su un anno sono 8 ore e 45 minuti di downtime ammesso. L'outage di novembre, 33 ore, ha superato quel limite di quasi quattro volte. In un singolo episodio.
E quando Microsoft non rispetta lo SLA, il Service Level Agreement, cioè il contratto di garanzia, sai cosa ti danno? Crediti. Non soldi. Crediti sul prossimo mese di abbonamento. Se hai perso 14.000 euro di produttività, ricevi uno sconto di qualche decina di euro sulla prossima fattura.
Il contratto protegge Microsoft, non te.
L'incendio che ha cancellato i backup
Se pensate che diversificare sia un eccesso di prudenza, cercate "OVH Strasburgo 2021". A marzo di quell'anno, un incendio ha distrutto il data center SBG2 di OVHcloud, uno dei principali provider europei. Server, dati, backup: tutto bruciato. Fisicamente.
Tra i clienti colpiti c'era Bluepad, un'azienda SaaS che aveva i dati di produzione su un server OVH e i backup su un altro server OVH. Nello stesso edificio. Quando il fuoco ha preso tutto, non è rimasto niente. Un tribunale francese ha poi condannato OVH a pagare 150.000 euro di danni. Un altro cliente, Bati Courtage, ha scoperto un mese dopo l'incendio che i suoi backup, quelli per cui pagava un supplemento, erano custoditi nella stessa struttura dei dati primari. Risarcimento: 100.000 euro. Studi medici che hanno perso cartelle diagnostiche. Agenzie di viaggio che hanno perso le prenotazioni. Agenzie di marketing che hanno ricostruito i siti da zero. Non ipotesi: un elenco di cause legali.
Il punto non è che OVH sia peggio di Microsoft. Il punto è che il rischio è lo stesso: se metti tutto in un unico posto, che sia il cloud di Microsoft, i server di OVH, o il NAS nell'armadio del corridoio, basta un singolo evento per perdere tutto. L'incendio non distingue tra self-hosted e cloud. Il blackout neanche. La diversificazione sì.
Non è "Microsoft fa schifo"
Fermiamoci un secondo, perché non voglio che questo articolo possa sembrare un attacco a Microsoft. Non lo è.
Microsoft fa un buon prodotto. Per molte aziende è la scelta giusta. Ha un ecosistema integrato, un supporto capillare, un'interfaccia che la gente conosce. Non è il male.
Il problema non è usare Microsoft. Il problema è dipendere interamente da Microsoft. O da Google. O da qualunque singolo fornitore. Il problema è la monocultura, non il seme.
Un medico non cura con un solo farmaco. Un investitore non mette tutto in un solo titolo (almeno: non dovrebbe). Un agricoltore non pianta un solo tipo di grano. Perché con i tuoi strumenti di lavoro dovrebbe essere diverso?
Cosa si può fare
Non sto dicendo "migra via da Microsoft domani". Per molti non ha senso. Ma ci sono cose che hanno senso per tutti:
Backup indipendente. I tuoi file su OneDrive devono esistere anche altrove. Un NAS in ufficio. Un server di backup. Qualcosa che funziona anche quando Microsoft non funziona.
Posta di emergenza. Un dominio con un provider diverso, anche solo per le comunicazioni critiche. Se Exchange cade, hai un canale B.
Documenti locali. I fascicoli urgenti, quelli che ti servono per un'udienza, una scadenza, un consiglio di amministrazione; devono avere una copia locale. Non su cloud. Sul tuo disco.
Sono misure minime. Non costano quasi niente. Eppure il 90% degli studi che conosco non le adotta. Perché "ma tanto Microsoft non va mai giù."
Fino a quando va giù.
La tensione che resta
Ecco la cosa che non riesco a risolvere, e che vi lascio perché credo sia il cuore della questione: abbiamo costruito un'intera economia sulla promessa che qualcun altro si occupi della nostra infrastruttura. E quella promessa funziona. Funziona quasi sempre. Ma quel "quasi", quel margine sottile tra 99,9% e 100%: è il territorio dove vivono i disastri.
Non ho la risposta perfetta. Non credo esista. Ma so che la domanda vale la pena di essere fatta: se domani mattina il tuo fornitore è offline... tu cosa fai?
Marco lo sa, adesso. Ha un backup locale, una posta alternativa, i fascicoli critici su disco. Non ha migrato. Non ha cambiato niente di strutturale. Ma non è più nudo.
Ed è un inizio.
Fonti
- Microsoft 365 Outage novembre 2024, Pingdom
- Analisi outage Microsoft 25 novembre 2024, ThousandEyes
- CrowdStrike outage luglio 2024, Wikipedia
- CrowdStrike outage: timeline e analisi, Bitsight
- Incendio data center OVH Strasburgo 2021, Data Center Dynamics
- OVH condannata a risarcire clienti per backup persi, Blocks and Files