digital relax: Observability

il gruppo E torna CON una nuova serie podcast in 6 episodi, digital relax, da ascoltare per scoprire, senza fretta, le novità dell’it: tecnologie, trend e atteggiamenti ricorrenti da parte delle aziende. L’episodio conclusivo è dedicato ALL’observability eD è tenuto da matteo Franchi, Direttore della Business Unit Datacenter del gruppo e.


Cosa si intende per osservabilità a livello di infrastruttura IT?

MATTEO FRANCHI Quando parliamo di "osservabilità" in ambito dell'IT, ci riferiamo a quanto siamo in grado di capire tutto quello che succede nel sistema informatico: ovvero della nostra capacità di monitorare, analizzare e comprendere il comportamento e le prestazioni di tutti i componenti critici di un'infrastruttura informatica: server, reti, database, servizi cloud, container, applicazioni e altro ancora. E lo facciamo raccogliendo dati dettagliati sui vari aspetti dell'infrastruttura.

Ma non basta ovviamente raccogliere dati, bisogna saperli interpretare: analizzando questi dati, siamo in grado di individuare pattern, anomalie e tendenze, e tradurre queste informazioni in conoscenza e, subito dopo, in azioni concrete per migliorare le prestazioni, risolvere i problemi di sistema e ottimizzare l'infrastruttura nel suo complesso, per renderla la più affidabile, sicura e efficiente possibile, in modo che possa supportare al meglio le attività aziendali.

L’observability rispetto al monitoring lascia parlare i dati. è un approccio più investigativo.
— Matteo Franchi

Qual è la differenza rispetto al performance monitoring?

MATTEO FRANCHI Per semplificare leggermente: nel monitoraggio, si configurano in anticipo dei cruscotti per avvertire riguardo ai problemi di prestazione che ci si aspetta di riscontrare. In uno scenario di osservabilità, cambia proprio il paradigma: non ci sono preconcetti sui problemi che ci si aspetta di incontrare e ci si fa guidare dai dati: si esplora in modo flessibile ciò che sta accadendo e si individua rapidamente la causa radice dei problemi, anche quelli che non ci si aspettava. Di fatto è un approccio investigativo.

Si parla solo di analisi dei dati storici?

MATTEO FRANCHI Non solo, ed è un aspetto interessante. Nei tool di observability è possibile trovare moduli di forecasting che utilizzano l'intelligenza artificiale e il machine learning che analizzano dati storici per prevedere tendenze future. Questi strumenti adottano algoritmi complessi per cogliere relazioni non lineari tra le variabili, considerare anche l’esperienza umana per stimare valori futuri.

Come mai il tema dell’observability è diventato di grande rilevanza ultimamente?

Beh, oggi le nostre aziende dipendono in tutto e per tutto dai servizi digitali. Quando questi vengono a mancare per qualche  tempo o sono meno performanti le conseguenze sul business possono essere anche gravissime. E quindi l'osservabilità, che è garanzia di continuità del servizio, è diventata assolutamente centrale.

Poi c’è la questione della complessità delle infrastrutture digitali, incluse le architetture cloud-native, che appunto oltre a essere complesse non sono nemmeno tutte nello stesso luogo. Questo scenario ha reso essenziale avere la capacità di monitorare e comprendere il comportamento di sistemi altamente dinamici e distribuiti.

E inoltre c’è il tema dell’osservabilità come integrazione nei processi di sviluppo software DevOps per accelerare il rilascio dei prodotti. L'osservabilità è uno strumento che fornendo agli sviluppatori e agli operatori di sistema una visibilità immediata sul comportamento e sulle prestazioni dell'infrastruttura e delle applicazioni in seguito a un loro intervento a livello di programmazione: vedono subito l'impatto delle loro modifiche sul sistema e così evitano prima eventuali problemi di prestazioni o di sicurezza in fase di rilascio.

Puoi farmi un esempio reale di situazione che è possibile evitare grazie all’observability e che hai vissuto con i clienti?  

MATTEO FRANCHI Certo, ti faccio alcuni esempi.

Un nostro cliente leader nel farmaceutico aveva un problema con i sistemi di videoconferenza che attribuivano alla soluzione e poi con l’observability si è scoperto che era un problema di connettività.

Un altro nostro cliente attivo nell’e-commerce ha implementato un sistema di osservabilità per monitorare le prestazioni del proprio sito web durante i periodi di alto traffico, come durante i saldi o le festività. Utilizzando dati di osservabilità in tempo reale, l'azienda può individuare rapidamente e risolvere i problemi di prestazioni, garantendo un'esperienza utente fluida e evitando perdite di entrate dovute a tempi di caricamento lunghi o a interruzioni del servizio.

Un terzo esempio di situazione che è possibile evitare grazie all'osservabilità è l'interruzione del servizio critico a causa di un sovraccarico improvviso dei server. Utilizzando un sistema di osservabilità ben configurato, è possibile rilevare rapidamente un aumento anomalo dell'utilizzo della CPU o della larghezza di banda di rete, consentendo agli operatori di sistema di intervenire prima che il problema causi un'interruzione del servizio per gli utenti. Come il contatore intelligente che ci avverte che la rete domestica (o aziendale) è sovraccarica e c’è un rischio distacco imminente. Senza questo strumento è difficile prevederlo.

Puoi descrivere alcuni strumenti di osservabilità e spiegare come operano?

Ci sono molti tool di observability sul mercato, proposti da vari brand come Dynatrace, Splunk, Datadog, ThousandEyes di Cisco, ognuno con la propria peculiarità.

  • Dynatrace, uno dei leader di mercato, ad esempio, si distingue per la facilità con la quale permette di aggiungere nuovi sistemi sotto il cappello dell'observability. La piattaforma inizia da subito a collezionare metriche e log e a crearsi le baseline di performance. L'intelligenza artificiale è utilizzata per la cosiddetta "anomaly detection" rispetto a queste baseline e a generare allarmi molto mirati su eventuali problemi in corso. Non solo: è anche in grado di costruire un grafo delle interdipendenze o interconnessioni fra le varie componenti dell'architettura e questo le consente, in fase di segnalazione di un problema, di risalire facilmente alla sua causa principale

  • ThousandEyes di Cisco invece si distingue per la capacità di offrire una visibilità molto ampia su internet, sul cloud e sulle reti aziendali. Punta sul concetto di “esperienza digitale” essendo il suo obiettivo renderla ottimale e utilizza estensivamente l'intelligenza artificiale e il machine learning per analizzare i dati storici.

Si intuisce una connessione tra questo tema a livello infrastrutturale e a livello di sicurezza?

MATTEO FRANCHI È evidente che ci sia un collegamento forte con gli aspetti di security. Con l’observability l’amministratore della rete vede succedere qualcosa ed è chiamato a intervenire. Si può trattare di un problema tecnico ma si può trattare anche di un attacco cyber. Per esempio, il crash di un sito a causa dell’elevato traffico può essere un problema tecnico ma anche il segnale che è in corso un attacco DOS, che scatena tantissime richieste di accesso per mandare in crash il sito. Il SOC (Security Operation Center) non è altro che un servizio che osserva quindi di fatto un elemento che utilizza observability per svolgere il suo compito.

Indietro
Indietro

LA NOSTRA AI POTENZIATA DALLA DATA INTELLIGENCE DOCUMENTALE

Avanti
Avanti

COMUNICAZIONE CONTROCORRENTE PER AISURU