Che cos’è, caratteristiche e importanza dello streaming di dati

Che cos’è, caratteristiche e importanza dello streaming di dati

Streaming di dati

Lo streaming di dati, o in inglese data streaming, è il processo di trasmissione di un flusso continuo di dati (noto anche come flussi) in genere inserito nel software di elaborazione del flusso per ricavare informazioni preziose. Un flusso di dati è costituito da una serie di elementi di dati ordinati nel tempo. I dati rappresentano un “evento” o un cambiamento di stato che si è verificato nell’azienda ed è utile per l’azienda da conoscere e analizzare, spesso in tempo reale. Alcuni esempi di flussi di dati includono i dati dei sensori, i registri delle attività dei browser Web e i registri delle transazioni finanziarie. Un flusso di dati può essere visualizzato come un nastro trasportatore senza fine, che trasporta elementi di dati e li alimenta continuamente in un processore di dati.

Con la crescita dell’Internet of Things (IoT) e le aspettative dei clienti, l’importanza dello streaming di dati e dell’elaborazione del flusso è aumentata. I monitor della salute personale e i sistemi di sicurezza domestica sono due esempi di fonti di streaming di dati. Un sistema di sicurezza domestica include più sensori di movimento per monitorare diverse aree della casa. Questi sensori generano un flusso di dati trasmessi continuamente a un’infrastruttura di elaborazione che monitora qualsiasi attività imprevista in tempo reale o salva i dati per analizzarli in modo più difficile da rilevare in seguito. I monitor per la salute sono un altro esempio di fonti di streaming di dati tra cui monitoraggio del battito cardiaco, della pressione sanguigna o dell’ossigeno. Questi dispositivi generano continuamente dati. L’analisi tempestiva di questi dati è essenziale, poiché da essa potrebbe dipendere la sicurezza della persona.

Che cos'è, caratteristiche e importanza dello streaming di dati

Caratteristiche generali

I dati in streaming da sensori, browser Web e altri sistemi di monitoraggio hanno determinate caratteristiche che li distinguono dai tradizionali dati storici. Di seguito sono riportate alcune caratteristiche chiave dei dati di flusso.

Sensibile al tempo

Ogni elemento in un flusso di dati porta un timestamp. I flussi di dati sono sensibili al tempo e perdono significato dopo un certo tempo. Ad esempio, i dati di un sistema di sicurezza domestica che indicano un movimento sospetto dovrebbero essere analizzati e indirizzati entro un breve periodo di tempo per rimanere pertinenti.

Continuo

Non c’è inizio né fine per lo streaming dei dati. I flussi di dati sono continui e avvengono in tempo reale, ma non sempre vengono eseguiti sul momento, a seconda dei requisiti di sistema.

Eterogeneo

I dati del flusso spesso provengono da migliaia di fonti diverse che possono essere geograficamente distanti. A causa della disparità nelle fonti, i dati del flusso potrebbero essere un mix di formati diversi.

imperfetto

A causa della varietà delle loro fonti e dei diversi meccanismi di trasmissione dei dati, un flusso di dati può avere elementi di dati mancanti o danneggiati. Inoltre, gli elementi di dati in un flusso potrebbero arrivare fuori ordine.

Volatile e irripetibile

Poiché lo streaming di dati avviene in tempo reale, la trasmissione ripetuta di un flusso è piuttosto difficile. Sebbene siano previste disposizioni per la ritrasmissione, i nuovi dati potrebbero non essere gli stessi dell’ultimo. Ciò rende i flussi di dati altamente volatili. Tuttavia, molti sistemi moderni tengono un registro dei loro flussi di dati, quindi anche se non puoi accedervi al momento, puoi comunque analizzarli in un secondo momento.

Qual è l’importanza dello streaming di dati per le aziende?

I dati nel formato dei flussi sono altamente significativi nel mondo di oggi. Numerosi dispositivi IoT e utenti Internet generano enormi volumi di dati continui e in tempo reale ogni secondo. L’elaborazione di questi dati in tempo reale è sia una sfida che un’opportunità per le organizzazioni.

La natura mutevole dei dati

Tradizionalmente, le organizzazioni raccolgono dati nel tempo, li archiviano in data warehouse e li elaborano in batch. Ciò consente di risparmiare scarsa potenza di calcolo. Negli ultimi anni, la struttura dei dati e le tecnologie di elaborazione sono notevolmente cambiate. IoT ha introdotto un’ampia gamma di sensori che generano dati in streaming. Anche le carte di credito e le transazioni finanziarie online generano dati in tempo reale che devono essere analizzati e verificati. I browser Web generano transazioni online e registri delle attività. Il flusso di dati e l’elaborazione del flusso sono essenziali per gestire questi tipi di dati.

Grandi volumi di dati

La quantità di dati che viene generata ogni secondo è troppo grande per essere archiviata in qualsiasi data warehouse. Pertanto, i dati di flusso vengono spesso valutati al momento per determinare se si tratta di un elemento chiave di dati in tempo reale o non necessario. Di conseguenza, i sistemi possono trasmettere i dati e analizzarli immediatamente per decidere cosa archiviare e cosa no, aiutando le organizzazioni a ridurre la perdita di dati, l’archiviazione dei dati e risparmiare sui costi dell’infrastruttura.

Esempi di streaming di dati

Internet of Things: IoT include un numero enorme di dispositivi che raccolgono dati tramite sensori e li trasmettono in tempo reale a un elaboratore di dati. I dati IoT generano dati di flusso. I monitor sanitari indossabili come orologi, sistemi di sicurezza domestica, sistemi di monitoraggio del traffico, scanner biometrici, elettrodomestici connessi, sicurezza informatica e sistemi di privacy generano e trasmettono dati in tempo reale.

Monitoraggio del mercato azionario in tempo reale: i dati finanziari in tempo reale vengono spesso trasmessi in formato stream. L’elaborazione e l’analisi dei dati finanziari (come i prezzi delle azioni e le tendenze di mercato) aiuta le organizzazioni a prendere rapidamente decisioni cruciali.

Registri delle attività e delle transazioni: Internet è anche una delle principali fonti di dati di flusso in tempo reale. Quando le persone visitano i siti Web o fanno clic sui collegamenti, i browser Web generano registri delle attività. Anche le transazioni finanziarie online, come gli acquisti con carta di credito, generano dati time-critical che possono essere trasmessi in streaming ed elaborati per azioni in tempo reale.

Monitor di processo: ogni azienda genera miliardi di punti dati dai propri sistemi interni. Trasmettendo questi dati ed elaborandoli in tempo reale, le aziende sono in grado di monitorare lo stato di salute del sistema e agire prima che le cose si aggravino. Ad esempio, le aziende manifatturiere spesso dispongono di dispositivi per monitorare lo stato di salute della catena di montaggio e rilevare i guasti per valutare i rischi nella produzione. Questi dispositivi possono anche trasmettere dati urgenti per monitorare le interruzioni e persino prevenirle.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *