Che cosa sono e caratteristiche dei Big Data in informatica

Che cosa sono e caratteristiche dei Big Data in informatica

In informatica, con il termine Big Data ci si riferisce a un dataset la cui dimensione va al di là della capacità di un database normale di catturare, memorizzare, gestire e analizzare i dati. Si tratta di una definizione soggettiva in cui non viene esplicitata la dimensione che deve avere un Dataset per poter essere definito Big Data, in quanto essa aumenterà sicuramente nel tempo dati i continui avanzamenti tecnologici. Le dimensioni variano nei diversi settori, da dozzine di terabyte a centinaia di petabyte (1000 terabyte),in base anche agli svariati strumenti software a disposizione.

Che cosa sono e caratteristiche dei Big Data in informatica

In questa definizione emerge una delle cosiddette 5V che caratterizzano i Big Data, ovvero il volume, le altre sono velocità, varietà, veridicità e valore. Il volume fa appunto riferimento all’enorme massa di dati generata attraverso numerosi canali: ogni giorno Google elabora circa 24 petabytes di dati, un motore a reazione può generarne 10 terabyte in 30 minuti così come i contatori intelligenti e i macchinari per l’industria pesante tra cui le raffinerie di petrolio e gli impianti di perforazione. La velocità si riferisce alla rapidità con cui i dati vengono acquisiti e utilizzati, in aumento date transazioni sempre più frequenti e veloci: le aziende non solo raccolgono i dati più velocemente, ma cercano di sfruttarli il prima possibile, spesso in real time. La varietà è legata alle differenti tipologie di dati disponibili provenienti da un numero crescente di fonti di dati sia strutturati sia non strutturati; in particolare è possibile identificare cinque categorie di informazioni che costituiscono i Big Data:

  • dati generati da smartphone e altri dispositivi mobile relativi a persone, attività e localizzazione, tra cui dati RFID (radio-frequency identification),dispositivi che tracciano il prodotto,e dati da dispositivi di controllo.
  • dati di vendita e pricing, dati generati dall’attività delle carte fedeltà e degli eventi promozionali;
  • computer log Data, come i clickstreams dai siti web;
  • informazioni dai social media come Twitter e Facebook;
  • social multimediali e altre informazioni da Flickr, YouTube e siti simili

La veridicità riguarda la questione relativa alla qualità dei dati e al loro livello di sicurezza, la cui garanzia rappresenta una sfida molto importante. Il valore è un aspetto fondamentale: per poter sfruttare i Big Data è necessario saper agire per poter estrarne valore e quindi incrementare la produttività e la competitività delle aziende e creare surplus economico per i consumatori.

La capacità di memorizzare e aggregare i dati e quindi di utilizzare i risultati per svolgere analisi profonde migliora continuamente grazie alla disponibilità di strumenti software e tecniche sempre più sofisticate combinate a una crescente potenza di calcolo. Stiamo assistendo anche ad un enorme cambiamento della capacità di generare, comunicare, condividere e accedere ai dati dovuto all’aumento del numero di persone, strumenti e sensori ora connessi da reti digitali.

Le 5V dei Big Data
Le 5V dei Big Data

Bisogna notare infine che nonostante le opportunità e i benifici offerti dai Big Data siano enormi, c’è ancora un certo scetticismo all’interno delle aziende sui reali benefici apportati a causa degli scarsi risultati ottenuti in pratica a fronte di grandi investimenti da parte delle aziende che utilizzano queste nuove tecnologie. L’era dei Big Data però è una rivoluzione che cambia il modo di essere e di fare di un’impresa. È quindi necessario per le aziende attrezzarsi in modo da riuscire a sfruttarli a pieno, portando anche numerosi vantaggi ai consumatori finali.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: www.vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *