Big Data: Caratteristiche e differenza tra Data Science o Data Analytics

Big Data: Caratteristiche e differenza tra Data Science o Data Analytics

I Big Data sono ovunque, in ogni business o funzione industriale e aumentano ad un tasso estremamente rapido. I Big Data, infatti, diventeranno la chiave della competizione, essendo ormai un fattore di produzione importante tanto quanto le risorse umane e il capitale. Sono e saranno la base di nuovi fenomeni di crescita esponenziale e innovazione, in grado, se ben gestiti e interpretati, di incrementare notevolmente la produttività di molti settori, in particolare la pubblica amministrazione, la sanità, la finanza, l’industria dell’elettronica e dell’informatica. Non tutti, però, sanno cosa sono effettivamente questi Big Data.

“Un sistema di Big Data si riferisce a dataset la cui taglia/volume è talmente grande che eccede la capacità dei sistemi di database relazionali di catturare, immagazzinare, gestire ed analizzare”.

Per poter parlare di Big Data il volume dei dati deve essere correlato alla capacità del sistema di acquisire le informazioni così come arrivano dalle differenti sorgenti di dati che sono adoperate. Quindi un sistema diventa big quando aumenta il volume dei dati e, allo stesso tempo, aumentano la velocità e il flusso d’informazioni per secondo che il sistema deve acquisire e gestire. Non esiste, tuttavia, una dimensione di riferimento poiché varia a seconda dei settori e degli strumenti software a disposizione. Inoltre aumenterà sicuramente col tempo, poiché le macchine sono sempre più veloci e i dataset sempre più grandi.

Big Data: Caratteristiche e differenza tra Data Science o Data Analytics

L’analisi di Big Data: Data Science o Data Analytics?

A complicare l’ambiguità della definizione di Big Data, vi è anche la confusione che caratterizza le terminologie utilizzate per identificare le strumentazioni di analisi di queste enormi moli di dati. Le differenze sono, infatti, poco chiare e molto tecniche, difficili da comprendere se non si è esperti nel campo. Cerchiamo di esplicitarle in maniera semplice.

Data Science è la scienza dei dati, intesa come un ambito che raccoglie tutte le discipline che riguardano la pulizia, la preparazione e l’analisi dei dati (non necessariamente deve trattarsi di Big Data) per estrarne informazioni di valore altrimenti non evidenti. Utilizza, accanto a una serie di tecniche matematiche, statistiche e di programmazione, algoritmi di machine learning e intelligenze artificiali.

I Data Analytics (o, più semplicemente, Analytics) sono strumenti che si basano sull’inferenza statistica per esaminare in maniera approfondita dati grezzi e le conoscenze a disposizione per individuare correlazioni, trend o verificare teorie e modelli esistenti. Rispondono a domande precise e partono da ipotesi formulate sin dall’inizio, focalizzandosi su particolari settori, con lo scopo di ottenere le best practises che portano ad un miglioramento del business. Possono essere distinti in Business Analytics (o Business Intelligence) e Advanced Analytics (anche detti Big Data Analytics).

La Business Intelligence si focalizza sul fornire alle persone dati e informazioni in tempo reale, per rendere le operazioni e i processi più efficienti. Utilizza la statistica descrittiva per misurare qualcosa, rilevare tendenze, fornire report a partire da dataset limitati (campioni), dati puliti e modelli semplici ricavati dallo storico dell’organizzazione.
Gli Advanced Analytics, invece, consentono di effettuare previsioni future e simulazioni what-if per verificare gli effetti di determinati cambiamenti sul business, nonché di ottenere analisi più dettagliate e approfondite. Attraverso l’uso di tecniche e strumenti più sofisticati sono in grado di analizzare dataset molto più grandi.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: www.vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *