Quali sono le fonti e le acquisizioni dei dati per i Big Data

Quali sono le fonti e le acquisizioni dei dati per i Big Data

L’evoluzione tecnologica degli ultimi anni ha permesso di ottenere più facilmente ed economicamente grandi moli di dati su ogni tipo di fenomeno d’interesse, appartenente a qualsiasi settore. Questo grazie alle sempre maggiori capacità automatiche di rilevazione e di calcolo, nonché al potenziamento dei sistemi di immagazzinamento e memorizzazione delle informazioni. Tali innovazioni hanno contribuito a creare la cosiddetta società dell’informazione, in cui il numero degli oggetti digitali connessi cresce esponenzialmente, con il crollo dei costi e l’aumento del valore di connettere, memorizzare ed elaborare informazioni.

Questi insiemi di dati sono raccolti in dataset di grandi dimensioni che possono essere gestiti, conservati e analizzati solo facendo uso di tecnologie avanzate. Ma quali sono le fonti per i Big Data? Come si acquisiscono e archiviano le informazioni raccolte? Quali sono le prime elaborazioni da svolgere su di esse?

Quali sono le fonti e le acquisizioni dei dati per i Big Data

Fonti per i Big Data

Ogni telefono cellulare registra continuamente una grande quantità d’informazioni sul luogo in cui si trova, sulla velocità dei suoi spostamenti, sulla cella più vicina alla quale si può collegare, sugli altri telefoni con i quali comunica, sui servizi applicativi che gli utenti adottano per svolgere le più svariate attività. Milioni di automobili raccolgono e registrano in ogni momento dati sui percorsi, le soste, gli stili di guida, lo stato del motore e dei freni con sensori, computer di bordo, scatole nere. Ogni contatore intelligente dell’energia elettrica, ogni macchina agricola, ogni termostato moderno raccoglie e comunica dati. Nelle fabbriche ogni macchina è dotata di sensori che registrano e comunicano informazioni per migliorare i prodotti, per la manutenzione, per l’efficientamento della produzione. Nei campi i sensori avvertono i contadini dei cambiamenti climatici o della necessità di annaffiatura.

Anche con questi pochi esempi s’intuisce come, oltre alla varietà di formati e strutture, i Big Data presentano anche una grande varietà di fonti. I dati da esse generati sono spesso classificati in:

  • human generated
  • machine generated
  • business generated

Tra le sorgenti di dati human generated si trovano in particolare le piattaforme di social network (Facebook, LinkedIn), blogging (Blogger, WordPress) e micro-blogging (Twitter, Tumblr), social news (Digg, Reddit), condivisione multimediale (Instagram, Flickr, YouTube), nonché le wiki5 (Wikipedia), i siti di domande e risposte (Yahoo Answers), i siti di recensioni (Yelp, TripAdvisor), i portali di ecommerce (Amazon, eBay) e i click stream da siti web. Questo tipo di fonti è anche chiamato user-generated content, poiché i contenuti sono prodotti in gran parte dagli utenti.

I dati machine generated sono prodotti da sorgenti quali sensori GPS, dispositivi IoT, RFID, centrali di monitoraggio di eventi meteorologici, contatori delle utenze energetiche, strumenti scientifici, sistemi di High Frequency Trading dei mercati finanziari, dispositivi biomedicali, macchinari industriali, smartphone.

Infine, per dati business generated si intendono tutti i dati, human o machine generated, prodotti internamente ad un’azienda relativi alle attività data-driven dei processi di business aziendali, ossia a quelle attività le cui decisioni sono determinate a partire da considerazioni sui dati a disposizione. Molti di essi sono dati storici, memorizzati staticamente e normalmente archiviati separatamente nei database relazionali della relativa area funzionale.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *