Differenza tra big data e data mining in informatica

Differenza tra big data e data mining in informatica

Big data e Data mining

Nell’ambito informatica, i Big data e i data mining sono due cose abbastanza diverse. Entrambi si riferiscono all’uso di grandi set di dati per gestire la raccolta o il reporting di dati che servono le aziende o altri destinatari. Tuttavia, i due termini vengono utilizzati per due diversi elementi di questo tipo di operazione.

Big data è un termine per un ampio set di dati. I set di big data sono quelli che superano il semplice tipo di database e le architetture di gestione dei dati utilizzati in passato, quando i big data erano più costosi e meno fattibili. Ad esempio, i set di dati che sono troppo grandi per essere facilmente gestiti in un foglio di calcolo di Microsoft Excel potrebbero essere indicati come set di big data.

Differenza tra big data e data mining in informatica

Il data mining invece si riferisce all’attività di passare attraverso set di big data per cercare informazioni rilevanti o pertinenti. Questo tipo di attività è davvero un buon esempio del vecchio assioma “cercare un ago in un pagliaio”. L’idea è che le aziende raccolgano enormi set di dati che possono essere omogenei o raccolti automaticamente. I responsabili delle decisioni hanno bisogno di accedere a dati più piccoli e più specifici da questi set di grandi dimensioni. Usano il data mining per scoprire le informazioni che informeranno la leadership e aiuteranno a tracciare il corso di un’azienda.

Il data mining può comportare l’uso di diversi tipi di pacchetti software come gli strumenti di analisi. Può essere automatizzato, oppure può essere in gran parte ad alta intensità di manodopera, in cui i singoli lavoratori inviano richieste specifiche di informazioni a un archivio o database. In genere, il data mining si riferisce a operazioni che implicano operazioni di ricerca relativamente sofisticate che restituiscono risultati mirati e specifici. Ad esempio, uno strumento di data mining può esaminare decine di anni di informazioni contabili per trovare una colonna specifica di spese o crediti per uno specifico anno operativo.

Riassumento in breve, i big data sono la risorsa mentre il data mining è il “gestore” che viene utilizzato per fornire risultati vantaggiosi.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *