Differenza tra Data mining e OLAP in informatica

Differenza tra Data mining e OLAP in informatica

In informatica, sia il data mining (DM) che l’OLAP sono due delle comuni tecnologie di Business Intelligence (BI). La business intelligence si riferisce a metodi basati su computer per identificare ed estrarre informazioni utili dai dati aziendali. Il data mining è il campo dell’informatica che si occupa di estrarre modelli interessanti da grandi insiemi di dati. Combina molti metodi di intelligenza artificiale, statistica e gestione di database. OLAP (online analytical processing), come suggerisce il nome, è una raccolta di modi per interrogare database multidimensionali.

Data mining (DM)

Il data mining è noto anche come Knowledge Discovery in data (KDD). Come accennato in precedenza, è un campo dell’informatica, che si occupa dell’estrazione di informazioni precedentemente sconosciute e interessanti da dati grezzi. A causa della crescita esponenziale dei dati, soprattutto in aree come il business, il data mining è diventato uno strumento molto importante per convertire questa grande ricchezza di dati in business intelligence, poiché l’estrazione manuale dei modelli è diventata apparentemente impossibile negli ultimi decenni. Ad esempio, è attualmente utilizzato per varie applicazioni come l’analisi dei social network, il rilevamento delle frodi e il marketing. Il data mining di solito si occupa delle seguenti quattro attività: clustering, classificazione, regressione e associazione. Il clustering identifica gruppi simili da dati non strutturati. La classificazione è regole di apprendimento che possono essere applicate a nuovi dati e tipicamente includerà le seguenti fasi: pre-elaborazione dei dati, modellazione di progettazione, selezione di apprendimento e valutazione/convalida. La regressione è trovare funzioni con un errore minimo per modellare i dati. E l’associazione cerca relazioni tra variabili. In partcia, il data mining viene solitamente utilizzato per rispondere a domande come quali sono i principali prodotti che potrebbero aiutare a ottenere profitti elevati il ​​prossimo anno in Amazon.

OLAP (Online Analytical Processing)

L’OLAP (Online Analytical Processing) è una classe di sistemi che fornisce risposte a query multidimensionali. Tipicamente OLAP viene utilizzato per applicazioni di marketing, budgeting, previsione e simili. Inutile dire che i database utilizzati per OLAP sono configurati per query complesse e ad-hoc con in mente prestazioni rapide. In genere viene utilizzata una matrice per visualizzare l’output di un OLAP. Le righe e le colonne sono formate dalle dimensioni della query. Spesso utilizzano metodi di aggregazione su più tabelle per ottenere riepiloghi. Ad esempio, può essere utilizzato per conoscere le vendite di quest’anno in Amazon rispetto allo scorso anno? Qual è la previsione sulle vendite nel prossimo trimestre? Cosa si può dire dell’andamento guardando la variazione percentuale?

Differenza tra Data mining e OLAP in informatica

Differenza tra data mining e OLAP

Sebbene sia ovvio che il data mining e l’OLAP siano simili perché operano sui dati per acquisire intelligenza, la differenza principale deriva dal modo in cui operano sui dati. Gli strumenti OLAP forniscono analisi multidimensionali dei dati e forniscono riepiloghi dei dati ma, al contrario, il data mining si concentra su rapporti, modelli e influenze nel set di dati. Si tratta di un accordo OLAP con aggregazione, che si riduce al funzionamento dei dati tramite “aggiunta”, ma il data mining corrisponde alla “divisione”. Un’altra differenza notevole è che mentre gli strumenti di data mining modellano i dati e restituiscono regole utilizzabili, OLAP condurrà tecniche di confronto e contrasto lungo la dimensione aziendale in tempo reale.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *