Differenza tra data mining e data warehousing in informatica

Differenza tra data mining e data warehousing in informatica

Caratteristiche data mining e data warehousing

In informatica, il data mining (DM) e il data warehouse (DW) sono tecniche molto potenti e popolari per l’analisi dei dati. Gli utenti inclini alle statistiche utilizzano il data mining. Utilizzano modelli statistici per cercare modelli nascosti nei dati. I data miner sono interessati a trovare relazioni utili tra diversi elementi di dati, il che è in definitiva redditizio per le aziende. D’altro canto, gli esperti di dati in grado di analizzare direttamente le dimensioni dell’azienda tendono a utilizzare i data warehouse.

Il data mining è noto anche come Knowledge Discovery in data (KDD). Come accennato in precedenza, è un campo dell’informatica, che si occupa dell’estrazione di informazioni precedentemente sconosciute e interessanti da dati grezzi. A causa della crescita esponenziale dei dati, soprattutto in aree come il business, il data mining è diventato uno strumento molto importante per convertire questa grande ricchezza di dati in business intelligence, poiché l’estrazione manuale dei modelli è diventata apparentemente impossibile negli ultimi decenni. Ad esempio, è attualmente utilizzato per varie applicazioni come l’analisi dei social network, il rilevamento delle frodi e il marketing. Il data mining di solito si occupa delle seguenti quattro attività: clustering, classificazione, regressione e associazione. Il clustering identifica gruppi simili da dati non strutturati. La classificazione è regole di apprendimento che possono essere applicate a nuovi dati e generalmente includerà i seguenti passaggi: pre-elaborazione dei dati, modellazione di progettazione, apprendimento/selezione di caratteristiche e valutazione/convalida. La regressione è trovare funzioni con un errore minimo per modellare i dati. E l’associazione cerca relazioni tra variabili. Il data mining viene solitamente utilizzato per rispondere a domande come quali sono i principali prodotti che potrebbero aiutare a ottenere profitti elevati il ​​prossimo anno in Amazon?

D’altro canto, il data warehousing viene utilizzato anche per analizzare i dati, ma da diversi gruppi di utenti e con un obiettivo leggermente diverso in mente. Ad esempio, quando si tratta del settore della vendita al dettaglio, gli utenti del data warehousing sono più interessati ai tipi di acquisto popolari tra i clienti, quindi i risultati dell’analisi possono aiutare il cliente migliorando l’esperienza del cliente. Ma i data miner prima ipotizzano un’ipotesi come i clienti acquistano un certo tipo di prodotto e analizzano i dati per testare l’ipotesi. Il data warehousing potrebbe essere effettuato da un importante rivenditore che inizialmente rifornisce i suoi negozi con le stesse dimensioni di prodotti per scoprire in seguito che i negozi di New York vendono inventari di dimensioni inferiori molto più velocemente rispetto ai negozi di Chicago. Così, guardando questo risultato, il rivenditore può immagazzinare il negozio di New York con dimensioni più piccole rispetto ai negozi di Chicago.

Differenza tra data mining e data warehousing in informatica

Differenza tra data mining e data warehousing

Infine, sia data mining e data warehousing si preoccupano di aumentare i profitti sulla base dei dati storici. Ma ovviamente ci sono differenze fondamentali. In termini semplici, Data Mining e Data Warehousing sono dedicati a fornire diversi tipi di analisi, ma sicuramente per diversi tipi di utenti. In altre parole, Data Mining cerca correlazioni, schemi per supportare un’ipotesi statistica. Tuttavia, il Data Warehousing risponde a una domanda relativamente più ampia e da lì in poi taglia e taglia i dati per riconoscere le modalità di miglioramento in futuro.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *