Differenza tra Data Warehouse (DWH), Database (DB) e Data Mart (DM)

Differenza tra Data Warehouse (DWH), Database (DB) e Data Mart (DM)

Data Warehouse (DWH)

Il Data Warehouse è uno strumento (o un insieme di strumenti) software avente lo scopo di memorizzare tutti i dati di interesse aziendale, sia che siano provenienti dai sistemi gestionali sia da fonti esterne, in una forma ottimizzata per effettuare interrogazioni e non scritture tradizionali (come nei normali database operazionali OLTP).

Per questo sono state concepite strutture di dati alternative a quelle dei database operazionali; mentre questi si basano sui concetti e sulle regole relazionali (Entity-Relationship), i Data Warehouse sono generalmente basati sul modello dimensionale o Star Schema, ottimizzato per rispondere velocemente a interrogazioni di vario tipo.

L’attività di Data Warehousing, cioè di costruzione e gestione di un Data Warehouse, comprende varie fasi:

  • individuazione dei dati di partenza;
  • conversione, estrazione e pulitura dei dati;
  • utilizzo di un DBMS per gestire il Data Warehouse;
  • Impiego di strumenti di Business Intelligence per accedervi.

Database (DB)

Il database (DB) indica un insieme di dati strutturati ovvero omogeneo per contenuti e formato, memorizzati in un elaboratore elettronico e interrogabili via terminale utilizzando le chiavi di accesso previste. Rappresenta di fatto il formato digitale, dunque più efficiente, equivalente a un archivio dati o schedario, con il vantaggio di molteplici funzionalità e prestazioni implementate in maniera automatica su PC su scelta/input dell’utente.

I database vengono creati, gestiti ed interrogati da un sistema software chiamato DataBase Managment System, o DMBS: che rappresenta un sistema di gestione dei dati che garantisce un livello di sicurezza ai dati, permettendone una condivisione sicura ed affidabile agli utenti.
Tale sistema si interpone tra l’utente e i dati nel database; grazie a questo strato di software l’utente non ha accesso diretto ai dati memorizzati fisicamente, ma solo ad una loro rappresentazione logica, permettendo così un alto livello di indipendenza tra dati fisici ed applicazioni. Le attuali applicazioni dei database permettono l’accesso ai dati a piu utenti contemporaneamente: questo e reso possibile dal fatto che vi sono DBMS sviluppati in modo che, utilizzando una sola copia dei dati, permettono la creazione di piu rappresentazioni logiche di questi, riducendone la ridondanza e l’inconsistenza.

Data Mart (DM)

Un data mart (DM) è un raccoglitore di dati specializzato su un particolare segmento/area aziendale. Contiene un’immagine di una porzione i dati e permette di formulare strategie sulla base degli andamenti passati. Viene collocato a valle di un DW ed è alimentato a partire da esso, di cui costituisce, in pratica, un estratto.

Detto in termini più tecnici, un data mart è un sottoinsieme logico o fisico di un DW di maggiori dimensioni. La differenza fondamentale consiste nel fatto che la creazione del Data Warehouse avviene prima in maniera generalizzata per poi subire modifiche per potersi adattare a esigenze specifiche, mentre il data mart viene generalmente creato per venire incontro ad una esigenza già determinata.

La necessità di creare un sistema separato per il DM rispetto al DW può riassumersi nelle seguenti motivazioni:

  • necessità di utilizzare un diverso schema;
  • migliorare la performance separando il computer dedicato;
  • garantire una maggiore sicurezza dovendo autorizzare l’accesso ad un insieme minore di dati.

In generale è possibile affermare che più un approccio è articolato più offre vantaggi in termini di flessibilità e di ROI, ma nello stesso tempo fa aumentare il rischio di perdere il controllo sull’architettura.

Differenza tra Data Warehouse (DWH), Database (DB) e Data Mart (DM)

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *