Definizione e Caratteristiche di un Data Warehouse (DW) in informatica

Definizione e Caratteristiche di un Data Warehouse (DW) in informatica

Un Data Warehouse (DW) è un archivio informatico contenente i dati di un’organizzazione. I DW sono progettati per consentire di produrre facilmente relazioni ed analisi. Vengono considerati componenti essenziali di un sistema data warehouse anche gli strumenti per localizzare i dati, per estrarli, trasformarli e caricarli, come pure gli strumenti per gestire un dizionario dei dati. Il data warehouse è un sistema informativo dove i dati sono organizzati e strutturati per un facile accesso da parte dell’utente e per fornire supporto ai processi decisionali.

Definizione e Caratteristiche di un Data Warehouse (DW) in informatica

Il data warehouse è organizzato su quattro livelli architetturali:

1. trasformazione dei dati: livello che si occupa di acquisire i dati dal database aziendale sotto forma di tabelle (flat files) e di validarli;

2. preparazione e “stoccaggio” dati: livello che fornisce i dati agli utenti e alle applicazioni analitiche;
3. interpretazione e analisi dati: livello, ad elevato valore aggiunto, che presiede alla trasformazione dei dati in informazioni aventi valore strategico;
4. presentazione dati: livello che presiede alla presentazione finale agli utenti delle informazioni e quindi delle risposte cercate.

Architettura Data Warehouse (DW) in informatica

Come già detto, il data warehouse è un sistema periferico, cioè non risiede fisicamente sul sistema informativo centrale. Il motivo di ciò va ricercato nel tipo di attività svolto: mentre un sistema informativo è maggiormente orientato all’esecuzione costante di operazioni di aggiornamento, una piattaforma di supporto alle decisioni, invece, deve essere ottimizza ta per effettuare un numero limitato di query particolarmente complesse.

Un data warehouse comprende diversi livelli di dati:
1. Dati attuali di dettaglio: sono i dati al massimo livello di dettaglio che si ritiene possa essere utile ai processi decisionali, sulla base delle esigenze note e di quelle ragionevolmente prevedibili. In realtà, questa parte comprende non solo i dati propriamente attuali (cioè validi al momento dell’interrogazione), ma anche una certa finestra temporale di dati storici.
2. Dati storici di dettaglio: i dati di dettaglio che superano la finestra temporale del dato attuale ma che rientrano comunque nella finestra temporale del data warehouse vengono collocati su supporti meno impegnativi e costosi, ma anche accessibili meno comodamente.
3. Dati aggregati: la presenza dei dati aggregati nel data warehouse deriva da considerazioni di efficienza e praticità nella risposta alle richieste degli utenti; infatti tutte le informazioni ricavabili dai dati aggregati sono in teoria ricavabili dai dati di dettaglio, ma ciò richiederebbe di volta in volta il loro ricalcolo. In questo modo, però, non potranno essere soddisfatte esigenze non previste che richiedano aggregazioni diverse da quelle predisposte, ma a questo scopo sono comunque conservati i dati di dettaglio.

 

Precedente Architettura software di un Decision Support System (DSS) Successivo Definizione e Caratteristiche di un OLAP (On-Line Analytical Processing) in informatica

Lascia un commento

*