Differenza tra Data Warehouse e Database Relazionale in informatica

Differenza tra Data Warehouse e Database Relazionale in informatica

Lo strumento principale all’interno di una soluzione di Business Intelligence è rappresentato sicuramente dal data warehouse (DWH o DW).
Un data warehouse è un contenitore di dati storici integrati e consistenti, dotato di strumenti che consentono di estrarre facilmente informazioni attendibili di supporto al processo decisionale. Partendo dai dati organizzati e memorizzati all’interno del data warehouse è possibile attraverso le varie tecniche di esplorazione dati ottenere report e cruscotti utili a visualizzare informazioni interessanti e di rilievo.

Con il termine data warehousing si intende l’intero processo che estrae dal sistema informativo aziendale i dati di interesse, li trasforma, li integra e li ripulisce da errori e inconsistenze, li inserisce nel data warehouse per poi utilizzarli al fine di rispondere alle complesse interrogazioni di analisi e previsione formulate dagli utenti finali.

Il fenomeno del data warehousing nasce dall’enorme accumulo di dati registrato negli ultimi decenni e dalla pressante richiesta di utilizzare questa massa di informazioni per scopi che superino quelli, di routine, legati all’attività giornaliera.

Caratteristiche e differenze con database

Differenza tra Data Warehouse e Database Relazionale in informatica

Un data warehouse a differenza di una base dati operazionale dovrà avere delle caratteristiche e delle peculiarità diverse. Questa grande collezione di dati dovrà essere:

  1. Integrata: requisito fondamentale di un data warehouse è l’integrazione dei dati raccolti. Nel data warehouse confluiscono dati provenienti da più sistemi transazionali e da fonti esterne. L’obiettivo dell’integrazione può essere raggiunto percorrendo differenti strade: mediante l’utilizzo di metodi di codifica uniformi, mediante il perseguimento di una omogeneità semantica di tutte le variabili, mediante l’utilizzo delle stesse unità di misura;
  2. Orientata al soggetto: il DW è orientato a temi aziendali specifici piuttosto che alle applicazioni o alle funzioni. In un DW i dati vengono archiviati in modo da essere facilmente letti o elaborati dagli utenti. L’obiettivo, quindi, non è più quello di minimizzare la ridondanza mediante la normalizzazione, ma quello di fornire dati organizzati in modo tale da favorire la produzione di informazioni. Si passa dalla progettazione per funzioni ad una modellazione dei dati che consenta una visione multidimensionale degli stessi;
  3. Variabile nel tempo: i dati archiviati all’interno di un DW coprono un orizzonte temporale molto più esteso rispetto a quelli archiviati in un sistema operativo. Nel DW sono contenute una serie di informazioni relative alle aree di interesse che colgono la situazione relativa ad un determinato fenomeno in un determinato intervallo temporale piuttosto esteso. Ciò comporta che i dati contenuti in un DW siano aggiornati fino ad una certa data che, nella maggior parte dei casi, è antecedente a quella in cui l’utente interroga il sistema. Ciò differisce da quanto si verifica in un sistema transazionale, nel quale i dati corrispondono sempre ad una situazione aggiornata, solitamente incapace di fornire un quadro storico del fenomeno analizzato;
  4. Non volatile: tale caratteristica indica la non modificabilità dei dati contenuti nel DW che consente accessi in sola lettura. Ciò comporta una semplicità di progettazione del database rispetto a quella di un’applicazione transazionale. In tale contesto non si considerano le possibili anomalie dovute agli aggiornamenti, né tanto meno si ricorre a strumenti complessi per gestire l’integrità referenziale o per bloccare record a cui possono accedere altri utenti in fase di aggiornamento.

Il data warehouse, quindi, descrive il processo di acquisizione, trasformazione e distribuzione di informazioni presenti all’interno o all’esterno delle aziende come supporto ai manager e ai decisori.
Rispetto ai tradizionali database relazionali un data warehouse offre notevoli vantaggi in termini di prestazioni e risultati. Nella tabella qui seguito si elencano, infiene, le principali differenze che contraddistinguono un data warehouse da una base di dati relazionali:

Differenza tra Data Warehouse e Database
Differenza tra Data Warehouse e Database

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *