Differenza, vantaggi e svantaggi tra Data Warehouse e Database unico centralizzato

Differenza, vantaggi e svantaggi tra Data Warehouse e Database unico centralizzato

Data Warehouse e Database unico centralizzato

Nella sua definizione più semplicistica, il Data Warehouse (acronimo DWH), viene definito in informatica come un archivio informatico contenente i dati di un’organizzazione. I DWH sono progettati per consentire di produrre facilmente relazioni ed analisi aziendali.
Il Data Warehouse è una collocazione di dati statistici integrati, organizzata per soggetti, che riguardano una serie di fatti accaduti nel tempo e finalizzata al recupero di informazioni a supporto di processi decisionali.

Differenza, vantaggi e svantaggi tra Data Warehouse e Database unico centralizzato
Data Warehouse vs Database unico centralizzato

Mentre i database operazionali appartengono ai sistemi informativi di supporto alle attività operative e registrano istante per istante le varie transizioni, i Data Warehouse appartengono ai sistemi di supporto alle attività direzionali e svolgono le seguenti operazioni:

  • raccolta dati provenienti da database operazionali o da altre fonti alternative.
  • elaborazione ed aggregazione dati.
  • classificazione degli stessi secondo criteri specifici.
  • aggiornamento dati rispetto degli istanti precisi.
  • organizzazione dati precedentemente elaborati e successiva aggregazione all’interno di specifici Data Mart.

I dati estratti dagli archivi transazionali vengono memorizzati internamente al data warehouse. Nel DWH l’accesso ai dati è consentito in sola lettura. Tali dati hanno una dimensione storica e sono riferiti a soggetti di business, possono essere memorizzati in un archivio centrale o in un data mart.
Il termine “Data Mart” identifica un Data Warehouse di dimensioni ridotte, specializzato per una particolare area di attività. Si pensi, ad esempio, al data mart per il marketing, in cui i dati filtrati dagli archivi transazionali sono memorizzati per consentire l’analisi della clientela. All’interno della banca dati generale possono quindi esistere più data mart, aventi finalità diverse e orientati a coprire diverse aree di business. I dati contenuti nel data warehouse possono essere aggregati e indicizzati per rispondere a specifiche necessità informative.
Va precisato che il data warehouse è l’unico database per tutti i dirigenti, i quali però sono ben diversi l’uno dall’altro e hanno esigenze distinte. Per questo motivo, spesso si scompone il DWH in porzioni più piccole, chiamate appunto Data Mart, più facilmente gestibili e da cui i motori di elaborazione possono estrarre dati in funzione dell’utente che li richiede.

Dal punto di vista pratico si tratta di una base dati separata rispetto al sistema gestionale, strutturata per contenere una replica parziale del sistema informativo aziendale in un formato che renda ottimale l’analisi delle informazioni. In una visione più generale, un DataWarehouse è un sistema costruito al solo scopo di aiutare le aziende a trasformare i molteplici dati presenti nei sistemi gestionali dell’azienda in informazioni effettivamente utili a supportare il processo decisionale.

Vantaggi del Database unico centralizzato:

  1. Patrimonio di dati unico e non frammentato.
  2. Limitate ridondanze e coerenza dei dati archiviati. Limiti:
  3. Problema dei diritti d’accesso al Database.
  4. Elevata complessità progettuale e di gestione.
  5. Un possibile malfunzionamento del sistema centrale rischia di bloccate l’intero sistema aziendale.

Negli ultimi anni il contesto nel quale si trovano a lavorare i manager interni alle aziende è divenuto sempre più complesso. Per la maggior parte delle imprese, la situazione di mercato cambia a velocità impensabili fino a pochi anni fa, con conseguente necessità di elaborare un numero crescente di informazioni in tempi sempre più stringenti.

Nel contempo si è osservato un contino aumento del numero di sistemi gestionali presenti, che se da un lato rendono disponibili molte informazioni utili, dall’altro allungano i tempi necessari alla loro estrazione e creano una potenziale molteplicità di definizioni, con conseguente sovraccarico degli uffici IT.

Il DataWarehouse è uno strumento che permette di rispondere a queste esigenze:

  1. Trasformare i dati in informazioni.
  2. Fornire informazioni giuste al momento giusto alle persone giuste.
  3. Integrazioni tra fonti di dati eterogenee.
  4. Elevata profondità storica e Indipendenza dai sistemi sorgente.
  5. Pulizia dei dati e Certificazione dei dati a tutti i livelli.
  6. Gestione per eccezioni dei processi aziendali.

Il gestionale ci permette di gestire l’azienda, il DataWarehouse ci permette di capire COME la stiamo gestendo.

Il processo di Data Warehousing deve essere supportato da strumenti e tecnologie che interrogano le basi di dati direzionali aziendali, sia di tipo relazionale si di tipo multidimensionale, e consentono l’elaborazione di dati secondo schemi e modelli, le Tecnologie OLAP. Nelle interrogazioni OLAP di un Data Warehouse o di un Data Mart le dimensioni di un indicatore sono assi di una matrice multidimensionale detta Ipercubo. Ogni lato dell’ipercubo rappresenta una dimensione e ogni sottocubo contiene dati aggregati di un certo indicatore o delle dimensioni considerate.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *