Progettazione e Architettura business intelligence (BI) in informatica

Progettazione e Architettura business intelligence (BI) in informatica

L’architettura di riferimento dei sistemi di Business Intelligence è articolata su tre livelli:

  1. I sistemi che producono e contengono dati elementari (sistemi alimentanti)
  2. I sistemi per l’integrazione e l’archiviazione dei dati semilavorati (sistemi di Datawarehouse)
  3. I sistemi per l’accesso ai dati e la produzione di informazioni “finite” (sistemi di Business Intelligence).

I sistemi di origine dei dati elementari, o sistemi alimentanti, sono costituiti dai sistemi gestionali e amministrativo-contabili di tipo ERP o tradizionali, dai sistemi che interfacciano il mercato (sistemi di CRM), dai sistemi web (portali, e-commerce, siti informativi) e da tutti gli altri Sistemi Informativi formali di tipo operativo e/o transazionali.

I dati elementari contenuti in questi sistemi sono poi estratti, ripuliti per eliminare eventuali inconsistenze e incongruenze e completare eventuali parti mancanti, arricchiti con dati aggiuntivi utili per il processo di controllo, analisi e di supporto alle decisioni del management aziendale, e infine caricati nel Data warehouse (DW). In questo processo di alimentazione del DW assumono un ruolo fondamentale gli strumenti di extraction, transformation e loading (i cosiddetti ETL tool) che svolgono le operazioni di estrazione, pulitura, trasformazione, caricamento dei dati nel Datawarehouse.

Il secondo livello dall’architettura è costituito dai sistemi di Datawarehouse che rappresentano l’anello di collegamento tra i dati, le applicazioni e i sistemi informativi di tipo operativo e transazionale, e i sistemi informativi manageriali di supporto alle attività di controllo e di decisione. Il Datawarehouse può essere definito come una base di dati subject oriented, integrati, storicizzati, di qualità e non volatili, organizzata per essere la sola fonte di verità per tutte le applicazioni di Business Intelligence.

Gli aspetti peculiari del DW, come accennato sopra, sono:

  • Orientato all’oggetto di indagine (subject oriented) nel senso che include tutti i dati che possono essere utilizzati nel processo di controllo e di decisione, raggruppandoli per aree, fatti o temi di interesse e finalizzandoli a chi li utilizza e non a chi li genera
  • Integrato, cioè consistente rispetto a un modello concettuale dei dati, al glossario aziendale e rispetto alle unità di misura e alle strutture di codifica condivise a livello aziendale.
    In altri termini il DW riconcilia i dati aziendali in un unico ambiente di analisi eliminando le eterogeneità delle diverse rappresentazioni quali nomi, codifica e rappresentazione multipla
  • Storicizzato (variante nel tempo), ossia i dati in esso sono costituiti da “fotografie” (snapshot) periodiche dei fatti correnti o storici con un orizzonte temporale storico anche di 2-5 anni
  • Non volatile, nel senso che il dato viene caricato periodicamente fuori linea, cioè una volta memorizzato correttamente può essere acceduto, ma non modificato, dall’utente.

Il patrimonio di dati viene immagazzinato quindi in grandi “magazzini dati”, aperti e flessibili, in modo tale da poterli consultare con facilità.
Questi dati devono essere “semanticamente corretti” (non devono cioè esistere dati diversi identificati con lo stesso nome), rilevati e calcolati con criteri omogenei nel tempo (cioè invariati nel tempo per poter confrontare i dati passati con i dati correnti) e nello spazio (cioè uguali nelle diverse funzioni, divisioni, unità operative, magazzini o filiali dell’azienda).
Per ottenere ciò deve esserci un catalogo dati che riassuma il significato preciso di ogni dato, le sue modalità di calcolo e la sua certificazione in termini di fonte di origine e allineamento rispetto ad essa, di proprietà del dato e di omogeneità.

Il catalogo dati contiene, dunque, dati che descrivono altri dati, i cosiddetti metadati. Il metadato, che è per definizione un magazzino di informazioni sui dati, definisce:

  • Regole di trasformazione
  • Valori dei domini
  • Frequenza di aggiornamento
  • Chi può accedervi
  • Fonte

Datawarehouse su più livelli (Rappresentazione Multidimensionale)

I sistemi di Datawarehouse possono essere articolati su più livelli, soprattutto per poter gestire e far convivere al meglio l’ampiezza (numero dei fenomeni/fatti descritti nel DW) e la profondità (numero delle analisi/viste fattibili e dettaglio massimo dei dati disponibili al livello più basso del DW). La frequente necessità, infatti, di avere a disposizione dati di dettaglio differente induce a progettare architetture di dati su più livelli e con tecnologie differenti: mentre i dati di sintesi sono spesso precalcolati e memorizzati in database multidimensionali, i dati di dettaglio sono più spesso memorizzati in database relazionali a un livello inferiore dall’architettura dati.

L’architettura dati può essere, quindi, costruita in modo da non accedere direttamente al DW ma ai cosiddetti DataMart, definiti come “magazzini” di dati a livello dipartimentale.
Il DataMart è fisicamente realizzato come un Datawarehouse, ma con una finalità più ristretta:

  • I dati coprono solo alcune aree aziendali
  • Minori costi di realizzazione
  • Risultati più vicini nel tempo.

I DataMart si posizionano tra il DW, che li alimenta, e i sistemi di Business Intelligence e permettono di ottenere prestazioni migliori essendo dimensionalmente inferiori al DW e particolarmente personalizzati rispetto alle analisi di uno specifico gruppo di utenti.

Il DW si suddivide quindi su due livelli e utilizza due logiche:

  1. Relazionale: modello logico di rappresentazione dei dati implementato su sistemi di gestione di basi di dati (DBMS). L’assunto fondamentale del modello relazionale è che tutti i dati sono rappresentati come relazioni.
  2. Multidimensionale: l’informazione contenuta in un Datawarehouse, espressa in termini di dimensioni e misure (Modello Dimensionale), può essere rappresentata mediante un insieme di cubi, le cui “celle” contengono le misure e le cui dimensioni sono proprio le dimensioni di analisi.

Le misure (o fatti) del cubo sono informazioni numeriche che rappresentano in modo quantitativo i fenomeni di interesse aziendale e racchiudono in sé dei valori espressi secondo unità di misure precise. Si distinguono tipicamente in:

  • Elementari: misure ricavate direttamente dai sistemi alimentanti
  • Derivati: misure il cui calcolo è responsabilità del sistema direzionale. Possono essere di varia natura:
  • Contabili: variabili di tipo economico (ricavi, costi…)
  • Fisici: misure di volumi corrispondenti alle entità contabili (unità, volumi…)
  • Scale di giudizio: tipico delle misure ricavate.

Le dimensioni di analisi, invece, rappresentano le chiavi di lettura ritenute significative per l’analisi delle misure. Ogni misura o fatto può riferirsi a molteplici dimensioni. (Tempo, Prodotto, Cliente…) Si definiscono attributi le caratteristiche descrittive della dimensione .
Ogni dimensione di analisi può essere caratterizzata da una o più relazioni gerarchiche tra i propri attributi.

L’ultimo livello dell’architettura è rappresentato dai sistemi di Business Intelligence che permettono la ricerca intelligente di dati e la produzione e analisi in “tempo reale” di informazioni per il supporto a attività di controllo e di decisione di manager e professional (i cosiddetti knowledge information workers) di qualunque livello aziendale.

Questi sistemi permettono quindi agli utenti di “crearsi” le informazioni di cui hanno bisogno nel rispetto dei propri tempi decisionali e quindi in tempo utile per osservare un fenomeno aziendale, per analizzare un problema emerso, per la presa delle decisioni di azione.
I sistemi di analisi e previsione sono:

  1. Reporting
  2. On-Line Analytical Processing (OLAP)
  3. Simulazioni e previsioni
  4. Data Mining.

Progettazione e Architettura business intelligence (BI) in informatica
Progettazione e Architettura business intelligence (BI) in informatica

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *