Caratteristiche e differenza tra sistemi ROLAP e MOLAP

Caratteristiche e differenza tra sistemi ROLAP e MOLAP

Modellazione logica

Mentre per la fase di modellazione concettuale non ci si deve preoccupare delle scelte che si dovranno fare durante la fase di modellazione logica, per quest’ultima non si può dire la stessa cosa. Sarà infatti in questa fase che si dovrà scegliere il DBMS da utilizzare durante la progettazione fisica. I dati soggetti ad analisi possono essere rappresentati secondo due modelli logici: quello relazionale, che dà luogo ai cosiddetti sistemi ROLAP (Relational OLAP), e quello multidimensionale, per il quale i sistemi utilizzati vengono detti MOLAP (Multidimensional OLAP).

Esiste anche una terza soluzione, intermedia alle due appena menzionate ed è il cosiddetto HOLAP (Hybrid OLAP).

Caratteristiche e differenza tra sistemi ROLAP e MOLAP

I sistemi ROLAP

Adottare una soluzione di questo genere implica il dover modellare i concetti multidimensionali osservati fin ora in elementi bidimensionali, ovvero le tabelle del modello relazionale. Una tale operazione viene effettuata mediante il cosiddetto star schema

Uno schema a stella è composto da:

  1. Un insieme di tabelle, chiamate tabelle delle dimensioni (dimension table). Ciascuna di queste tabelle è caratterizzata da una chiave primaria e da un insieme di attributi che descrivono le dimensioni di analisi a diversi livelli di aggregazione;
  2. Una tabella chiamata tabella dei fatti (fact table) in cui sono presenti le chiavi di tutte le tabelle delle dimensioni. La chiave primaria di questa tabella sarà data dall’insieme delle chiavi esterne delle dimension table. La tabella dei fatti contiene inoltre un attributo per ogni misura.

La visione multidimensionale si ottiene eseguendo il join tra la fact table e le dimension table.

I sistemi MOLAP

Nell’approccio MOLAP il data warehouse memorizza i dati usando strutture intrinsecamente multidimensionali: i dati vengono fisicamente memorizzati in vettori e l’accesso è di tipo posizionale. Il sistema alloca una cella per ogni possibile combinazione dei valori delle dimensioni e l’accesso ad un fatto avviene in modo diretto, sulla base delle coordinate fornite.
L’utilizzo di una tale soluzione rappresenta la soluzione naturale per un sistema di data warehousing e può fornire prestazioni ottimali, in quanto le operazioni di query multidimensionale non devono essere simulate mediante complesse istruzioni SQL. Il principale problema a cui però è soggetta la soluzione MOLAP, è la sparsità dei dati.

Mediamente in un cubo multidimensionale meno del 20% delle celle contiene effettivamente delle informazioni, mentre le restanti celle risultano essere vuote poich´e corrispondono ad eventi non accaduti. La memorizzazione di celle non informative provoca uno spreco dello spazio su disco.
Il fenomeno della sparsità dei dati viene affrontato partizionando il cubo n-dimensionale in questione, in piu’ sottocubi n-dimensionali che vengono detti chunk. Si parla di chunk densi, se la maggior parte delle celle contengono dati, chunk sparsi altrimenti. Un tale approccio permette di operare su blocchi di dati di dimensione inferiore e che quindi potranno essere caricati agevolmente in memoria.

Si osserva però che la memorizzazione diretta di chunk sparsi comporta un notevole spreco di spazio dovuto alla rappresentazione delle celle che non contengono informazioni. Per questo motivo i chunk sparsi vengono utilizzati mediante un indice che riporta l’offset delle sole celle che contengono informazioni.

Oltre al problema relativo allo spreco di memoria, un altro fattore debilitante per la diffusione dei sistemi MOLAP è costituito dalla mancanza di standard. I diversi strumenti disponibili sul mercato sono accomunati dai soli principi di base (come può essere la gestione della sparsità), mentre non si è a conoscenza dei dettagli implementativi. Non esiste infatti uno standard di interrogazione che svolga il ruolo che l’SQL svolge nei sistemi relazionali.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *