Analisi e Basi di dati in un contesto aziendale

Panoramica sugli archivi Archivi aziendali

La parola archivio è utilizzata in informatica ad indicare un insieme di dati aventi tutti la stessa struttura, chiamati spesso record, ognuno strutturato a sua volta in un insieme di campi elementari caratterizzati da un particolare valore. Ad esempio in un archivio anagrafico i record sono gli insiemi di dati relativi alle singole persone, i campi sono il nome, il cognome, il luogo e data di nascita, l’indirizzo, il CAP e il luogo di residenza. I valori che possono essere assunti dai campi appartengono a domini, quali gli interi, le stringhe di caratteri, i booleani.

Le informazioni rappresentate in un archivio possono essere organizzate in molti modi: ad esempio, ordinandole per cognome, ovvero per data di nascita. Si suole perciò distinguere negli archivi un aspetto che chiameremo concettuale, che descrive la natura delle informazioni rappresentate, ed un aspetto fisico, che descrive le modalità di rappresentazione. Secondo un’ altra coordinata, possiamo distinguere in un archivio un aspetto intensionale, che riguarda il significato delle informazioni rappresentate nell’archivio, indipendentemente dal loro valore (ad es. l’archivio PERSONE, l’archivio FORNITORI, il campo DATA-DI-NASCITA, il campo COGNOME), ed un aspetto estensionale, costituito dai valori rappresentati (‘PAOLO’, ‘ROMA, ‘7 giugno 1949’, ‘00134’). La parte intensionale non cambia nel tempo, mentre la parte estensionale è soggetta a continui aggio rnamenti, aggiunte, cancellazioni di informazioni.

Esempio

Nella nostra vita quotidiana accade spesso che le informazioni da noi gestite siano frammentate in diversi ‘contenitori’: agende, bollette, calendari, fogli sparsi. Ed è proprio tale frammentazione che pone talvolta vari problemi nella gestione delle informazioni. Se ad esempio teniamo due agende, una a casa e una al posto di lavoro, la variazione di un numero di telefono ci obbligherà a due diversi aggiornamenti.

Un analogo problema è sorto per le Amministrazioni statali, le imprese manifatturiere e produttrici di servizi, gli enti di credito, che hanno progressivamente utilizzato i sistemi informatici per automatizzare archivi di varia natura, iniziando dai dati operativi (ad esempio, i dati necessari alla produzione di un certificato richiesto da un cittadino in una anagrafe comunale) fino agli archivi utilizzati per esigenze di previsione e pianificazione (ad esempio, i dati sulle nascite e sulle morti in un dato intervallo di anni, necessari per prevedere lo sviluppo edilizio e le esigenze di istruzione).

La tecnologia disponibile ha incoraggiato inizialmente una automazione che possiamo definire “a pelle di leopardo”: ogni volta che nasceva una nuova esigenza, veniva realizzata una nuova applicazione (un insieme di programmi), e creati uno o più archivi utilizzati dalla applicazione. In questo modo (vedi un esempio nella figura seguente: il simbolo di cilindro è tradizionalmente utilizzato per rappresentare archivi) accade che le stesse informazioni possano essere rappresentate in diversi archivi, dando luogo a ridondanza di rappresentazione, rischi di incoerenze nelle diverse rappresentazioni della stessa informazione, e scarsa trasparenza da parte di un utente nella possibilità di utilizzare informazione prodotta da altri, essendo tale informazione sotto il diretto controllo del settore organizzativo che la ha originata.

Struttura di un insieme di archivi tradizionali

Basi di dati (Database)

Le basi di dati (o database DB) nascono proprio per dare una risposta a questi problemi. Una base di dati può essere definita come un insieme di archivi in cui ogni informazione di interesse viene rappresentata una sola volta, e acceduta da un insieme di applicazioni secondo criteri di riservatezza che sono stabiliti in modo centralizzato. La base di dati è dunque anzitutto un concetto organizzativo, prima ancora che tecnologico: integrare le informazioni aziendali in un unico contenitore logico significa aumentare la possibilità di circolazione delle informazioni e quindi integrare maggiormente la stessa organizzazione. Peraltro, è possibile fare questo in modo efficace solo disponendo di opportuni sistemi software di gestione, detti sistemi di gestione di basi di dati, o DBMS, Data Base Management System, sviluppati negli anni ’70 ed ’80, e ormai diventati di uso comune. Un sistema di gestione di basi di dati permette ai vari utenti di utilizzare in modo coordinato i dati memorizzati, per mezzo di linguaggi di manipolazione ed interrogazione efficienti e facili da utilizzare.

Schema della database e dati memorizzati

Anche in una base di dati, come in un insieme di archivi tradizionali, possiamo distinguere un aspetto intensionale, detto anche schema logico (o schema) della base di dati, ed un aspetto estensionale, costituito dai dati memorizzati. I sistemi software di gestione di basi di dati utilizzano per descrivere lo schema logico un insieme di modelli chiamati usualmente modelli logici: i più utilizzati sono stati nel passato il modello gerarchico, il modello reticolare e oggi il modello relazionale. Nelle figura seguente si riporta una stessa realtà di interesse rappresentata per mezzo dei modelli gerarchico e relazionale; la realtà che vogliamo rappresentare è quella delle librerie, che vendono libri, scritti da vari autori. I due modelli descrivono tale realtà nel seguente modo:

Nel modello gerarchico si distinguono due tipi di strutture di rappresentazione, i record e i legami logici tra record. I record hanno il significato già introdotto all’inizio del capitolo, sono cioè insiemi di campi; i legami logici descrivono le corrispondenze definite tra record. Nel nostro esempio, si hanno tre record, LIBRERIA, LIBRO, AUTORE, e due legami, uno tra LIBRERIA e LIBRO, che descrive per ogni libreria, i libri venduti, e l’altro tra LIBRO e AUTORE, che descrive per ogni libro, i suoi
Nel modello relazionale (modello più diffuso e usato) le informazioni di interesse sono raggruppate in relazioni, rappresentate in modo naturale da tabelle. Ogni relazione (LIBRERIA, LIBRO, ) è costituita da un insieme di attributi, che costituiscono i dati elementari rappresentabili (nel caso di LIBRERIA, PARTITA-IVA, NOME, INDIRIZZO). Le relazioni sono utilizzate uniformemente nel modello per rappresentare entrambe le strutture del modello gerarchico, i record e i legami logici. Ad esempio il record LIBRERIA del modello gerarchico è rappresentato con una relazione LIBRERIA nel modello relazionale (e gli attributi corris pondono esattamente ai campi), e l’insieme tra i record LIBRERIA e LIBRO è rappresentato con una seconda relazione DISPONIBILITÀ, in cui, come si vede, la corrispondenza tra ogni libreria ed i libri che presso di essa sono disponibili è rappresentata riportando nella relazione l’attributo NOME-LIBRERIA (che corrisponde a NOME nella relazione LIBRERIA) e l’attributo CODICE-LIBRO (che corrisponde a CODICE-L nella relazione LIBRO).