Che cos’è la ridondanza dei dati in informatica
Ridondanza dei dati
In informatica, la ridondanza dei dati (in inglese data redundancy) è una condizione creata all’interno di un database o di una tecnologia di archiviazione dei dati in cui lo stesso pezzo di dati è conservato in due luoghi separati.
Ciò può significare due campi diversi all’interno di un singolo database o due punti diversi in più ambienti o piattaforme software. Ogni volta che i dati vengono ripetuti, ciò costituisce fondamentalmente ridondanza dei dati. Ciò può accadere per caso, ma viene anche deliberatamente eseguito a scopo di backup e ripristino.
A tal proposito però, la ridondanza dei dati produce mancanza di efficienza nella gestione e nell’occupazione della memoria, e ciò può causare anche inconsistenza dei dati per i seguenti motivi:
- lo stesso dato può essere memorizzato in più archivi con nomi diversi, complicando il lavoro del gestore degli archivi, aumentando la possibilità di errore e producendo incertezza su quale sia la versione corretta;
- a volte dati uguali sono memorizzati con formati diversi pertanto possono essere incongruenti tra loro in relazione alle operazioni che su di essi si devono eseguire.
A livello di applicazioni la gestione degli archivi è dipendente dai linguaggi di programmazione con i quali questi sono stati creati e spesso l’aggiornamento dei dati provoca la riscrittura dell’intero programma che li gestisce.
Un sistema informatico che presenta strutture dati con queste problematiche non è sicuramente efficiente per un’azienda che vuole essere competitiva sul mercato e ricerca l’efficacia delle procedure di gestione e di amministrazione. Questa situazione ha portato alla creazione di nuove strutture per la memorizzazione dei dati aziendali, in grado di superare i limiti descritti. Tali strutture, attualmente utilizzate in ogni sistema informatico, sono le basi di dati.
Basi di dati
Le basi di dati (database) hanno permesso di superare i limiti degli archivi tradizionali e di analizzare la realtà in modo efficiente ed efficace.
Una base di dati è un insieme di archivi logicamente correlati, che permettono di raccogliere le informazioni relative a una certa realtà, sono condivisibili da più utenti e utilizzabili da diverse applicazioni.
La definizione evidenzia immediatamente gli aspetti innovativi rispetto al passato:
- correlazione: i dati sono collegati logicamente da relazioni per evitare la loro duplicazione in archivi diversi;
- condivisibilità: i dati sono accessibili da utenti diversi secondo le necessità di utilizzo; ogni utente deve poter accedere solo alla parte che gli interessa della base di dati, senza l’obbligo di accedere alla totalità dei dati; i dati sono anche fruibili da applicazioni diverse nello stesso momento.