Che cos’è la ridondanza dei dati in informatica

Ridondanza dei dati

In informatica, la ridondanza dei dati (in inglese data redundancy) è una condizione creata all’interno di un database o di una tecnologia di archiviazione dei dati in cui lo stesso pezzo di dati è conservato in due luoghi separati.
Ciò può significare due campi diversi all’interno di un singolo database o due punti diversi in più ambienti o piattaforme software. Ogni volta che i dati vengono ripetuti, ciò costituisce fondamentalmente ridondanza dei dati. Ciò può accadere per caso, ma viene anche deliberatamente eseguito a scopo di backup e ripristino.

A tal proposito però, la ridondanza dei dati produce mancanza di efficienza nella gestione e nell’occupazione della memoria, e ciò può causare anche inconsistenza dei dati per i seguenti motivi:

lo stesso dato può essere memorizzato in più archivi con nomi diversi, complicando il lavoro del gestore degli archivi, aumentando la possibilità di errore e producendo incertezza su quale sia la versione corretta;
a volte dati uguali sono memorizzati con formati diversi pertanto possono essere incongruenti tra loro in relazione alle operazioni che su di essi si devono eseguire.

A livello di applicazioni la gestione degli archivi è dipendente dai linguaggi di programmazione con i quali questi sono stati creati e spesso l’aggiornamento dei dati provoca la riscrittura dell’intero programma che li gestisce.
Un sistema informatico che presenta strutture dati con queste problematiche non è sicuramente efficiente per un’azienda che vuole essere competitiva sul mercato e ricerca l’efficacia delle procedure di gestione e di amministrazione. Questa situazione ha portato alla creazione di nuove strutture per la memorizzazione dei dati aziendali, in grado di superare i limiti descritti. Tali strutture, attualmente utilizzate in ogni sistema informatico, sono le basi di dati.

Che cos'è la ridondanza dei dati in informatica

Basi di dati

Le basi di dati (database) hanno permesso di superare i limiti degli archivi tradizionali e di analizzare la realtà in modo efficiente ed efficace.
Una base di dati è un insieme di archivi logicamente correlati, che permettono di raccogliere le informazioni relative a una certa realtà, sono condivisibili da più utenti e utilizzabili da diverse applicazioni.

La definizione evidenzia immediatamente gli aspetti innovativi rispetto al passato:

correlazione: i dati sono collegati logicamente da relazioni per evitare la loro duplicazione in archivi diversi;
condivisibilità: i dati sono accessibili da utenti diversi secondo le necessità di utilizzo; ogni utente deve poter accedere solo alla parte che gli interessa della base di dati, senza l’obbligo di accedere alla totalità dei dati; i dati sono anche fruibili da applicazioni diverse nello stesso momento.