Definizione, tecnologie e tipologie di data replication

Definizione, tecnologie e tipologie di data replication

Tecnologie di data replication

Le informazioni rappresentano un patrimonio di estrema importanza per le organizzazioni. Fra le varie strategie viste nei paragrafi precedenti, si è parlato, infatti, di varie tecniche di backup, le quali sono essenziali per mantenere in vita i dati, anche nel caso in cui i dischi, i contenitori di questi dati, siano resi indisponibili da danni imprevisti.

La tecnica di replica consente di ottenere un database secondario, speculare a quello originale, in cui i dati sono memorizzati in modo permanente, solo se i dati sono stati scritti su entrambi i siti. In caso di disastro le operazioni sul sito di DR possono essere riavviate in modo molto rapido, con RTO e RPO modici. Il limite di questa tecnica è dato dal fatto che spesso l’applicazione che effettua la replica è incapace di gestire il ritardo di propagazione dei dati, a causa del vincolo fisico, dovuto ai collegameti esistenti fra i due database. L’efficacia, nella propagazione dei dati, diminuisce quando si ha una distanza di circa 50/150Km. La replica sincrona purtroppo è limitata dalla incapacità dell’applicazione di gestire l’impatto del ritardo di propagazione (si tratta quindi di un vincolo fisico, e non tecnologico) sulle prestazioni. In funzione della sensibilità dell’applicazione e della tecnologia di comunicazione tra i due siti, l’efficacia della copia sincrona inizia a diminuire a una distanza di circa variabile tra i 50 Km e i 150 Km.

Definizione, tecnologie e tipologie di data replication

Al momento attuale esistono diversi tool di replica, che permettono di effettuare in modo differente lo storage dei dati, anche in remoto. I tool di replica esistenti sono i seguenti:

  1. Array Based;
  2. Host Based;
  3. Appliance Based.

Tecnologie Array Based

L’Array Based è un tipo di replica che non coinvolge in alcun modo il server nell’attività di copia dei dati, piuttosto la replica viene effettuata direttamente dai dispositivi hardware della SAN, per mezzo di controller presenti nel sottosistema, connessi direttamente all’area di storage. Il collegamento fra sistemi di storage è realizzato in fibra ottica, con prestazioni di trasferimento dati molto elevate e bassa latenza. La replica di dati impone comunque l’uso di convertitori FC/IP7 che permettono il trasporto dei dati attraverso la WAN.
È utile usare un simile tool, quando è necessario replicare una grossa quantità di dati con un impatto minimo o nullo sull’applicazione, e quando si dispone di storage omogeneo.

Il problema di questo tipo di tecnologia è dato dal fatto che i sottosistemi di storage sono vincolati dal fatto che i dispositivi devono essere prodotti dallo stesso fornitore e in alcuni casi devono appartenere alla stessa famiglia di prodotti.

Host based

L’Host based è un tipo di replica realizzato mediante software specifici, presenti sul server applicativo, in grado di intercettare le operazioni di I/O e di inviarle ad un server remoto . Da quanto detto si evince che questa tecnica è fortemente dipendente dal sistema operativo e può fare registrare un overhead consistente sul server. È una soluzione flessibile, in quanto il software utilizzato è indipendente dai dispositivi di storage usati, con la conseguente possibilità di scegliere qualsiasi periferica di memoria che si vuole utilizzare.

La tecnologia in esame è utile soprattutto quando si vuole utilizzare dello storage eterogeneo, ovvero quando si devono gestire dati con formati differenti. Quando il numero di server applicativi coinvolti è relativamente basso, la soluzione host based si presenta molto favorevole, perchè permette di ridurre il costi in modo notevole. Se tuttavia tale numero cresce, dal momento che il possesso di licenze significa anche un dispendio monetario non indifferente, il costo si moltiplica in modo crescente.

Appliance based

L’Appliance based è un tipo di tecnologia in grado di supportare tutti I tipi di replica. Qui, tutta l’intelligence necessaria per compiere la replica è inserita in un appliance, locata nella periferica I/O che collega host e area di storage: normalmente risiede cioè in una SAN. I vantaggi sono dati dal fatto che non esiste overhead sul server applicativo e le applicazioni che risiedono su quest’ultimo non sono a conoscenza dell’esistenza dell’appliance e non sanno neanche che sta avvenendo una replica. La gestione della copia è centralizzata totalmente sull’appliance e ogni sistema operativo supportato da essa può utilizzare le features di replica.
Per una soluzione di alta affidabilità dovrebbero essere previste al minimo due appliance sul sito locale configurate in modalità di failover, ovvero tale per cui se una fallisce la gestione viene passata all’altra.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *