Cos’è e a cosa serve la Data Integration in informatica

Cos’è e a cosa serve la Data Integration in informatica

L’Integrazione dei Dati (Data Integration, DI) permette di combinare i dati provenienti da diverse sorgenti eterogenee per averne una visione unificata. La gestione dei dati (data management) disciplina nota come anche quella dell’integrazione dei dati (DI), ha subito un’impressionante espansione nell’ultimo decennio. Oggigiorno esistono molteplici tecniche utilizzate in diverse applicazioni e contesti aziendali che permettono di realizzare ciò. L’integrazione dei dati è un insieme di tecniche fra le quali ricordiamo l’ETL (Extract Transform Load), la più usata, la Data Federation, Database Replication, sincronizzazione dei dati e sorting.

Tutte queste tecniche sono sviluppate attraverso tools che permettono di accedere a database, ad applicazioni o a file per caricare ed estrarre le informazioni. Le soluzioni basate su queste tecniche richiedono l’implementazione di codice manuale, automatico o un mix tra le due.

L’integrazione dei dati è uno strumento estremamente importante, basti pensare al caso due società che necessitano di fondersi e che per questo hanno la necessità di riunire i loro sistemi informativi in un solo sistema informativo aziendale. Di solito il sistema da popolare con i dati provenienti dai due sistemi è un Data Warehouse (DW), perchè permette alle aziende di eseguire anche analisi statistiche migliori, sulla base dei dati gestionali memorizzati.

Cos'è e a cosa serve la Data Integration in informatica

Integrazione di Dati Tradizionali e Multimediali

I dati multimediali sono di natura differente rispetto ai dati tradizionali e logicamente risulterà esser diverso anche il modo di interrogazione. Per esempio il metodo per effettuare query su dati tradizionali si basa sulla verifica che alcuni record (che dovranno esser selezionati) soddisfino determinati vincoli imposti dall’utente, come per esempio l’uguaglianza, relazione di “maggiore, minore”, ecc… . Possiamo subito affermare che una ricerca effettuata basandoci sulle stesse modalità di esecuzione utilizzate su dati tradizionali non è utilizzabile su quelli multimediali: la ricerca esatta di feature in immagine non ha nessun significato in quanto le feature usualmente vengono paragonate fra loro usando funzioni di distanza. Quindi in questo contesto introdurremo il concetto di similarità, di funzione di distanza basata sulle nozioni matematiche di “spazio metrico”. La ricerca di similarità è diventata un punto fondamentale in molte aree di applicazione, per esempio nell’estrazione di informazioni da un contesto multimediale, data mining, pattern recognition, machine learning. Questo problema era stato originariamente analizzato dalla comunità della “geometria computazionale”, dove era conosciuto come “closest point”, “nearest neighbor” e “post office problem”. Attualmente la similarità ha catturato l’attenzione anche della comunità delle “basi di dati”, in quanto risolvere questo problema porterebbe ad un miglioramento dell’efficienza che è un elemento di interesse e necessità attuale, amplificata dall’aumento dei volumi di dati da analizzare.

L’obiettivo è quello di trattare dati multimediali e tradizionali in modo omogeneo, cioè offrendo all’utente un’interfaccia di query unica, in modo efficiente, cioè con performance comparabili a quelle dei sistemi di database tradizionali.

Precedente Leadership aziendale ed il ruolo del leader nelle aziende Successivo Che cos'è e come funziona il Test di Turing in informatica

Lascia un commento

*