Differenza tra data mining supervisionato e non supervisionato

Differenza tra data mining supervisionato e non supervisionato

In informatica, il data mining fa uso di una varietà di metodi e algoritmi computazionali per lavorare sulla estrazione della conoscenza. La classificazione è forse la forma più elementare di analisi dei dati. Un’attività comune nel data mining è esaminare i dati in cui la classificazione è sconosciuta o si verificherà in futuro, con l’obiettivo di prevedere quale sia o sarà quella classificazione. Allo stesso modo, i dati in cui la classificazione è nota vengono utilizzati per sviluppare regole, che vengono poi applicate ai dati in cui la classificazione è sconosciuta. Detto questo, le tecniche di data mining si presentano in due forme principali: supervisionate e non supervisionate. In pratica, supervisionato è una tecnica predittiva mentre non supervisionato è una tecnica descrittiva. Sebbene entrambi gli algoritmi siano ampiamente utilizzati per eseguire diverse attività di data mining, è importante comprendere la differenza tra i due.

Data mining supervisionato

Il data mining supervisionato (in inglese Data Mining Supervised), come suggerisce il nome, si riferisce agli algoritmi di apprendimento utilizzati nella classificazione e nella previsione. L’algoritmo supervisionato apprende dai dati di addestramento che sono etichettati e l’attività è controllata dall’ingegnere della conoscenza e dal progettista del sistema. Con i dati supervisionati, dobbiamo avere input noti corrispondenti a output noti, come determinato dal dominioesperti. L’attività di data mining viene spesso definita apprendimento supervisionato perché le classi vengono determinate prima di esaminare i dati. Questa tecnica utilizza una funzione obiettivo (la variabile dipendente) e un insieme di elementi di dati che sono variabili indipendenti. La tecnica supervisionata tenta di identificare le relazioni tra variabili dipendenti e indipendenti, identificare il grado di correlazione per ciascun insieme di variabili e costruire un modello che mostri la rete delle dipendenze. Il modello viene quindi applicato ai dati per i quali il valore target è sconosciuto.

Data mining non supervisionato

A differenza della tecnica supervisionata, il data mining non supervisionato (in inglese Data Mining Unsupervised) non ha una funzione obiettivo predeterminata, né prevede un valore target. Le tecniche senza supervisione sono quelle in cui non vi è alcun risultatovariabile da prevedere o classificare. Quindi, non c’è apprendimento dai casi in cui una tale variabile di risultato è nota. L’algoritmo richiede che l’utente specifichi il numero di intervalli e quanti punti dati devono essere inclusi in un dato intervallo. Ti aiuta a identificare tutti i tipi di modelli sconosciuti nei dati. Il modello non supervisionato è anche chiamato modello descrittivo perché cerca modelli sconosciuti in un set di dati senza etichette predeterminate e con nessuna o minima supervisione umana. I metodi di apprendimento senza supervisione includono metodi di clustering, associazione ed estrazione. Questo tipo di tecnica di apprendimento viene utilizzato quando un obiettivo specifico non è disponibile o quando l’utente cerca di trovare relazioni nascoste nei dati.

Differenza tra data mining supervisionato e non supervisionato

 

Differenza tra data mining supervisionato e non supervisionato

L’apprendimento supervisionato ha il compito di data mining con algoritmi per sviluppare un modello su dati di input e output noti, il che significa che l’algoritmo apprende dai dati etichettati per prevedere il risultato dai dati di input. La tecnica supervisionata consiste semplicemente nell’imparare dal set di dati di addestramento. L’apprendimento non supervisionato, d’altra parte, è la tecnica di utilizzare algoritmi in cui non esiste una variabile di risultato da prevedere o classificare, il che significa che non c’è apprendimento da casi in cui tale variabile di risultato è nota.

In poche parole, il data mining supervisionato è una tecnica predittiva, mentre il data mining non supervisionato è una tecnica descrittiva. Le tecniche supervisionate vengono utilizzate quando è disponibile un obiettivo definito e l’utente cerca di determinare in che modo i cambiamenti nello stato dei dati influenzano il risultato. Il data mining non supervisionato, d’altra parte, inizia con una tabula rasa, il che significa che non ha una funzione obiettivo predefinita e l’utente tenta di trovare schemi sconosciuti o relazioni nascoste nei dati. L’obiettivo del data mining non supervisionato è trovare modelli nel set di dati in base alla relazione tra i punti dati stessi.

Obiettivi e applicazioni

La tecnica supervisionata tenta di identificare relazioni casuali tra variabili dipendenti e indipendenti, isolare il grado di correlazione per ogni insieme di variabili e sviluppare un modello che mostri la rete delle dipendenze. Il modello viene quindi applicato ai dati per i quali il valore target è sconosciuto. L’apprendimento non supervisionato cerca di identificare modelli sconosciuti in un set di dati senza etichette predeterminate e con nessuna o minima supervisione umana. L’obiettivo delle tecniche di data mining senza supervisione è trovare modelli nel set di dati in base alla relazione tra i punti dati stessi.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *