Differenza tra Apprendimento supervisionato, non supervisionato e con rinforzo

Il machine learning presenta profondi legami col campo dell’ottimizzazione matematica, il quale fornisce metodi, teorie e domini di applicazione. Molti problemi di apprendimento automatico, infatti, sono formulati come problemi di minimizzazione di una certa funzione di perdita (loss function) nei confronti di un determinato set di esempi (training set). Questa funzione esprime la discrepanza tra i valori predetti dal modello in fase di allenamento e i valori attesi per ciascuna istanza di esempio. L’obiettivo finale è dunque quello di insegnare al modello la capacità di predire correttamente i valori attesi su un set di istanze non presenti nel training set (test set) mediante la minimizzazione della loss function in questo insieme di istanze. Questo porta ad una maggiore generalizzazione delle capacità di predizione.

I diversi task del machine learning sono tipicamente classificati in tre ampie categorie, caratterizzate dal tipo di feedback su cui si basa il sistema di apprendimento:

Apprendimento supervisionato: vengono presentati al computer degli input di esempio ed i relativi output desiderati, con lo scopo di apprendere una regola generale in grado di mappare gli input negli output. Questo scenario è quello di interesse per il lavoro di questa tesi;
Apprendimento non supervisionato: al computer vengono forniti solo dei dati in input, senza alcun output atteso, con lo scopo di apprendere una qualche struttura nei dati d’ingresso. L’apprendimento non supervisionato può rappresentare un obiettivo a se stante (ad esempio per la scoperta di pattern nascosti nei dati) o essere rivolto all’estrapolazione di caratteristiche salienti dei dati (feature) utili per l’esecuzione di un altro task di machine learning;
Apprendimento con rinforzo: il computer interagisce con un ambiente dinamico nel quale deve raggiungere un certo obiettivo (ad esempio, guidare un’automobile o affrontare un avversario in un gioco). Man mano che il computer esplora il dominio del problema, gli vengono forniti dei feedback in termini di ricompense o punizioni, in modo da indirizzarlo verso la soluzione migliore.

Un altro metro di giudizio secondo il quale è possibile distinguere diverse categorie di task è il tipo di output atteso da un certo sistema di machine learning. Tra le principali categorie troviamo:

La classificazione, nella quale gli input sono divisi in due o più classi e il sistema di apprendimento deve produrre un modello in grado di assegnare ad un input una o più classi tra quelle disponibili. Questi tipi di task sono tipicamente affrontati mediante tecniche di apprendimento supervisionato. Un esempio di classificazione è l’assegnamento di una o più etichette ad una immagine in base agli oggetti o soggetti contenuti in essa;
La regressione, concettualmente simile alla classificazione con la differenza che l’output ha un dominio continuo e non discreto. Anch’essa è tipicamente affrontata con l’apprendimento supervisionato. Un esempio di regressione è rappresentato dal task che viene affrontato in questa tesi, ovvero la stima della profondità di una scena a partire dalla sua rappresentazione sotto forma di immagine a colori. Infatti, il dominio dell’output in questione è virtualmente infinito, e non limitato ad un certo insieme discreto di possibilità;
Il clustering, nel quale, come nella classificazione, un insieme di dati viene diviso in gruppi che però, a differenza di questa, non sono noti a priori. La natura stessa dei problemi appartenenti a questa categoria li rende tipicamente dei task di apprendimento non supervisionato.