A cura di Marco Federico – Data Scientist

 

Si è trovato un paradigma, un approccio per cui il computer intercetta delle cose al posto dell’utente. Questo può avvenire in diversi modi; in particolare, è possibile distinguere tra vari tipi di apprendimento, che vengono di seguito elencati.  

  • Apprendimento Supervisionato. In questo ambito, si ha conoscenza dell’attributo target e ci si serve di tale conoscenza per costruire un modello predittivo. Idealmente, è come se fosse presente un esperto di dominio che, prima di avviare il processo di estrazione della conoscenza, ha aggiunto delle informazioni extra di cui ci si serve per costruire un modello predittivo. In questo caso, si parla di dati annotati. Il vantaggio è costituito dalla capacità di calcolare in maniera precisa l’errore che viene commesso dal modello, effettuando una differenza tra il valore che viene predetto e il “vero” valore che viene fornito. Questa informazione può essere sfruttata per poter quindi valutare le performance dell’algoritmo impiegato ed effettuare operazioni di tuning dei parametri per ottenere i risultati migliori, prefissando una opportuna metrica per misurare tali performance. 
  • Apprendimento non Supervisionato. Questo caso è caratterizzato dall’assenza dell’esperto di dominio e, di conseguenza, di conoscenze aggiuntive da poter utilizzare per poter misurare l’errore commesso dal modello tramite differenza. Un esempio di apprendimento non supervisionato è costituito dal clustering: si richiede di raggruppare un insieme di oggetti, basandosi sulla loro similarità. Non sarà più possibile valutare la performance del risultato nello stesso modo impiegato quando si considera l’apprendimento supervisionato; tuttavia, è possibile impiegare alcune metriche differenti per quantificare la bontà della configurazione ottenuta, facilitando il confronto con altre possibili soluzioni.
  • Apprendimento Semi Supervisionato. È anche possibile definire delle tecniche che si collocano a metà tra l’apprendimento supervisionato e non supervisionato. In questo caso, ci si riferisce a tecniche che sono in grado di sfruttare sia istanze annotate che non annotate. Un esempio è caratterizzato da problemi di clustering per i quali si introduce conoscenza dall’esterno o, ad esempio, dei vincoli che riguardano la necessità di associare o, equivalentemente, escludere degli oggetti a dei cluster specifici.
  • Apprendimento con rinforzo. Esistono situazioni in cui non è presente il supervisore e le informazioni ricevute dall’esterno sono qualitative, sotto forma di guadagno o penalità. Anche in questo caso, quindi, una misura precisa dell’errore non è calcolabile. Al suo posto, si utilizza il guadagno come una misura del grado di “positività” di una azione. È chiaro come l’obiettivo sia costituito dal massimizzare tale misura. Grazie a queste indicazioni, l’algoritmo è in grado di stabilire se la strada che sta percorrendo è corretta o se è necessario cambiare direzione. L’apprendimento con rinforzo è efficace soprattutto in ambienti molto dinamici. Si può anche ricordare la presenza del deep learning. In questo caso, si parla di modelli caratterizzati da un elevato grado di complessità per risolvere problemi estremamente complicati. Un esempio è costituito dall’utilizzo di un elevato numero di strati intermedi nell’ambito delle reti neurali, le quali cercano di replicare la struttura del cervello umano.