Introduzione al Machine Learning

Nell’ambito dell’intelligenza artificiale il cosiddetto “Machine Learning” (ML) include metodi per apprendimento dei modelli di predizione ed analisi. In questo corso viene introdotto il concetto di modello e di machine learning in ambito dell’analisi di dati geospaziali, in particolare immagini e nuvole di punti da laser scanner. Il discente apprenderà come utilizzare degli strumenti per classificare punti e pixel in funzione di esempi per l’apprendimento del modello, ed anche come applicare questi strumenti per la regressione, ovvero eseguire stime di variabili continue utilizzando fattori predittivi.

PRIMA GIORNATA

Mattina 9:00–13:00 - Introduzione e terminologia (predittori, vettori, osservazioni, tensori…) - Semplici esempi teorici dei CART (classification and regression trees) - Come impostare un sistema con RStudio e R-CRAN per iniziare un progetto dedicato a classificare con ML - Pacchetti R CRAN dedicati al ML (CART, H2O, rMiner, tidymodels )

Pomeriggio 14:00–18:00 - Impostare un progetto in RStudio - Caricare i pacchetti necessari - installazione avanzata per calcolo distribuito parallelo e cluster - Importare e trasformare i dati, in particolare “GEO” (“data cube” da immagine da satellite + nuvola di punti di un rilievo LiDAR in ambito urbano) - Come inserire dati “con etichette” per l’apprendimento dell’algoritmo di ML - utilizzo GIS (QGIS) e CloudCompare per ottenere dati di esempio per l’apprendimento

SECONDA GIORNATA

Mattina 9:00–13:00 - Fase di divisione del dato in sotto-insiemi per le fasi di addestramento (trianing), validazione e test - Creazione del modello con osservazioni usando algoritmi diversi - Random Forest, Support Vector Machine, Stacked Ensembles - Utilizzo del modello per la predizione - Creazione del prodotto finale classificato

Pomeriggio 14:00–18:00 - Esempio di regressione / classificazione per dati quantitativi, quantitativi, ordinali e non - Metriche per la verifica dell’accuratezza e degli errori - Interpretazione di una matrice di confusione, precisione e sensibilità del modello, f-score, curve ROC - Interpretare il modello, definizione del grado di importanza (peso) delle variabili di predizione, effetto dello scartare/includere le variabili - Replicabilità del modello, limiti del ML (dove NON funziona bene?) e campi di applicazione.