Il progetto "Federated Learning in Dynamic and Heterogeneous Environments" rappresenta un avanzamento significativo nella ricerca sul Federated Learning, sviluppato in collaborazione con l'Ospedale Pediatrico Bambino Gesù (IRCCS) e l'Università delle Camere di Commercio Italiane (Universitas Mercatorum).
L’iniziativa nasce all’interno del corso di dottorato in "Big Data e Intelligenza Artificiale", da me frequentato ed erogato dall'Università delle Camere di Commercio Italiane. L’Ospedale Pediatrico Bambino Gesù (IRCCS), presso il quale lavoro da 25 anni nella Funzione Sistemi Informativi, ha colto l’opportunità di fornirmi un incarico di ricerca presso l’Unità di Ricerca Medicina Preventiva e Predittiva.
FOCUS 1
Il progetto, si basa sulla mia attuale ricerca inerente il Federated Learning, progressivamente affinata durante i tre anni di dottorato, ed approfondisce la gestione dell'eterogeneità dei client partecipanti al processo di apprendimento, in un ambiente distribuito.
Tale eterogeneità riguarda:
- Eterogeneità statistica: differenze nella distribuzione dei dati.
- Eterogeneità del modello: differenze nelle architetture dei modelli.
- Eterogeneità delle comunicazioni: differenze nelle topologie di rete.
- Eterogeneità dei dispositivi: differenze nelle caratteristiche hardware e computazionali.
FOCUS 2
Lo studio affronta anche la gestione della dinamicità dei partecipanti, da cui la necessità di adattabilità del processo globale di apprendimento alle condizioni dinamiche del sistema distribuito.
La gestione delle dinamiche dei partecipanti riguarda:
- disponibilità intermittente (dei partecipanti attivi)
- volatilità nella composizione (dei partecipanti attivi)
- distorsione nella rappresentatività (da parte dei client nei confronti dell'intera popolazione di riferimento)
- dati
- caratteristiche computazionali
Questi aspetti enfatizzano l’importanza di soluzioni adattive per garantire la robustezza del processo di apprendimento in un contesto distribuito in continua evoluzione.
ANNEX
La ricerca estende il suo ambito oltre lo studio di pool di partecipanti dinamici, sviluppandosi lungo tre aspetti fondamentali:
- analisi delle dinamiche temporali (temporal dynamics)
con particolare attenzione all'impatto che la disponibilità variabile dei partecipanti esercita sulla convergenza e sulla stabilità del modello;
- sviluppo di meccanismi di aggregazione adattivi
sufficientemente robusti per gestire pool di partecipanti in continua evoluzione;
- implementazione di strategie di apprendimento continuo
specificamente progettate per gestire l'evoluzione del fenomeno delle distribuzioni dei dati nel tempo (distributional drift).
Questi aspetti sono strettamente interconnessi e richiedono un approccio integrato che tenga conto simultaneamente delle dimensioni temporali, computazionali e statistiche del processo di apprendimento federato.