Nella settimana in cui si svolge la ICLR (International Conference on Learning Representations), la più prestigiosa conferenza internazionale sul deep learning, l'azienda inglese di intelligenza artificiale Deepmind mette in copertina sul proprio blog un lavoro svolto in collaborazione con due ricercatori di Intelligenza Artificiale del Dipartimento di Informatica dell’Università di Pisa, Danilo Numeroso (dottorando in Informatica e primo autore del lavoro) e Davide Bacciu (professore associato). L’articolo scientifico verrà presentato mercoledì 3 maggio a Kigali, Ruanda, sede dell’edizione 2023 della conferenza.
Da sinistra: Danilo Numeroso e Davide Bacciu.
“Il lavoro nasce dalla passione per le reti neurali per grafi che ci accomuna a Petar Veličković, Staff Research Scientist di Deepmind e co-autore dell’articolo – spiega Bacciu – “Petar, dopo un dottorato di ricerca a Cambridge, si è affermato come uno dei più importanti ricercatori di quest’area, con un interesse particolare per il ragionamento algoritmico neurale. Si tratta di una linea di ricerca che studia come addestrare le reti neurali a replicare l’esecuzione di algoritmi classici per grafi, come ad esempio nel problema dei cammini di minimo costo tra nodi. È un po’ come se volessimo trasferire alle reti neurali le conoscenze del primo insegnamento di Algoritmica che tutti gli studenti e le studentesse di Informatica si trovano ad affrontare all’inizio del proprio percorso di studi. Ovviamente – continua Bacciu – l’obiettivo non è quello di sostituire l’esperta o l’esperto informatico. Piuttosto, cerchiamo di trasferire ai modelli neurali conoscenze informatiche di base, nella speranza che possano essere utili per facilitare la risoluzione di problemi più complessi, per i quali manchiamo di soluzioni algoritmiche efficienti.”
“Ed è un po’ quello che cerchiamo di provare nel nostro articolo” – prosegue Numeroso – “dove mostriamo come una rete neurale addestrata a risolvere semplici problemi di algoritmica su grafi “giocattolo”, diventi molto brava nel risolvere compiti complessi su grafi “reali”. In particolare, proponiamo un’interessante applicazione bioinformatica relativa alla categorizzazione di reti di vasi sanguigni, rappresentati mediante grafi con decine di milioni di nodi, risolvendo il problema con una rete neurale algoritmica addestrata su grafi sintetici con poche centinaia di nodi. Per fare questo sfruttiamo un’interessante struttura matematica che caratterizza i problemi di ottimizzazione su grafi su cui il modello neurale è allenato, nota come dualità. Semplificando, mostriamo come una rete addestrata a risolvere problemi differenti, ma complementari, sia più robusta e accurata di un modello equivalente allenato su un singolo problema.”
“Questi risultati – conclude Bacciu - dimostrano che la via dell’integrazione tra capacità di apprendimento, ragionamento algoritmico e conoscenza della struttura del problema di ottimizzazione, abbia un enorme potenziale per lo sviluppo di una nuova generazione di modelli intelligenti in grado di imparare con maggiore facilità, e con superiori capacità di generalizzare quanto appreso a nuovi problemi.”
L’articolo scientifico originale è liberamente consultabile qui.