Ricercatore:
Settore scientifico disciplinare:
MAT/03 geometria
Biografia
- Anno 2007: Laurea magistrale in Matematica (110L), Universita' di Siena (Italia).
- Anno 2010: Ph.D. in Theoretical Computer Science, Universita' di Parigi 7 (Francia) ed Universita' di Siena (Italia) (cotutela di dottorato).
Durante il periodo di dottorato, ho studiato problemi relativi alla descrizione quantitativa di diverse classi di strutture combinatorie, come ad esempio permutazioni, insiemi parzialmente ordinati e poliomini, sulle quali strutture erano spesso posti vincoli di motivo escluso. Le tecniche utilizzate in questo ambito appartengono al campo della combinatoria enumerativa ed analitica [2]. In ambito informatico, tali metodi trovano applicazione nello studio della performance di algoritmi, in quanto permettono di effettuare un'analisi statistica degli insiemi di oggetti discreti che possono essere passati in input alla procedura che si intende analizzare [1]. L'analisi si basa sulla enumerazione degli input di dimensione N che forzano l'algoritmo ad avere un costo K. - Gennaio 2011-Luglio 2011: Postdoc al CNRS, Montpellier (Francia).
- Presso il laboratorio IES, abbiamo investigato attraverso simulazioni Monte Carlo il comportamento di particolari meccanismi laser, chiamati laser dual-mode a semiconduttori. I laser dual-mode sono componenti chiave per la costruzione a basso costo di dispositivi che generano frequenze terahertz. La tecnologia terahertz trova applicazioni in svariati settori della scienza, come il calcolo ad altissime prestazioni. Una volta implementati i programmi, numerose simulazioni Monte Carlo venivano distribuite sulla griglia di computers messa a disposizione dalla Universita' di Montpellier. Una volta raccolti i risultati, si studiava come differenti valori per i differenti parametri fisici dello strumento, come ad esempio la temperatura di esercizio, potevano influenzare il regime dual-mode alla base della generazione delle alte frequenze.
- Presso il laboratorio LIRMM, motivati da problematiche di carattere crittografico, abbiamo studiato problemi nel campo della teoria dei numeri. Piu' precisamente, abbiamo dimostrato alcune proprieta' asintotiche delle partizioni di interi considerate con criteri di divisibilita' sulle parti. - Luglio 2011 - Ottobre 2013 : Postdoc alla Universita' di Colonia (Germania).
Abbiamo concentrato le nostre ricerche sull'analisi combinatoria dei modelli usati per rappresentare fenomeni di speciazione e la distribuzione di diversita' genetica in una popolazione. Tali modelli sono basati su processi di biforcazione casuale in cui le relazioni di parentela tra specie o individui sono date da relazioni ad albero. Le differenti forze evolutive che possono influenzare i processi di speciazione determinano diverse caratteristiche nella struttura dell' albero, come, ad esempio, troviamo alberi che tendono ad essere piu' sbilanciati quando siamo in presenza di selezione naturale positiva. Il grado di deviazione di un insieme di dati genetici dal modello standard, nel quale non ci sono particolari forze biologiche in gioco, puo'essere quindi misurato osservando come la struttura combinatoria dell'albero viene modificata ed e' dunque importante caratterizzare quantitativamente tale struttura nel modello base. - Novembre 2013 - fino ad oggi: Postdoc alla Stanford University (CA, USA).
Usando metodi combinatori, abbiamo investigato proprieta' statistiche e computazionali di modelli matematici che servono per studiare la probabilita' di un albero di geni casuale condizionando sull'albero di specie. Gli alberi di geni vengono di solito derivati a partire da sequenze genetiche e forniscono informazioni sulla natura dei processi evolutivi intercorsi tra le varie specie. Infatti, usando algoritmi computazionalmente efficienti che permettano di stimare gli alberi di geni piu' probabili per un dato albero di specie, si possono utilizzare procedure di massima verosimiglianza per cercare nello spazio dei possibili alberi di specie quelli che massimizzano la probabilita' dei dati genetici osservati.
Bando:
RLM 2014
Titolo del progetto
Aspetti combinatori e computazionali dell' interazione tra alberi di specie ed alberi di geni
Descrizione del progetto
La necessita' di analizzare le grandi quantita' di dati genetici raccolti negli ultimi anni e' oggi in forte crescita. Lo studio di tali dati richiede l'uso di algoritmi efficienti per estrarre ed elaborare le informazioni che essi contengono. Il mio interesse di ricerca si colloca nell' ambito dell' analisi quantitativa delle strutture discrete e degli algoritmi usati in biologia computazionale per rappresentare e processare i dati.
Durante il postdottorato a Stanford, ho studiato le relazioni quantitative esistenti tra alberi di specie (rappresentanti i processi evolutivi tra specie di organismi) ed alberi di geni (descriventi i processi evolutivi genetici tra singoli individui) secondo il modello di coalescenza multispecie. In questo campo restano ancora aperti molteplici problemi teorici e computazionali, e metodi combinatori possono trovare applicazione portando a nuovi risultati.
La ricerca seguira' il seguente piano concentrandosi sullo studio delle proprieta' enumerative e computazionali dell'interazione tra alberi di geni e di specie secondo il modello multispecie.
(i) Utilizzando tecniche combinatorie ed analitiche, si determinera' uno studio completo del costo della computazione nel modello multispecie della probabilita' Prob(G|S) di una topologia G per un albero di geni casuale dato un albero si specie S. Si estenderanno i risultati enumerativi gia' esistenti sulle possibili realizzazioni della topologia G nell'albero S introducendo nuovi parametri che tengano conto della profondita' delle configurazioni di coalescenza.
(ii) Si svilupperanno nuovi algoritmi per il calcolo della probabilita' condizionata Prob(G|S) basandosi sulla profondita' degli eventi di coalescenza dell'albero G nell'albero S. Se ne studieranno l'accuratezza ed il costo (i) considerando diversi scenari biologici (tasso di speciazione λ).
(iii) Tramite partizioni dell'insieme di configurazioni H(G,S) ed usando gli algoritmi in (ii), si determinera' una procedura di calcolo distribuito per la computazione della somma (1) che determina la probabilita' Prob(G|S).
(iv) Con i metodi definiti in (ii) e (iii) ed estendendo i risultati di [5], si definira' un algoritmo che decida se una topologia ordinata per un albero di specie possa produrre, per certi valori dei suoi intervalli temporali, alberi di geni anomali AOGA. Cio' permettera' di evidenziare gli scenari in cui alcuni metodi statistici usati per l'inferenza degli alberi di specie possono fallire.