Anna Corazza: didattica

Possibili argomenti di tesi/laboratorio interdisciplinare

È possibile svolgere tesi (laurea specialistica o quinquennale) preferibilmente su argomenti legati all'elaborazione del linguaggio naturale, information retrieval, ingegneria del software e bioinformatica. Per ulteriori informazioni e approfondimenti potete venire in orario di ricevimento oppure fissare un appuntamento via posta elettronica. Le tesi si svolgono presso il KnomeLab.

Di seguito alcuni possibili argomenti:

  1. Sviluppo di un nuovo approccio (semi)-automatico che utilizza conoscenza onotologica (GENIA, ontologia estratta da articoli scentifici di bionformatica) per l'estrazione e/o classificazione automatica di relazioni e concetti all'interno di frasi in linguaggio naturale. Le ontologie svolgono un ruolo fondamentale nell'ambito del Semantic Web e molti metodi(semi)-automatici, basati su modelli probabilistici, utilizzano questa conoscenza (descrizione formale estratti testi del web) per risolvere diversi problemi di information retrieval, information extraction e data integration. Tipicamente il corso di *Information Retrieval* dà delle basi generali sia per quel che riguarda le competenze di apprendimento automatico che di modelli probabilistici: è quindi consigliabile anche se non strettamene necessario.

    Keyword:

    Bionformatica, Classificazione, Semantic Web, Machine Learning.

  2. Costruzione e aggiornamento di ontologie a partire da testi, in particolare estrazione e etichettatura di entità e relazioni con metodi di apprendimento automatico. Questo è un filone di ricerca attivo nel laboratorio e si possono trovare diversi argomenti maggiormente legati a tematiche di apprendimento automatico (clustering e classificazione di testi), elaborazione automatica del linguaggio naturale e bioinformatica. Di seguito alcuni esempi di problematiche: a seconda del background culturale dello studente si potrà scegliere una tematica piuttosto che un'altra. Tipicamente il corso di Information retrieval dà delle basi generali sia per quel che riguarda le competenze di apprendimento automatico che di elaborazione dei testi: è quindi consigliabile anche se non strettamente necessario. Alcuni esempi di tesi potrebbero essere:

Tesi quinquennali e specialistiche concluse o in corso (elenco non aggiornato)

  1. Federico Lauria, "Estrazione automatica di concetti ontologici da testo in italiano".
  2. Ennio Masi, "Un approccio di Information Retrieval all'identificazione di componenti in repository software", in collaborazione col Prof. Di Martino.
  3. Davide Marino, "Machine learning techniques for gene analysis", in collaborazione con il prof. Mario Nicodemi.
  4. Davide Dell'Erba, "Parsing probabilistico su treebank alle dipendenze".
  5. Vincenzo Russo, "Confronto tra tecniche di clustering: support vector clustering e clustering con la divergenza di Bregman". Maggiori informazioni sul blog.
  6. Fabrizio Schirru, "Letteratura scientifica e ontologie biomediche: un approccio al popolamento dei database".
  7. Ferdinando Bervicato, "Ricombinazioni genomiche: un nuovo approccio per il calcolo di Expected Reversal Distance attraverso i modelli di Markov.", in collaborazione con Paola Festa
  8. Giovanni Cozzo, "Ricombinazioni genomiche: calcolo di Expected Rearrangement Distance basato sui modelli di Markov nascosti.", in collaborazione con Paola Festa
  9. Vincenzo Belcastro, "Metodi per l'identificazione delle reti genetiche: un nuovo approccio Bayesiano alla Mutua Informazione.", presso il TIGEM, dott. Diego di Bernardo
  10. Gianfranco Cautiero, "Ricombinazioni genomiche: un nuovo approccio per il calcolo di Expected Reversal Distance.", in collaborazione con Paola Festa
  11. Roberto Russo, "Information retrieval per applicazioni biomediche.", in collaborazione col dott. Vincenzo Masucci del CRIAI.
  12. Antonio Gambardella, "Allineamento multiplo di biosequenze: iterated local search.", in collaborazione con Paola Festa
  13. Gregory Casanova, "Allineamento multiplo di biosequenze: approccio euristico multistart.", in collaborazione con Paola Festa
  14. Anita Alicante, "Confronto tra l'italiano e l'inglese dal punto di vista dell'analisi sintattica.", in collaborazione con Alberto Lavelli (ITC-irst)
  15. Corsuto Daniela, "Etichettatura di testi in parti del discorso: nuovi approcci."
HomePage di Anna Corazza Last modified: Fri Dec 9 15:16:30 CET 2011