PROPOSTE DI TESI e/o STAGE

A Search Engine Time Machine (Tesi magistrale in Ingegneria Informatica) - Tesi assegnata

 
 
Immagine Silvello Gianmaria
A Search Engine Time Machine (Tesi magistrale in Ingegneria Informatica) - Tesi assegnata
di Silvello Gianmaria - mercoledì, 19 aprile 2017, 12:48
 

A Search Engine Time Machine

UPDATE: Tesi assegnata. Nel caso siate interessati all'argomento, possiamo discutere delle tesi alternative in quest'ambito di ricerca. 

La riproducibilità degli esperimenti è un tema sempre più attuale e fondamentale nella ricerca scientifica. Nell'ambito dell'Information Retrieval la riproducibilità degli esperimenti è favorita da pratiche di valutazione (paradigma di Cranfield) consolidate che prevedono l'uso di collezioni standard di test (corpus, topic e giudizi di rilevanza). 

Però, un problema aperto è, data una query, come garantire la riproducibilità delle ranking list restituite da un motore di ricerca. Infatti, ogni volta che l'indice di un motore di ricerca viene aggiornato, le ranking list, con query e modello di retrieval fissati, restituite dal motore  cambiano (presenza di nuovi documenti, valori di TF e IDF aggiornati, ...). 

Questa tesi studierà delle strutture dati innovative per la creazione e l'aggiornamento dell'inverted index, che permettano la gestione di diverse versioni dell'indice al fine di consentire la riproducibilità delle ranking list. Di fatto, si tratta di costruire una time machine per i motori di ricerca che permetta di interrogare versioni precedenti in modo consistente e riproducibile.

Si richiede di aver superato l'esame di Reperimento dell'Informazione. La tesi prevede lo sviluppo di codice software in Java. La conoscenza, anche ad alto livello, del software Open Source Terrier (http://terrier.org/) è considerata un plus.

Per maggiori informazioni scrivere a: silvello@dei.unipd.it