Università degli Studi Guglielmo Marconi

Insegnamento
Sistemi per information retrieval
Docente
Prof. De Luca Ernesto William
Settore Scientifico Disciplinare
ING-INF/05
CFU
6
Obiettivi formativi

Il Corso ha l’obiettivo di introdurre le tecnologie dei sistemi di recupero automatico dell’informazione da sorgenti eterogenee e distribuite. Esso fornisce competenze nella comprensione dei processi e nelle tecniche di information processing che caratterizzano gli odierni motori di ricerca e le loro applicazioni. Nel quadro delle tecnologie informatiche, una particolare enfasi sarà data alle tecnologie dell’apprendimento automatico che consentono il rapido sviluppo di sistemi basati sul riutilizzo di dati e conoscenze disponibili in forma elettronica nelle fonti aperte. Questa linea di tendenza, denominata data e text mining, sarà discussa in relazione alle applicazioni odierne nell'ambito del Web.

Risultati di apprendimento attesi

Al termine di questo corso, lo studente sarà in grado di:

  • apprendere gli algoritmi e le tecnologie per il recupero automatico dell´informazione;
  • conoscere i modelli Booleani, statistici ed algebrico-vettoriali per l’IR;
  • comprendere le architetture e le componenti dei sistemi di IR;
  • analizzare l’applicazione dei sistemi di IR ai motori di ricerca su Web;
  • saper applicare l’IR al trattamento dei dati multimediali;
  • studiare elementi di Machine Learning (ML) e Data Mining per l’IR;
  • comprendere l’elaborazione dei testi, l’estrazione dell’informazione, la classificazione automatica, il Semantic IR.
Prerequisiti

Non sono richiesti requisiti specifici

Programma del corso
  • Introduzione agli Algoritmi ed alle Tecnologie per il recupero automatico dell´informazione (Information Retrieval, I).
  • Modelli di IR. Modelli Booleani, statistici ed algebrico-vettoriali per l’IR.
  • Sistemi di IR: architetture e componenti.
  • IR e Web: Dai sistemi di IR ai motori di ricerca su Web. Google Page Rank.
  • Trattamento dei dati multimediali: multimedia IR.
  • Data & Text Mining: Elementi di Machine Learning (ML) e Data Mining per l’IR.
  • IR avanzato: elaborazione dei testi, estrazione dell’informazione, classificazione automatica, Semantic IR.
  • Applicazioni (approfondimento): tecnologie di IR nel Web 2.0. Meccanismi di personalizzazione, condivisione e collaborazione nel Web 2.0. Folksonomies.
Libri di testo

Oltre alle lezioni realizzate dal Docente ed ai materiali didattici pubblicati in piattaforma, è obbligatorio lo studio dei seguenti testi:

  1. IR: alternativa tra:
    • Modern Information Retrieval, Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Addison Wesley, 1999. ISBN: 020139829X
    • Introduction to Information Retrieval, Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Cambridge University Press. 2008.
  2. ML ed IR: Automatic Text Categorization: from Information Retrieval to Support Vector Learning, Roberto Basili, Alessandro Moschitti, ARACNE Editore, 2005.
  3. Dispense fornite dal docente

Testi di approfondimento:

  1. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data (Data-Centric Systems and Applications), Liu, Bing, Springer-Verlag, Series: Data-Centric Systems and Applications, Berlin, ISBN: 978-3-540-37881-5, 2007.
  2. Dispense e articoli scientifici forniti dal docente
Criteri di valutazione
Tutte le prove di verifica e autoverifica intermedie previste dai Corsi ed erogate in modalità distance learning sono da considerarsi altamente consigliate e utili ai fini della preparazione e dello studio individuali. Le prove di verifica e autoverifica intermedie non sono obbligatorie ai fini del sostenimento della prova d´esame, la quale deve essere svolta in presenza dello studente davanti ad apposita Commissione ai sensi dell´art. 11 c.7 lett.e) del DM 270/2004.
Modalità della prova finale

L´esame si svolge in forma scritta e/o orale.

La prova scritta ha la durata massima di 120 minuti.

Didattica erogativa
L'insegnamento prevede, per ciascun CFU, 5 ore di Didattica Erogativa, costituite da 2,5 videolezioni (tenendo conto delle necessità di riascolto da parte dello studente). Ciascuna videolezione esplicita i propri obiettivi e argomenti, ed è corredata da materiale testuale in pdf.
Didattica interattiva
L'insegnamento segue quanto previsto dalle Linee Guida di Ateneo sulla Didattica Interattiva e l'interazione didattica, e propone, per ciascun CFU, 1 ora di Didattica Interattiva dedicata alle seguenti attività: lettura area FAQ, partecipazione ad e-tivity strutturata costituita da attività finalizzate alla restituzione di un feedback formativo e interazioni sincrone dedicate a tale restituzione.
Ricevimento studenti

Previo appuntamento (ew.deluca@unimarconi.it)