Università degli Studi Guglielmo Marconi

Insegnamento
Natural language processing
Docente
Prof.ssa Giannone Cristina
Settore Scientifico Disciplinare
ING-INF/05
CFU
6
Descrizione dell'insegnamento
Il corso ha lo scopo di fornire allo studente le basi delle tecniche di trattamento automatico dei dati linguistici. L’accesso ai dati è ormai una caratteristica distintiva di questo periodo storico. Notizie, social network, motori di ricerca, fino agli assistenti virtuali, sono di accesso quotidiano per tutti noi. Il corso mira a fornire allo studente le nozioni su cui si basa l’area dell’Intelligenza Artificiale denominata “Natural Language Processing”,  trattando diversi aspetti della disciplina, dalle basi teoriche fortemente interdisciplinari, alle tecniche algoritmiche stato dell’arte fino alla descrizione di casi d’uso (task) reali di applicazione delle tecnologie.
Obiettivi formativi (espressi come risultati di apprendimento attesi)
Al termine di questo corso lo studente sarà in grado di:
1.      Conoscenza e comprensione:
a.      Conoscere le tecniche di elaborazione dei dati in linguaggio naturale.
b.      Comprendere la differenza tra i differenti task tipici della disciplina.
c.      Conoscere le basi teoriche, fortemente interdisciplinari dell’area
d.      Conoscere le tecniche di rappresentazione delle informazioni semantiche.
2.      Capacità di applicare conoscenze e comprensione:
a.      Implementare un algoritmo per il trattamento dei dati linguistici, come un classificatore per la sentiment analysis o l’estrazione di tutti i luoghi espressi in un testo.
b.      Definire un piano sperimentale e di valutarne i risultati.
3.      Competenze trasversali:
a.      Trattare task fortemente interdisciplinari, come la comprensione del significato delle parole, fino alla creazione di un agente virtuale che richiede conoscenze e comprensione di tematiche quali le scienze cognitive e aspetti sociologici.
a.     Avere le basi per approfondire le tematiche introdotte e intraprendere sperimentazioni su tematiche oggetto di ricerca nel mondo accademico e industriale.
Prerequisiti
Non sono richiesti requisiti specifici.
Contenuti dell'insegnamento
  1. Introduzione al Natural Language Processing
  2. Pipeline di elaborazione
  3. Semantica Vettoriale e Word Embeddings
  4. Approcci computazionali
  5. Text Classification - Approcci Generativi
  6. Text Classification Approcci Discriminativi
  7. Text Classification Deep Neural Network in NLP
  8. Hands-On Text Classification
  9. Word Embeddings
  10. Neural Sequence Labeling
  11. Hands-On Text Classification with Word Embeddings
  12. Information Extraction
  13. Question Answering
  14. Conversational Agents
  15. Machine Translation
Attività didattiche
Didattica Erogativa
L'insegnamento prevede, per ciascun CFU, 5 ore di Didattica Erogativa, costituite da 2,5 videolezioni (tenendo conto delle necessità di riascolto da parte dello studente). Ciascuna videolezione esplicita i propri obiettivi e argomenti, ed è corredata da materiale testuale in pdf. Nel corso sono previste 2 lezioni di tipo “Hands on”  in cui il discente potrà successivamente cimentarsi con dataset noti per l’applicazione di algoritmi per la  risoluzione del task.

Didattica Interattiva
L'insegnamento segue quanto previsto dalle Linee Guida di Ateneo sulla Didattica Interattiva e l'interazione didattica, e propone, per ciascun CFU, 1 ora di Didattica Interattiva dedicata alle seguenti attività: lettura area FAQ, partecipazione ad e-tivity strutturata costituita da attività finalizzate alla restituzione di un feedback formativo e interazioni sincrone dedicate a tale restituzione.
Modalità di verifica dell'apprendimento
Tutte le prove di verifica e autoverifica intermedie previste dai Corsi ed erogate in modalità distance learning sono da considerarsi altamente consigliate e utili ai fini della preparazione e dello studio individuali. Le prove di verifica e autoverifica intermedie non sono obbligatorie ai fini del sostenimento della prova d’esame, la quale deve essere svolta in presenza dello studente davanti ad apposita Commissione ai sensi dell´art. 11 c.7 lett.e) del DM 270/2004.
L’esame si svolge in forma scritta e/o orale. La prova ha la durata massima di 90 minuti.
La prova scritta consisterà in 3 domande aperte sui temi trattati durante le lezioni. La prova orale si incentrerà principalmente sulla discussione dello scritto per eventualmente concludersi con delle domande aggiuntive se il docente riterrà necessarie per valutare la preparazione dello studente.
Libri di testo

Oltre alle lezioni realizzate dal Docente ed ai materiali didattici pubblicati in piattaforma, è obbligatorio lo studio dei seguenti testi:

  • SPEECH and LANGUAGE PROCESSING An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Second Edition by Daniel Jurafsky and James H. Martin
Ricevimento studenti
Da concordare con il docente, previo appuntamento (c.giannone@unimarconi.it)