Università degli Studi Guglielmo Marconi

Insegnamento
Linked data e Web semantico
Docente
Prof. Vetere Guido
Settore Scientifico Disciplinare
ING-INF/05
CFU
6
Descrizione dell'insegnamento
Il corso offre una panoramica completa sul Web Semantico e i Linked Data, secondo le definizioni e gli standard del consorzio W3C. Dopo aver richiamato le nozioni di base della semiologia, della logica, dell’ontologia, delle architetture e dei servizi Web, il corso si rivolgerà allo studio dei linguaggi RDF, OWL e SPARQL. Infine, il corso illustrerà linee guida tecniche e normative per la condivisione dei dati aperti delle pubbliche amministrazioni. 

Il corso è articolato in tre parti. Nella prima gli studenti verranno introdotti al tema del corso, alla storia della nascita e dell’evoluzione del Web, al problema generale dell’integrazione semantica dell’informazione. Vengono inoltre introdotte le nozioni basilari della logica e della semantica formale, con riferimento al ruolo dell’ontologia. Nella  seconda parte si approfondiscono gli standard W3C e le basi teorico-pratiche per la modellazione concettuale e la costruzione di basi di conoscenza. Sulla base delle nozioni acquisite nelle prime due parti, nella terza si affronta il tema dei Linked Data sia dal punto di vista degli standard tecnici, sia da quello delle problematiche teoriche. Infine, si offre una panoramica sulle iniziative del Governo italiano e della Commissione europea per favorire l’interoperabilità semantica nelle Pubbliche Amministrazioni.
Obiettivi formativi (espressi come risultati di apprendimento attesi)
Al termine di questo corso, lo studente sarà in grado di:
  • comprendere i concetti di base della logica e della semantica sia formale sia linguistica; 
  • comprendere l’ontologia come disciplina logico-filosofica e il suo ruolo nella specificazione della semantica dei sistemi informativi; 
  • conoscere i formalismi e gli standard per la redazione di modelli concettuali e basi di dati aperte e semanticamente qualificate;
  • conoscere i modelli di interoperabilità semantica e la loro realizzazione nei piani di e-government; 
  • produrre semplici dimostrazioni in logica proposizionale; 
  • modellare semplici basi di conoscenza mediante i formalismi acquisiti; 
  • valutare la qualità di un modello concettuale in termini di coerenza rispetto alle interpretazioni intese;
  • valutare l’adeguatezza di diversi modelli di interoperabilità semantica in relazione ai casi d’uso;
  • approfondire i temi della semantica formale e della gestione dei processi socio-tecnici nello sviluppo di sistemi informativi interoperabili;
  • esprimere con opportuno linguaggio gli argomenti del corso.
Prerequisiti
Non si richiedono conoscenze particolari per sostenere questo esame. Si rimanda tuttavia alle indicazioni contenute nella guida dello studente.
Contenuti dell'insegnamento
Parte 1:

•         Introduzione al Semantic Web e ai Linked Data
  1. La nascita del Web e il Consorzio W3C
  2. L’annuncio e motivazione del Web Semantico
  3. L’evoluzione del Web Semantico
  4. L’annuncio e motivazione dei Linked Data
  5. L’evoluzione dei Linked Data
•         La logica della rappresentazione dei dati
  1. La struttura predicativa
  2. Le relazioni logiche
  3. La semantica formale
•         La semantica
  1. Il concetto di segno
  2. L’interpretazione del segno in logica e nel linguaggio
  3. Teorie del significato
•         L’ontologia
  1. Il livello ontologico
  2. Ontologia formale e ontologia materiale
  3. Gli ‘Upper Level’
  4. Metodologie per lo sviluppo
•         Algoritmi
  1. Ragionamenti sulle ontologie
  2. Ragionamenti sulle istanze
  3. Query Answering

Parte 2:

•         Resource Description Framework
  1. Il modello
  2. Lo schema per i vocabolari
  3. Grafi RDF e loro semantica
  4. La serializzazione
•         I linguaggi OWL 2
  1. Il modello
  2. Le costruzioni
  3. Gli assiomi
  4. I profili
•         Costruzione di ontologie
  1. L’ambiente Protégé
  2. La modularizzazione
  3. La specificazione del modello
  4. La pubblicazione
•         Basi di conoscenza RDF\OWL
  1. I database di triple
  2. L’ambiente Sesame
  3. Popolamento di una base di conoscenza
•         Basi di conoscenza a grafo (Knowledge Graphs)
  1. Caratteristiche e posizionamento rispetto al Semantic Web
  2. Database a grafo
•         Accesso alle basi di conoscenza
  1. Tipi di interrogazione
  2. SPARQL e accesso attraverso interfaccia di interrogazione
  3. JSON e accesso mediante API
•         Ricapitolazione: Creazione ed uso di una base di conoscenza (OWL\SESAME)
  1. Analisi del dominio
  2. Creazione dell’ontologia
  3. Popolamento dei dati
  4. Interrogazione

Parte 3:

•         I Dati aperti
  1. Origine e definizioni
  2. Tipologia
  3. Problematiche di gestione
•         I Linked Data
  1. Caratteristiche e posizionamento rispetto al Semantic Web
  2. Le specifiche tecniche
  3. Le assunzioni
  4. Le problematiche di gestione e di uso
•         Principali basi di Linked Data (Data Set)
  1. La ‘nuvola’ dei Linked Data
  2. Wikipedia \ DBPedia
  3. Dataset italiani
•         Quadro normativo e linee guida nazionali
  1. I database pubblici e la cooperazione applicativa
  2. Decreto Legge n. 90/2014
  3. Le linee guida dell’Agid
Attività didattiche
Didattica Erogativa
L'insegnamento prevede, per ciascun CFU, 5 ore di Didattica Erogativa, costituite da 2,5 videolezioni (tenendo conto delle necessità di riascolto da parte dello studente). Ciascuna videolezione esplicita i propri obiettivi e argomenti, ed è corredata da materiale testuale in pdf.
Per ogni videolezione sono specificati gli argomenti e gli obiettivi sia in una panoramica introduttiva, sia in una ricapitolazione conclusiva. Per favorire la comprensione profonda delle tematiche, le lezioni integrano elementi teorici, anche con riferimento ad elementi di cultura generale, nozioni tecniche ed esercitazioni pratiche. In particolare, si cerca di trasmettere agli studenti il senso delle scelte di disegno architetturale alla base delle infrastrutture oggetto di studio, evitando una esposizione acritica e puramente funzionale. Gli studenti sono chiamati a sperimentare le tecniche oggetto di studio e supportati nel loro lavoro individuale, e incoraggiati ad approfondire sia i dettagli tecnici sia gli aspetti teorici che, per limiti di tempo, non sono affrontati nelle lezioni.

Didattica Interattiva
L'insegnamento segue quanto previsto dalle Linee Guida di Ateneo sulla Didattica Interattiva e l'interazione didattica, e propone, per ciascun CFU, 1 ora di Didattica Interattiva dedicata alle seguenti attività: lettura area FAQ, partecipazione ad e-tivity strutturata costituita da attività finalizzate alla restituzione di un feedback formativo e interazioni sincrone dedicate a tale restituzione, lettura critica della web-grafia a corredo delle lezioni, supporto alle esercitazioni pratiche individuali con gli strumenti open-source indicati nel corso (Protégé, Sesame).
Modalità di verifica dell'apprendimento
Tutte le prove di verifica e autoverifica intermedie previste dai Corsi ed erogate in modalità distance learning sono da considerarsi altamente consigliate e utili ai fini della preparazione e dello studio individuali. Le prove di verifica e autoverifica intermedie non sono obbligatorie ai fini del sostenimento della prova d´esame, la quale deve essere svolta in presenza dello studente davanti ad apposita Commissione ai sensi dell´art. 11 c.7 lett.e) del DM 270/2004.

L’esame si svolge in forma scritta e/o orale. Il punteggio della prova è espresso in trentesimi.
La prova scritta ha una durata massima di 120 minuti e consiste in un questionario di dieci domande, alcune a scelta multipla altre a risposta aperta, calibrate sull’intero programma del corso. Le prime sono orientate principalmente all’accertamento delle competenze tecniche e nozionali, le seconde alla comprensione profonda dei temi e alla padronanza del lessico tecnico-specialistico.
La valutazione della prova scritta consiste nell’assegnazione a ciascuna risposta di un punteggio da 0 a 3. Le domande chiuse a risposta singola sono valutate 3 se corrette, 0 se errate; le domande a risposta multipla sono valutate in proporzione al numero delle selezioni corrette; alle risposte aperte è assegnato un valore nell’intervallo [0,3]. La valutazione finale consiste nella somma dei punteggi arrotondata per eccesso nel caso in cui la parte decimale sia maggiore o uguale a 0,5. La lode viene assegnata nel caso in cui l’esposizione delle risposte aperte sia di particolare pregio.
La prova orale può consistere in una prova scritta con successiva disamina individuale delle eventuali carenze, o, compatibilmente col numero dei candidati, nell’interrogazione di ciascuno studente, accompagnata da una semplice prova pratica finalizzata all’accertamento delle capacità operative acquisite.
Libri di testo

Oltre alle lezioni realizzate dal Docente e ai materiali didattici pubblicati in piattaforma, è obbligatorio lo studio del seguente testo in base agli argomenti trattati:

  • Di Noia, De Virgilio, Di Sciascio, Donini: Semantic Web, Tra ontologie e open data, Apogeo 

Il corso fornisce inoltre un corredo di letture di materiale accessibile sul web, che fa parte integrante del supporto didattico.

Ricevimento studenti
Da concordare con il docente, previo appuntamento (g.vetere@unimarconi.it).