- Oggetto:
- Oggetto:
Elaborazione del linguaggio naturale e social media
- Oggetto:
Natural language processing and social media
- Oggetto:
Anno accademico 2021/2022
- Codice dell'attività didattica
- FIL0402
- Docente
- Prof.ssa Viviana Patti (Titolare del corso)
- Corso di studi
- laurea magistrale in Comunicazione e Culture dei media
- Anno
- 1° anno
- Periodo didattico
- Secondo semestre
- Tipologia
- Affine o integrativo
- Crediti/Valenza
- 6
- SSD dell'attività didattica
- INF/01 - informatica
- Modalità di erogazione
- Mista
- Lingua di insegnamento
- Italiano
- Modalità di frequenza
- Obbligatoria
- Tipologia d'esame
- Orale
- Prerequisiti
-
L'insegnamento potrà essere seguito più facilmente se si possiedono già conoscenze informatiche di base, in particolare su fondamenti di programmazione. Questo non costituisce tuttavia un prerequisito assoluto. Il modulo è concepito per essere autosufficiente.
Previous knowledge on computing and in particular programming will be helpful. However, this is not absolute requirement, since the module is designed to be self-contained.
- Propedeutico a
-
Nessuna propedeuticità
No preliminary requirements.
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Si acquisiranno conoscenze in merito a: a) strumenti e metodologie per l'analisi computazionale dei testi; b) tecnologie per il trattamento automatico della lingua; c) strumenti e metodologie per raccolta, gestione e analisi di dati testuali da social media.
The student will gain knowledge on: a) tools and methods for the computational analysis of texts; b) technologies for the automatic processing of natural language; c) tools and methods for social media data collection and management.
- Oggetto:
Risultati dell'apprendimento attesi
Studentesse e studenti sapranno utilizzare le tecniche di base per l'analisi computazionale dei testi, sapranno creare un corpus di dati annotato di testi collezionati da social media e impareranno a utilizzare librerie e ambienti software di supporto allo sviluppo di moduli per il trattamento automatico della lingua.
The students will be able to apply the basic techniques for the computational analysis of texts. They will be able to create an annotated corpus of social media data, and learn to use software environments and libraries to support the development of natural language processing modules.
- Oggetto:
Modalità di insegnamento
Le lezioni della durata di 36 ore complessive (6 CFU), si svolgono quest'anno in presenza in Aula informatica (vedi orario lezioni per le informazioi sull'aula), con la possibilita' di seguire online per gli studenti impossibilitati a seguire in presenza, secondo il regolamento di Ateneo (vedi Note).
36 hours of lesson in total (6 CFU), which take place this year in-person. The face-to-face lessons will take place in the computer lab with the help of projections (see Orario Lezioni for information about the location). There will be a vitual room open for students who cannot attend in person (see Note).
- Oggetto:
Modalità di verifica dell'apprendimento
Conoscenze e capacità previste saranno verificate attraverso un colloquio orale con domande, dove gli studenti dovranno presentare un progetto sviluppato individualmente. La preparazione sarà considerata adeguata (con votazione espressa in trentesimi), se sarà in grado di commentare in maniera adeguata il progetto, e dimostrerà una completa padronanza degli argomenti trattati a lezione.
Knowledge and skills will be verified through an interview with questions where students must submit a project individually developed. The preparation will be considered adequate (by a vote of thirty), if student will be unable to comment adequately the project, and will demonstrate a complete mastery of the topics covered by the course.
- Oggetto:
Programma
L'insegnamento ha lo scopo di presentare i temi principali della linguistica computazionale e dell'elaborazione del linguaggio naturale e di familiarizzare lo studente con gli strumenti di base per l’analisi e gestione di dati da social media. Si suddivide in due parti integrate:
Analisi computazionale di dati da social media:
- codifica e rappresentazione di dati linguistici
- creazione e annotazione di corpora linguistici e dati di social media
- metodi computazionali per l'analisi dei corpora
Elaborazione automatica del linguaggio naturale
- metodi per l'analisi di sintassi, semantica e pragmatica
- approcci basati su regole
- approcci basati su apprendimento automatico
- valutazione dei sistemi NLP
Caso di studio
- sentiment analysis
Gli argomenti dell'insegnamento verranno trattati per mezzo di lezioni teoriche e esempi pratici usando prevalentemente la sentiment analysis come task di esempio.
The goal of the course is to introduce the main themes of Computational Linguistics and Natural Language Processing, and to familiarize the student with the basic tools for the analysis and management of social media data. The course is divided into two parts:
Computational analysis of social media data
- encoding and representation of linguistic data
- creation and annotation of linguistic corpora and social media data
- computational methods for the analysis of corpora
Natural Language Processing
- methods for syntactic, semantic and pragmatic analysis
- rule-based approaches
- machine learning approaches
- evaluation of NLP systems
Case study
- sentiment analysis
The course topics will be presented by means of lectures and practical examples, mainly using a sentiment analysis task as a running example.
Testi consigliati e bibliografia
- Oggetto:
- Libro
- Titolo:
- Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition
- Anno pubblicazione:
- 2008
- Editore:
- Prentice Hall
- Autore:
- D. Jurafsky & J.H. Martin,
- Obbligatorio:
- No
- Oggetto:
La versione aggiornata e' disponibile online (third edition - last draft September 21, 2021): https://web.stanford.edu/~jurafsky/slp3/
Last version (3rd edition) available online: https://web.stanford.edu/~jurafsky/slp3/ (last draft September 21, 2021)
- Oggetto:
Note
Aula virtuale su WebEx:
ACCEDI A RIUNIONE WEBEX
https://unito.webex.com/unito/j.php?MTID=m3807491cc6bd2eb99a0cc708eeb3ec7f
Numero riunione (codice di accesso): 2734 512 2058Il corso avra' inizio nel secondo emisemestre del secondo semestre.
Virtual room:
ACCEDI A RIUNIONE WEBEX
https://unito.webex.com/unito/j.php?MTID=m3807491cc6bd2eb99a0cc708eeb3ec7f
Numero riunione (codice di accesso): 2734 512 2058- Oggetto: