- Oggetto:
- Oggetto:
Elaborazione del linguaggio naturale e social media
- Oggetto:
Natural language processing and social media
- Oggetto:
Anno accademico 2024/2025
- Codice attività didattica
- FIL0402
- Docente
- Viviana Patti (Assistente)
- Corso di studio
- laurea magistrale in Comunicazione e Culture dei media
- Anno
- 1° anno
- Periodo
- Secondo semestre
- Tipologia
- Affine o integrativo
- Crediti/Valenza
- 6
- SSD attività didattica
- INF/01 - informatica
- Erogazione
- Mista
- Lingua
- Italiano
- Frequenza
- Obbligatoria
- Tipologia esame
- Orale
- Tipologia unità didattica
- corso
- Prerequisiti
-
L'insegnamento potrà essere seguito più facilmente se si possiedono già conoscenze informatiche di base, in particolare su fondamenti di programmazione. Questo non costituisce tuttavia un prerequisito assoluto. Il modulo è concepito per essere autosufficiente.
Previous knowledge on computing and in particular programming will be helpful. However, this is not absolute requirement, since the module is designed to be self-contained.
- Oggetto:
Sommario insegnamento
- Oggetto:
Obiettivi formativi
Si acquisiranno conoscenze in merito a:
- strumenti e metodologie per l'analisi computazionale dei testi;
- tecnologie per il trattamento automatico della lingua;
- strumenti e metodologie per raccolta, gestione e analisi di dati testuali da social media.
The student will gain knowledge on:
- tools and methods for the computational analysis of text;
- technologies for the automatic processing of natural language;
- tools and methods for social media data collection and management.
- Oggetto:
Risultati dell'apprendimento attesi
Studentesse e studenti sapranno utilizzare le tecniche di base per l'analisi computazionale dei testi, sapranno creare un corpus di dati annotato di testi collezionati da social media e impareranno a utilizzare librerie e ambienti software di supporto allo sviluppo di moduli per il trattamento automatico della lingua.
- Conoscenza e capacità di comprensione dei livelli di analisi linguistica tramite metodologie computazionali;
- Capacità di applicare tale conoscenza e comprensione allo scopo di creare e gestire risorse linguistiche derivate da social media;
- Abilità comunicative relativamente all'esposiione orale del processo e dei risultati di lavoro sperimentale o compilativo in ambito di Elaborazione del Linguaggio Naturale.
The students will be able to apply basic techniques for the computational analysis of text. They will be able to create an annotated corpus of social media data, and learn to use software environments and libraries to support the development of natural language processing modules.
- Knowledge and ability to understand the levels of linguistic analysis by means of computational methodologies;
- Ability to apply such knowledge to create and manage language resources based on social media data;
- Communication skills relative to presenting the process and results of experimental work in Natural Language processing.
- Oggetto:
Programma
L'insegnamento ha lo scopo di presentare i temi principali della linguistica computazionale e dell'elaborazione del linguaggio naturale e di familiarizzare gli studenti e le studentesse con gli strumenti di base per l’analisi e gestione di dati da social media. Si suddivide in due parti integrate:
Analisi computazionale di dati da social media:
- codifica e rappresentazione di dati linguistici
- creazione e annotazione di corpora linguistici e dati di social media
- metodi computazionali per l'analisi dei corpora
Elaborazione automatica del linguaggio naturale
- metodi per l'analisi di sintassi, semantica e pragmatica
- approcci basati su regole
- approcci basati su apprendimento automatico
- valutazione dei sistemi NLP
Gli argomenti dell'insegnamento verranno trattati per mezzo di lezioni teoriche e esempi pratici usando prevalentemente la sentiment analysis come task di esempio.
The goal of the course is to introduce the main themes of Computational Linguistics and Natural Language Processing, and to familiarize the student with the basic tools for the analysis and management of social media data. The course is divided into two parts:
Computational analysis of social media data
- encoding and representation of linguistic data
- creation and annotation of linguistic corpora and social media data
- computational methods for the analysis of corpora
Natural Language Processing
- methods for syntactic, semantic and pragmatic analysis
- rule-based approaches
- machine learning approaches
- evaluation of NLP systems
The course topics will be presented by means of lectures and practical examples, mainly using a sentiment analysis task as a running example.
- Oggetto:
Modalità di insegnamento
Le lezioni della durata di 36 ore complessive (6 CFU), si svolgono in Aula informatica (vedi orario lezioni per le informazioni sull'aula), con la possibilita' di seguire online per gli studenti e le studentesse impossibilitati a seguire in presenza, secondo il regolamento di Ateneo.
36 hours of lesson in total (6 CFU), which take place in a computer lab (see the Timetable for information about the room). There will be a virtual room open for students who cannot attend in person (depending on University rules).
- Oggetto:
Modalità di verifica dell'apprendimento
Conoscenze e capacità previste saranno verificate attraverso un colloquio orale con domande, dove gli studenti e le studentesse dovranno presentare un progetto sviluppato individualmente.
Il progetto potrà consistere, a scelta, in una ricerca bibliografica su un tema rilevante al programma del corso, oppure l'applicazione di tecniche compuationali ad uno specifico task di Elaborazione del Linguaggio Naturale.
La preparazione sarà considerata adeguata (con votazione espressa in trentesimi), se sarà in grado di commentare in maniera adeguata il progetto, e dimostrerà una completa padronanza degli argomenti trattati a lezione.
Knowledge and skills will be verified through an oral examination discussing a project individually developed by the students.
The project may consist (upon choice) of a bibliographic research on a course-relevant topic, or the application of computational techniques to a specific NLP task.
The preparation will be considered adequate (on a scale up to thirty points), if the student will be able to comment adequately on the project, and will demonstrate a complete mastery of the topics covered by the course.
- Oggetto:
Attività di supporto
Per gli studenti/esse con DSA o disabilità, si prega di prendere visione delle modalità di supporto (https://www.unito.it/servizi/
lo-studio/studenti-con- disabilita) e di accoglienza (https://www.unito.it/ accoglienza-studenti-con- disabilita-e-dsa) di Ateneo, ed in particolare delle procedure necessarie per il supporto in sede d’esame (https://www.unito.it/servizi/ lo-studio/studenti-e- studentesse-con-disabilita/ supporto-studenti-e- studentesse-con).” Studenti e studentesse con DSA sono invitati/e a informare i docenti all'inizio dell'insegnamento per concordare un percorso di apprendimento personale adatto alle loro esigenze, anche al di là delle misure compensative e dispensative previste per l'esame.
For students with learning disorders or disabilities, please take note of the University's support (https://www.unito.it/servizi/lo-studio/studenti-con-disabilita) and accomodation arrangements (https://www.unito.it/accoglienza-studenti-con-disabilita-e-dsa), and in particular the procedures required for examination support (https://www.unito.it/servizi/lo-studio/studenti-e-studentesse-con-disabilita/supporto-studenti-e-studentesse-con).
Students with SLDs are invited to inform the lecturer at the beginning of the course, in order to agree on a personal learning path suited to their needs, even beyond the compensatory and dispensatory measures provided for the examination.
Testi consigliati e bibliografia
- Oggetto:
- Libro
- Titolo:
Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition- Anno pubblicazione:
2008- Editore:
Prentice Hall- Autore:
D. Jurafsky & J.H. Martin- Permalink:
- Note testo:
English- Obbligatorio:
- No
- Oggetto:
- Libro
- Titolo:
Che cos'è la linguistica computazionale- Anno pubblicazione:
2022- Editore:
Carocci- Autore:
Malvina Nissim & Ludovica Pannitto- Permalink:
- Obbligatorio:
- No
- Oggetto:
- Articolo
- Titolo:
I Computer e il Linguaggio Naturale- Titolo rivista:
Ithaca- Anno pubblicazione:
2020- Autore:
Valerio Basile- Volume:
XVI- URL:
- Obbligatorio:
- No
- Oggetto:
- Libro
- Titolo:
Linguistica - Introduzione alle scienze del linguaggio- Anno pubblicazione:
2023- Editore:
Pearson- Autore:
Giorgio Francesco Arcodia, Alessandro Panunzi- ISBN
- Permalink:
- Note testo:
Testo di linguistica, con attenzione agli aspetti computazionali- Obbligatorio:
- No
- Oggetto:
- Libro
- Titolo:
Linguistica computazionale. Introduzione all'analisi automatica dei testi- Anno pubblicazione:
2023- Editore:
Il Mulino- Autore:
Elisabetta Jezek, Rachele Sprugnoli- ISBN
- Permalink:
- Obbligatorio:
- No
- Oggetto:
La versione aggiornata del libro di Jurafski & Martin è disponibile online (third edition - December 29, 2021): https://web.stanford.edu/~jurafsky/slp3/
The latest version (3rd edition) of the book by Jurafsky & Martin is available online: https://web.stanford.edu/~jurafsky/slp3/ (third edition - December 29, 2021)
- Oggetto:
Note
-
-
- Oggetto:
Insegnamenti che mutuano questo insegnamento
- Elaborazione del linguaggio naturale e social media (FIL0402)Corso di Laurea magistrale in Scienze del libro, del documento, del patrimonio culturale
- Registrazione
- Aperta
- Apertura registrazione
- 01/09/2024 alle ore 00:00
- Chiusura registrazione
- 30/06/2025 alle ore 23:55
- Oggetto: