| Laurea: | DIGITAL HUMANITIES PER L'ITALIANO |
| Insegnamento: | LINGUISTICA DEI CORPORA E LABORATORIO DI CODIFICA DEI TESTI |
| Anno di corso: | III |
| Semestre: | II |
| Docente: | Stefania Spina |
| SSD: | L-LIN/01 |
| CFU: | 9 |
| Carico di lavoro globale: | 225 ore |
| Ripartizione del carico di lavoro: | 60 ore di lezione e 165 ore di studio individuale |
| Pagina LOL con materiale didattico digitale dell'insegnamento. | |
Prerequisiti
Sono necessarie una buona conoscenza della lingua e della grammatica italiana, e conoscenze di base nel campo della Linguistica generale. In particolare:
- livelli di analisi delle lingue: fonologia, morfologia, sintassi, lessico;
- principali unità di analisi linguistica: fonema, morfema, lessema, sintagma, frase, testo.
È utile, in tal senso, aver già sostenuto l’esame di Linguistica generale. Eventuali lacune potranno essere recuperate facendo riferimento ai seguenti testi:
- Berruto, B., Cerruti, M. (2022). La linguistica. Un corso introduttivo, Terza Edizione, UTET Università.
Gli studenti possono comunque utilizzare la piattaforma LOL per interagire con il docente e chiarire eventuali dubbi sulle proprie conoscenze disciplinari di base.
Si richiede la comprensione della lingua italiana orale e scritta al livello B2 del QCER. Se necessario, e in particolare se segnalato nei colloqui in ingresso, gli studenti devono avvalersi del servizio di tutorato linguistico alla pari offerto dall’Ateneo.
Obiettivi formativi - Risultati di apprendimento attesi
Conoscenza e comprensione:
- conoscere le principali tappe di sviluppo, i metodi e gli strumenti di analisi della Linguistica dei corpora;
- comprendere le opportunità legate all’uso di corpora linguistici nel campo della ricerca linguistica;
- conoscere il modo in cui i dati linguistici estratti da corpora, le risorse e le metodologie usate dalla linguistica dei corpora sono usati per analizzare l’uso linguistico, anche come supporto alla didattica delle lingue;
- conoscere gli standard, le metodologie e gli strumenti necessari all’elaborazione e alla codifica di dati linguistici, prodotti da parlanti nativi e da apprendenti.
Applicazione della conoscenza e della comprensione:
- essere in grado di analizzare e valutare dati estratti da corpora, attraverso le metodologie e le risorse della Linguistica dei corpora;
- saper utilizzare le metodologie e le risorse necessarie ad annotare dati linguistici per diversi obiettivi di ricerca.
Contenuto del corso
l corso, che si terrà in lingua italiana, è articolato in tre sezioni.
Nella prima sezione viene delineata la posizione della Linguistica dei corpora all’interno delle Scienze del linguaggio, e ne vengono descritte le caratteristiche salienti. Si introduce e si problematizza, inoltre, la nozione di corpus in linguistica (10 ore circa).
La seconda sezione affronta due aspetti centrali della disciplina: il trattamento di dati linguistici (codifica testuale e annotazione linguistica), e la loro successiva analisi. Per quanto riguarda l'annotazione, se ne descrivono le finalità e le tipologie fondamentali: l'annotazione strutturale e l'annotazione linguistica. Vengono poi descritte alcune metodologie di analisi di dati linguistici strutturati, basate su misure di tipo quantitativo (frequenza, dispersione, misure di associazione e di ricchezza e densità lessicale, analisi per keywords) e qualitativo (analisi di concordanze). Alcuni casi di studio proposti riguardano un fenomeno lessico-grammaticale rilevante in molti ambiti applicativi, tra cui quello della didattica delle lingue: le combinazioni lessicali (30 ore circa).
La sezione finale (Laboratorio di codifica dei testi) è infine finalizzata a guidare gli studenti nello sviluppo di attività di annotazione di testi italiani col supporto dell'intelligenza artificiale. Il ruolo dei Large Language Models (LLM) come supporto all'attività di annotazione manuale dei corpora linguistici sarà discusso e sperimentato attraverso concreti task di annotazione linguistica, sui cui gli studenti saranno chiamati a svolgere attività progettuali (20 ore).
Metodi didattici
Per studenti frequentanti
Lezioni frontali e attività applicative, da integrare con lo studio progressivo dei testi di riferimento e dei materiali proposti sulla piattaforma LOL. Nell'ambito del Laboratorio, attività esercitative ed applicate, individuali e di gruppo.
Per studenti non frequentanti
Studio individuale dei testi di riferimento, col supporto delle dispense e dei materiali scaricabili dalla piattaforma LOL.
Verranno utilizzate le piattaforme digitali LOL e Teams, che potranno venire adoperate anche per modalità di didattica a distanza secondo le indicazioni elaborate dai CdS.
Agli studenti che abbiano depositato in Segreteria certificazioni di disabilità o DSA si consiglia di contattare all’inizio del corso il/la docente, anche attraverso la Commissione per le differenze e l’inclusione (differenze-inclusione@unistrapg.it) per concordare misure compensative e/o dispensative di adattamento della didattica.
Metodi di accertamento
L’esame si svolgerà in modalità orale. Gli studenti dovranno dimostrare di conoscere e di aver compreso i contenuti del corso, anche attraverso la loro applicazione concreta. Un’attenzione particolare sarà rivolta all’uso adeguato della terminologia specifica che caratterizza la disciplina, nonché alla capacità di sintesi e di rielaborazione critica dei contenuti del corso.
Per gli studenti con certificazioni di disabilità o DSA le modalità d’esame saranno concordate in relazione alle specifiche esigenze, sentito il parere della Commissione per le differenze e l’inclusione.
Testi di esame
Per studenti frequentanti:
- Freddi M. (2014). Linguistica dei corpora. Carocci.
- Wynne M. (Ed.) Developing Linguistic Corpora: a Guide to Good Practice. AHDS Literature, Languages and Linguistics (capp. 1 "Corpus and Text: Basic Priniciples", 2 "Adding Linguistic Annotation" e 5 "Spoken Language Corpora". I capitoli sono scaricabili da questo indirizzo
Materiali integrativi (slide presentate a lezione) messi a disposizione sulla piattaforma LOL.
Per studenti non frequentanti:
- Freddi M. (2014). Linguistica dei corpora. Carocci.
- Wynne M. (Ed.) Developing Linguistic Corpora: a Guide to Good Practice. AHDS Literature, Languages and Linguistics (capp. 1 "Corpus and Text: Basic Priniciples", 2 "Adding Linguistic Annotation" e 5 "Spoken Language Corpora". I capitoli sono scaricabili da questo indirizzo
Materiali integrativi (slide presentate a lezione) messi a disposizione sulla piattaforma LOL.
Testi di consultazione e approfondimento
Linguistica dei corpora
- Tony McEnery & Andrew Hardie (2012), Corpus Linguistics. Method, Theory and Practice. Cambridge, Cambridge University Press.
- Stefanowitsch, A. (2020). Corpus linguistics: A guide to the methodology. Berlin: Language Science Press.
Codifica dei testi
- Pierazzo E. (2005). La codifica dei testi: un'introduzione. Carocci.
Altre informazioni
È richiesta l’iscrizione on-line al corso sulla piattaforma LOL. L'orario di ricevimento in presenza o in remoto su Teams sarà concordato volta per volta via e-mail.
È raccomandata una regolare frequenza.
E-mail delle docenti: stefania.spina@unistrapg.it, letizia.cinganotto@unistrapg.it.