Workshop & Panel Internazionale IEEE sulle Risorse Linguistiche Digitali per gli Studiosi

Titolo: 
Workshop & Panel Internazionale IEEE sulle Risorse Linguistiche Digitali per gli Studiosi
Tipo: 
Workshop
Data di Inizio: 
10/06/2021
Data di Fine: 
10/06/2021
Luogo: 
Online
Descrizione: 
Il Workshop & Panel Internazionale IEEE sulle Risorse Linguistiche Digitali per gli Studiosi, si è tenuto giovedì 10 giugno 2021 nell'ambito di IEEE CiSt'20, il 6° Congresso IEEE su Scienza & Tecnologia dell'Informazione (05-12/06/2021).
Originariamente pianificato ad Agadir (Marocco) ma tenuto in forma virtuale a causa della pandemia di COVID-19, l'evento è stato organizzato nell'ambito della collaborazione che lega l'Università Sidi Mohamed Ben Abdellah (USMBA), il Congresso IEEE CiSt in Marocco e l'Istituto di Linguistica Computazionale "A. Zampolli" del Consiglio Nazionale delle Ricerche (ILC-CNR) dal 2014. Il suo scopo era estendere la Common Language Resources and Technology Infrastructure (CLARIN), classificata come ESFRI Landmarks SSH RI, ai Centri Universitari in Marocco, federare e condividere i dati esistenti e nuovi, ampliare le collaborazioni e sfruttare le risorse per la ricerca collaborativa. L'evento intendeva quindi aprire una discussione su come rendere le Risorse Linguistiche prodotte in Marocco più visibili ed accessibili ad una comunità di ricerca più ampia e su come l'esperienza e le risorse per la creazione di vari centri di dati e di competenza di CLARIN potrebbero essere utili a questo scopo.
Sebbene CLARIN sia un'infrastruttura di ricerca europea, non è limitata a lingue o risorse europee. Le lingue non europee sono rese disponibili da diversi centri europei di CLARIN e il Centro Sudafricano per le Risorse Linguistiche Digitali (SADiLaR) ha recentemente aderito a CLARIN. CLARIN ha anche partnership con centri negli Stati Uniti e il suo sistema di deposito, metadati e single sign-on può rappresentare una soluzione praticabile per chiunque desideri creare facilmente un repository di Risorse Linguistiche. Le Risorse Linguistiche per l'arabo e le sue varietà possono essere trovate tramite il CLARIN Virtual Language Observatory (VLO), un meta-catalogo che raccoglie tutti i metadati dai centri CLARIN e li rende ricercabili da un unico punto di accesso. Questi metadati possono essere relativi a registrazioni orali, corpora scritti o lessici. Tuttavia, una grande quantità di importanti corpora e risorse lessicali non è attualmente rappresentata. Inoltre, il CLARIN Language Resources Switchboard, uno strumento che aiuta a trovare applicazioni Web per il Trattamento Automatico del Linguaggio (TAL), attualmente non dispone di alcuno strumento TAL per l'arabo.
L'evento è stato articolato in brevi presentazioni volte a fornire una panoramica di CLARIN ERIC e dei suoi vari aspetti, mostrando in particolare come la sua infrastruttura tecnico-scientifica sia conforme ai principi FAIR riconosciuti a livello internazionale, che raccomandano che i dati siano Trovabili, Interoperabili, Accessibili e Riutilizzabili. Inoltre, sono stati presentati esempi di risorse e strumenti di vari consorzi nazionali – in particolare di CLARIN-IT, il nodo italiano di CLARIN, di cui l’ILC-CNR è l’Istituto Esecutore – nonché attività di coinvolgimento degli utenti e progetti attualmente in corso (come ParlaMint). Le presentazioni sono state seguite da una tavola rotonda.
Simonetta Montemagni (Direttore dell’ILC-CNR), Monica Monachini (ILC-CNR, Coordinatore Nazionale di CLARIN-IT), Ouafae Nahli (ILC-CNR), Maha El Biadi (USMBA) e Francesca Frontini (ILC-CNR, Consiglio di Amministrazione di CLARIN ERIC) hanno partecipato all’evento in qualità di Relatori.