Disponibili i Risultati del Lavoro di CLARIN sul Sentiment nei Parlamenti

CLARIN-IT è lieta di annunciare la pubblicazione dei seguenti risultati del lavoro sul sentiment nei parlamenti svolto nell'ambito del progetto ParlaMint di CLARIN:
  • un modello XLM-R-large ulteriormente pre-addestrato da 1,7 miliardi di token di dati ParlaMint ed EuroParl;
  • il dataset ParlaSent, costituito da 18.200 frasi annotate manualmente per il sentiment, in 7 lingue europee;
  • il modello XLM-R-ParlaSent, che è il modello XLM-R-Parla messo a punto sul dataset ParlaSent;
  • un articolo su arXiv che descrive l'intero ampio lavoro di annotazione e di sperimentazione.