În perioada 9-10 Septembrie 2024 a avut loc conferința “Computational Linguistics in Bulgaria (CLIB 2024)” în Sofia, Bulgaria. Echipa de cercetare, reprezentată de Mădălina Chitez, Ana-Maria Bucur, Andreea Dinca, și Roxana Rogobete, a prezentat lucrarea cu titlul “Automatic Extraction of the Romanian Academic Word List: Data and Methods”.
Studiul nostru propune primul lexicon de limbaj academic în limba română (The Romanian phrasal academic lexicon – ROPAL). Lucrarea prezintă metodologia și datele folosite pentru extragerea automată a ROPAL. Propunem o metodologie pentru extragerea ROPAL adaptată pentru limba română folosind corpusul lingvistic nou compilat la CODHUS, Corpus of Expert Writing in Romanian and English (EXPRES). Lexiconul poate fi folosită în predarea scrierii academice sau în Procesarea Limbajului Natural/Natural Language Processing (NLP).
ROPAL este disponibil aici: https://codhus.projects.uvt.ro/wp-content/uploads/ROPAL_lista-de-expresii-academice-in-limba-romana-v.1.0.pdf
Articolul este disponibil aici: https://dcl.bas.bg/clib/wp-content/uploads/2024/09/CLIB2024_PROCEEDINGS_v1.0.pdf