În perioada 4-6 Septembrie 2023 a avut loc conferința “Recent Advances in Natural Language Processing” în Varna, Bulgaria. Echipa de cercetare, reprezentată de Ana-Maria Bucur, Andreea Dinca, Madalina Chitez și Roxana Rogobete, a prezentat lucrarea cu titlul “Automatic Extraction of the Romanian Academic Word List: Data and Methods”.
Studiul nostru propune prima listă de cuvinte academice în limba română (Romanian Academic Wordlist: RO-AWL). Lucrarea prezintă metodologia și datele folosite pentru extragerea automată a RO-AWL. Propunem o metodologie pentru extragerea RO-AWL adaptată pentru limba română folosind corpusul lingvistic nou compilat la CODHUS, Corpus of Expert Writing in Romanian and English (EXPRES). Lista noastră poate fi folosită în predarea scrierii academice sau în Procesarea Limbajului Natural/Natural Language Processing (NLP).
Articolul este disponibil aici
Extrase din prezentare: