Deși LEMI a fost lansat recent (noiembrie 2023), cercetarea care a condus la dezvoltarea sa este la cel mai înalt nivel academic. Prin crearea unei echipe valoroase, compusă din cercetători seniori și juniori, în lingvistică aplicată, lingvistică computațională, studii literare dar și tehnologia informației, am reușit să scriem o lucrare care a fost acceptată la una dintre cele mai competitive conferințe de lingvistică computațională din lume, conferința comună LREC-COLING organizată de Universitatea din Torino, Italia, în perioada 20-25 mai 2024.
Echipa este formată din echipa de bază LEMI, a centrului de cercetare CODHUS de la Universitatea de Vest din Timișoara, dar și din colaboratori de la alte universități din România (Universitatea Tehnică din Cluj, Universitatea Babeș-Bolyai din Cluj-Napoca, Universitatea Națională de Știință și Tehnologie POLITEHNICA București) sau colaboratori din mediul privat (firma IT Quarticle Research).
Mai multe despre conferința LREC-COLING 2024 aici și despre program aici.
Lucrarea se numește Towards Building the LEMI Readability Platform for Children’s Literature in the Romanian Language. Un scurt rezumat al acesteia ar fi:
Lizibiliatea (readability) textelor este crucială pentru înțelegere și eficiența lecturii. Din păcate, există puține cercetări pentru limbile analizate mai puțin, mai ales cele prind textele pentru copii. Această lucrare prezintă noul instrument LEMI creat pentru evaluarea nivelului de readability al literaturii pentru copii în limba română. Instrumentul include un repozitoriu digital de texte și o interfață care generează rapoarte automate de readability. Metodologia implică crearea și testarea unei formule de readability pentru limba română, folosind un corpus de literatură pentru copii. Cercetarea discută studii anterioare și descrie corpusul folosit și funcționalitățile platformei. Se prezintă primele etape de validare a formulei folosind platforma ReaderBench, care analizează, comparativ cu LEMI, multe alte variabile ale complexitățiii textelor relevante pentru limba română. LEMI este unic, fiind singurul instrument digital care integrează o formulă de readability pentru limba română bazată pe cercetare. LEMI este o resursă valoroasă pentru cadre didactice, părinți și copii, facilitând accesul la texte potrivite vârstei și ușor de citit.
Informații despre setul de date folosit pentru lucrare în GitHub aici.
A se cita ca:
Chitez, M., Dascalu, M., Udrea, A. C., Strilețchi, C., Csürös, K., Rogobete, R., & Oravițan, A. (2024, mai). Towards Building the LEMI Readability Platform for Children’s Literature in the Romanian Language. In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pages 16450–16456, Torino, Italy. ELRA and ICCL. Available at: https://aclanthology.org/2024.lrec-main.1429.pdf.