Valentsikorpus

Korpus on loodud Eesti Keele Instituudis riikliku programmi "Eesti keeletehnoloogia 2011-2017" raames.

Korpus koosneb "Postimehe" ja "Õhtulehe" artiklite ja kommentaaride ortograafilistest lõikudest (4088), mille emotsionaalsuse (positiivne, negatiivne, vastuoluline, neutraalne) on määranud lugejad. Kasutatud on domineeriva arvamuse meetodit (Pennebaker et al. 1997).

Valentsikorpus on mõeldud eeskätt statistiliste mudelite treenimiseks, kuid seda saab kasutada ka muudel eesmärkidel.

Korpusest täpsemalt: Pajupuu, Hille; Altrov, Rene; Pajupuu, Jaan (2016). Identifying polarity in different text types. Folklore: Electronic Journal of Folklore, 64, 25−42. https://doi.org/10.7592/FEJF2016.64.polarity

Korpuse allalaadimine ja viitamine

Pajupuu, Hille; Pajupuu, Jaan; Altrov, Rene; Tamuri, Kairi (2023). Estonian Valence Corpus / Eesti valentsikorpus. figshare. Dataset. https://doi.org/10.6084/m9.figshare.24517054.v1

Päringud

Legend:
Näita kõiki artikleid