Valentsikorpus
Korpus on loodud Eesti Keele Instituudis riikliku programmi "Eesti keeletehnoloogia 2011-2017" raames.
Korpus koosneb "Postimehe" ja "Õhtulehe" artiklite ja kommentaaride ortograafilistest lõikudest (4088), mille emotsionaalsuse (positiivne, negatiivne, vastuoluline, neutraalne) on määranud lugejad. Kasutatud on domineeriva arvamuse meetodit (Pennebaker et al. 1997).
Valentsikorpus on mõeldud eeskätt statistiliste mudelite treenimiseks, kuid seda saab kasutada ka muudel eesmärkidel.
Korpusest täpsemalt: https://doi.org/10.7592/FEJF2016.64.polarity
Identifying polarity in different text types. Folklore: Electronic Journal of Folklore, 64, 25−42.Korpuse allalaadimine ja viitamine
https://doi.org/10.6084/m9.figshare.24517054.v1
Estonian Valence Corpus / Eesti valentsikorpus. figshare. Dataset.Päringud
Legend:
- "Postimehe" rubriigid: ARVAMUS, KULTUUR, SPORT, VÄLISMAA, KRIMI, EESTI, KOMM-P-EESTI (Eesti kommentaarid)
- "Õhtulehe" rubriigid: ELU-O (Elu), KOMM-O-ELU (Elu kommentaarid)