Corpus Estone del linguaggio emotivo

Il corpus Estone del linguaggio emotivo è un corpus in corso di realizzazione presso l'Istituto della Lingua Estone, nell'ambito del programma statale "Supporto tecnologico-linguistico della lingua estone", che contiene frasi lette - d'ira, di gioia, di tristezza e frasi neutrali.

Il corpus si basa sull'idea che le emozioni siano sufficientemente riconoscibili in base alla voce espressa nel discorso naturale non recitato, e che il discorso non recitato sia un presupposto della sintesi vocale naturale, cfr. Iida et al. 2003.

Il corpus si propone due obiettivi:

L'attendibilità del corpus verrà garantita dai test di percezione: ogni frase nel corpus è provvista di dati relativi alla riconoscibilità dell'emozione ricavati dai test di percezione.

Il corpus è ampliabile con lettori, frasi, emozioni ecc.

Per ulteriori informazioni sul corpus consultare: Altrov 2007, 2008; Altrov, Pajupuu 2008, 2010; Altrov, Pajupuu 2012.

La realizzazione tecnica del corpus

Il corpus è realizzato come un'applicazione basata sul web, utilizzando i programmi freeware: Linux, PostgreSQL, Python, Praat, NLTK.

Le opzioni attuali per un utente comune, domande

Nel corpus, è possibile cercare frasi che esprimano emozioni come ira, gioia o tristezza, e frasi neutre.

Le frasi vengono visualizzate come testo e cliccando è possibile ascoltarle.

Accanto alla frase viene visualizzata la percentuale di percezione dell'emozione.

È possibile stabilire in anticipo una percentuale di percezione in base a cui le frasi vengono cercate.

È possibile limitare la domanda, richiedendo solo frasi in cui

È possibile salvare il suono e il testo delle frasi.

Altrov, Rene 2007. Emotsionaalse kõne korpuse loomine eesti keele tekst-kõne sünteesi jaoks. Tekstimaterjali evalvatsioon viha näitel. Magistritöö. Tartu Ülikool.

Altrov, Rene 2008. Eesti emotsionaalse kõne korpus: teoreetilised toetuspunktid. Keel ja Kirjandus, 4, 261 - 271.

Altrov, Rene; Pajupuu, Hille 2008. The Estonian Emotional Speech Corpus: Release 1. In: Proc. of the Third Baltic Conference on Human Language Technologies, František Čermak, Rūta Marcinkevičienė, Erika Rimkutė, Jolanta Zabarskaitė (eds.), 9-15. Vytauto Didžiojo Universitetas; Lietuviu Kalbos Institutas, Vilnius.

Altrov, Rene; Pajupuu, Hille 2010. Estonian Emotional Speech Corpus: Culture and Age in Selecting Corpus Testers. In: Human Language Technologies - The Baltic Perspective - Proc. of the Fourth International Conference Baltic HLT 2010, Inguna Skadiņa, Andrejs Vasiļjevs (eds.), 25-32. Amsterdam: IOS Press.

Altrov, Rene; Pajupuu, Hille 2012. Estonian Emotional Speech Corpus: Theoretical base and implementation. In: 4th International Workshop on Corpora for Research on Emotion Sentiment & Social Signals (ES3), Devillers, L., Schuller, B., Batliner, A., Rosso, P., Douglas-Cowie, E., Cowie, R., Pelachaud, C.(eds.),50-53. Istanbul.

Boersma, Paul; Weenink, David 2009. Praat: doing phonetics by computer (Version 5.1.01) [Computer program]. Retrieved February 26, 2009.

Iida, Akemi; Campbell, Nick; Higuchi, Fumito; Yasumura, Michiaki 2003. A corpus-based speech synthesis system with emotion. Speech Communication, 40, 161–187.