Corpus Estone del linguaggio emotivo
Il corpus Estone del linguaggio emotivo è un corpus in corso di realizzazione presso l'Istituto della Lingua Estone, nell'ambito del programma statale "Supporto tecnologico-linguistico della lingua estone", che contiene frasi lette - d'ira, di gioia, di tristezza e frasi neutrali.
Il corpus si basa sull'idea che le emozioni siano sufficientemente riconoscibili in base alla voce espressa nel discorso naturale non recitato, e che il discorso non recitato sia un presupposto della sintesi vocale naturale, cfr. Iida et al. 2003.
Il corpus si propone due obiettivi:
- fungere da base acustica della sintesi del testo-discorso emotivo;
- fungere da database attendibile per la ricerca delle emozioni espresse nel discorso.
L'attendibilità del corpus verrà garantita dai test di percezione: ogni frase nel corpus è provvista di dati relativi alla riconoscibilità dell'emozione ricavati dai test di percezione.
Il corpus è ampliabile con lettori, frasi, emozioni ecc.
Per ulteriori informazioni sul corpus consultare: Altrov 2007, 2008; Altrov, Pajupuu 2008, 2010; Altrov, Pajupuu 2012.
La realizzazione tecnica del corpus
Il corpus è realizzato come un'applicazione basata sul web, utilizzando i programmi freeware: Linux, PostgreSQL, Python, Praat, NLTK.
Le opzioni attuali per un utente comune, domande
Nel corpus, è possibile cercare frasi che esprimano emozioni come ira, gioia o tristezza, e frasi neutre.
Le frasi vengono visualizzate come testo e cliccando è possibile ascoltarle.
Accanto alla frase viene visualizzata la percentuale di percezione dell'emozione.
È possibile stabilire in anticipo una percentuale di percezione in base a cui le frasi vengono cercate.
È possibile limitare la domanda, richiedendo solo frasi in cui
- il testo non presenta alcuna influenza sulla percezione dell'emozione della frase
- il testo presenta qualche influenza sulla percezione dell'emozione della frase
È possibile salvare il suono e il testo delle frasi.
Altrov, Rene 2007. Emotsionaalse kõne korpuse loomine eesti keele tekst-kõne sünteesi jaoks. Tekstimaterjali evalvatsioon viha näitel. Magistritöö. Tartu Ülikool.
Altrov, Rene 2008. Eesti emotsionaalse kõne korpus: teoreetilised toetuspunktid. Keel ja Kirjandus, 4, 261 - 271.
Altrov, Rene; Pajupuu, Hille 2008. The Estonian Emotional Speech Corpus: Release 1. In: Proc. of the Third Baltic Conference on Human Language Technologies, František Čermak, Rūta Marcinkevičienė, Erika Rimkutė, Jolanta Zabarskaitė (eds.), 9-15. Vytauto Didžiojo Universitetas; Lietuviu Kalbos Institutas, Vilnius.
Altrov, Rene; Pajupuu, Hille 2010. Estonian Emotional Speech Corpus: Culture and Age in Selecting Corpus Testers. In: Human Language Technologies - The Baltic Perspective - Proc. of the Fourth International Conference Baltic HLT 2010, Inguna Skadiņa, Andrejs Vasiļjevs (eds.), 25-32. Amsterdam: IOS Press.
Altrov, Rene; Pajupuu, Hille 2012. Estonian Emotional Speech Corpus: Theoretical base and implementation. In: 4th International Workshop on Corpora for Research on Emotion Sentiment & Social Signals (ES3), Devillers, L., Schuller, B., Batliner, A., Rosso, P., Douglas-Cowie, E., Cowie, R., Pelachaud, C.(eds.),50-53. Istanbul.
Boersma, Paul; Weenink, David 2009. Praat: doing phonetics by computer (Version 5.1.01) [Computer program]. Retrieved February 26, 2009.
Iida, Akemi; Campbell, Nick; Higuchi, Fumito; Yasumura, Michiaki 2003. A corpus-based speech synthesis system with emotion. Speech Communication, 40, 161–187.