Igauņu valodas emocionālās runas korpuss

Kas ir igauņu emocionālās runas korpuss?

Igauņu valodas emocionālās runas korpuss (EEKK) ir Igaunijas Valodu institūta (Eesti Keele Instituut) valsts programmas „Igauņu valodas lingvistiski tehnoloģiskais atbalsts“ ietvaros izstrādājams korpuss, kas satur teikumus, kuri pauž dusmas, prieku un bēdas, kā arī neitrālus teikumus.

Korpuss balstās uz uzskatu, ka pēc balss iespējams pietiekoši labi atpazīt emocijas normālā nesamākslotā runā un ka nesamākslota runa ir dabīgas runas sintēzes priekšnosacījums (sk. Iida et al. 2003.)

Korpusam ir divi mērķi:

Korpusa uzticamību nodrošina uztveres testi: katram korpusa teikumam ir uztveres testa informācija par emociju atpazīstamību.

Pašlaik korpuss atrodas testēšanas fāzē.

Korpusu iespējams nepārtraukti paplašināt, pievienojot lasītājus, teikumus, emocijas utt.

Korpusā tiek integrēts Praat, kas ļauj korpusa lietotajam iegūt runas viļņa attēlus, kuri segmentēti pa skaņām (spektri, pamattonis u.c.).

Par korpusu vairāk sk. Altrov 2007, 2008; Altrov, Pajupuu 2008, 2010; Altrov, Pajupuu 2012.

Korpusa tehniskā izstrāde

Korpuss ir izstrādāts kā interneta aplikācija, izmantojot brīvo programmatūru: Linux, PostgreSQL, Python, Praat, NLTK. Visi dati, izņemot skaņas failus, tiek saglabāti PostgreSQL datubāzē. Interneta pieslēgums un visa datu apstrāde tiek veikta, izmantojot programmēšanas valodu Python un interneta vidi. Aplikāciju iespējams instalēt gan Windows, gan arī Linux vidē. Interneta pieslēgums ir igauņu, angļu, somu un latviešu valodā un viegli pielāgojams arī citām valodām. Sistēmas tehniskais apraksts šeit.

Parasta lietotāja pašreizējās iespējas, meklēšana

Korpusā var meklēt teikumus, kas pauž dusmas, prieku un bēdas, kā arī neitrālus teikumus.

Teikumi tiek attēloti kā teksts, un tos var noklausīties, uzklikšķinot uz tiem.

Pie teikuma tiek attēloti emociju uztveres procenti.

Teikumus iespējams meklēt, arī ievadot noteiktus uztveres procentus.

Meklēšanu iespējams ierobežot, lai atrastu tikai vēlamos teikumus, kuros:

Teikumu skaņu un tekstu iespējams saglabāt.

Altrov, Rene 2007. Emotsionaalse kõne korpuse loomine eesti keele tekst-kõne sünteesi jaoks. Tekstimaterjali evalvatsioon viha näitel. Magistritöö. Tartu Ülikool.

Altrov, Rene 2008. Eesti emotsionaalse kõne korpus: teoreetilised toetuspunktid. Keel ja Kirjandus, 4, 261 - 271.

Altrov, Rene; Pajupuu, Hille 2008. The Estonian Emotional Speech Corpus: Release 1. In: Proc. of the Third Baltic Conference on Human Language Technologies, František Čermak, Rūta Marcinkevičienė, Erika Rimkutė, Jolanta Zabarskaitė (eds.), 9-15. Vytauto Didžiojo Universitetas; Lietuviu Kalbos Institutas, Vilnius.

Altrov, Rene; Pajupuu, Hille 2010. Estonian Emotional Speech Corpus: Culture and Age in Selecting Corpus Testers. In: Human Language Technologies - The Baltic Perspective - Proc. of the Fourth International Conference Baltic HLT 2010, Inguna Skadiņa, Andrejs Vasiļjevs (eds.), 25-32. Amsterdam: IOS Press.

Altrov, Rene; Pajupuu, Hille 2012. Estonian Emotional Speech Corpus: Theoretical base and implementation. In: 4th International Workshop on Corpora for Research on Emotion Sentiment & Social Signals (ES3), Devillers, L., Schuller, B., Batliner, A., Rosso, P., Douglas-Cowie, E., Cowie, R., Pelachaud, C.(eds.),50-53. Istanbul.

Boersma, Paul; Weenink, David 2009. Praat: doing phonetics by computer (Version 5.1.01) [Computer program]. Retrieved February 26, 2009.

Iida, Akemi; Campbell, Nick; Higuchi, Fumito; Yasumura, Michiaki 2003. A corpus-based speech synthesis system with emotion. Speech Communication, 40, 161–187.