Olen kiinnostunut korpuslingvistiikasta, terminologiasta, luonnollisen kielen käsittelystä (Natural Language Processing) ja suurista kielimalleista (Large Language Models).
Pro gradu -tutkielmani (Turun yliopisto, 2016) käsitteli espanjankielistä shakkiterminologiaa. Tutkimukseni päätavoitteina oli tutkia 1) voiko korpuksessa käyttää skannattuja tiedostoja sellaisenaan eli ilman manuaalisesti tehtävää korjausprosessia ja 2) voiko erikoisalan termit tunnistaa mainitunkaltaisesta korpuksesta sillä perusteella, että ne ovat yliedustettuina verrattuna yleiskieleen. Vastaus molempiin tutkimuskysymyksiini oli myönteinen.
Tein samana vuonna samalta pohjalta suppeamman tutkimuksen romaniankielisestä shakkiterminologiasta. Tällä hetkellä tutkin mahdollisuuksia parantaa pro gradu -tutkielmassani käyttämääni menetelmää ja soveltaa sitä muihin kieliin. Seuraavat tutkimukseni kohteina olevat kielet ovat suomi, ruotsi, norja, tanska, saksa ja venäjä. Eri kieliversioiden tutkimisen jälkeen tarkoitukseni on tutkia erikoisalan suurien kielimallien mahdollisuuksia käyttäen esimerkkinä shakkia.