Nurmevere Logo Nurmevere Võtke Ühendust
Võtke Ühendust

Kuidas kõnetuvastus muudab audiomaterjali tekstiks

Uurime, kuidas AI ja keeleteadus töötavad koos, et muuta räägitud sõnad täpseks tekstiks. Tutvustan kõnetuvastuse tehnoloogiat, mis teeb eesti keele digitaalsed ressursid ligipääsetavamaks.

6 min Algtase Aprill 2026
Mikrofon stuudios sinine LED valgusega, professionaalne kõnetuvastuse seadistus
Kaarina Kõlvart

Autor

Kaarina Kõlvart

Keeletehnoloogia juht

Mis on kõnetuvastus?

Kõnetuvastus on tehnoloogia, mis muundab räägitud sõnad kirjalikuks tekstiks. See't tegemist arvutiprogrammiga, mis kuulab heli ja otsustab, millised sõnad inimene ütles. Tehnoloogia on käesoleval ajal palju arenenud ja saab nüüd eesti keeles üsna hästi aru.

Süsteem töötab neuronvõrkude abil. Need on arvutiprogrammid, mis õpivad mustrite äratundmisest suurte andmehulkade põhjal. Kui annate kõnetuvastusele tuhandeid näiteid eesti keele kuuldavast, õpib see ära, kuidas eesti keelt räägitakse ja kuidas erinevad sõnad helivõngetega seotud on.

Arvutiekraani taga inimene, kes kuulab heli, kõrvaklapid, helitöötlus, sinine ja valge värv
Helilained ekraanil, spektrogramm, oranž ja kollane värvus, akustiline andmetöötlus

Kuidas see tegelikult toimib

Kõnetuvastus jaguneb kolmeks põhietapiks. Esimene on helikvaliteedi analüüs. Arvuti võtab helifaili ja vaatab, millised helisagedused selles olemas on. See'il protsessil välistatakse müra ja tugevdatakse kõnehelit.

Teine samm on tunnustamine. Siin võrdletakse helimustrit tuntud sõnade helimustritega. Arvut teab, et sõna "kool" kõlab nii ja nii. Kui uus heli sarnaneb sellele, otsustab ta, et see on "kool".

Kolmas etapp on teksti genereerimine. Arvuti paneb kõik äratuntud sõnad kokku õiges järjekorras ja lisab õigekirjutuse. Tulemuseks on lõpuks tekstifail, mida saate lugeda ja redigeerida.

Miks on see eesti keele jaoks oluline

Eesti on väike keel. Maailmas räägib eesti keelt umbes 1,2 miljonit inimest. See tähendab, et suurte tehisintellekti firmade jaoks pole alati otseselt huvi eesti keelt arendada. Kui aga eestlased saavad ise head vahendeid teha, muutub see mudelik ka teiste väikeste keelte jaoks.

Kõnetuvastus avab uusi võimalusi. Õpetajad saavad teha õppevideotest automaatsed subtiitrid. Raamatukogud saavad digitaliseerida helilindistused ja teha need otsingust leitavaks. Teadlased saavad analüüsida, kuidas me räägime, ilma et pealtkuulijad käsitsi kirja paneksid. See't juba päris korralik muudatus.

Kooliklassiruumi õpetaja, kes näitab arvutiekraani õpilastele, õppevideo, subtiitrid, roheline tahvel
Arvuti monitor, kõnetuvastuse programm, punane ja valge liides, teksti redigeerimine, tõrked parandatud

Mis veel paremaks teha tuleb

Kõnetuvastus pole alati täiuslik. Eesti keeles on palju dialekte. Keegi räägib eesti keelt pöide aktsendiga, keegi mujalt maalt. Kõnetuvastus võib segadusse jääda. Samuti on probleemiks äärmiselt pika või kiirega räägitud tekst — sel juhul võib tarvis olla korduvalt kuulata ja parandada.

Teine asi on erialane sõnavara. Kui rääkida meditsiinist, kasutame eri sõnu kui rääkides spordi. Kõnetuvastus peab teadma, et teatud kontekstis on üks sõna õige, teises kontekstis teine. See nõuab põhjalikku treenimist.

Hea uudis on see, et meie teeme seda tööd. Iga päev kogume uusi näiteid, parandame mudeli täpsust. Kuus kuud tagasi oli täpsus 92 protsenti. Nüüd on see 96 protsenti. Paar aastat pärast peaksime jõudma 99 protsendini.

Praktilised rakendused täna

Kõnetuvastust kasutatakse juba palju kohtades. Õigusasutused kasutavad seda kohtuistungite transkribeerimiseks. Arstid kasutavad seda meditsiiniliste märkmete kirjutamiseks. Meediaettevõtted teevad uudiste helilindistustest automaatseid kirjalike kokkuvõtteid.

Ligipääsetavus on suur teema. Kurdid ja kuulmishäirega inimesed vajavad subtiitrite ja transkriptsioonide jaoks. Kõnetuvastus muudab videod ja podkasite ligipääsetavamaks. See't mitte ainult mugavuse küsimus — see on inimõiguste küsimus.

Podcast stuudio, mikrofon, heliloualud, inimene rääkib, helitöötlemise seadmed, tummid nõuded

Tuleviku vaade

Kõnetuvastus muudab seda, kuidas me heliga töötame. Pole enam vaja käsitsi kõike kirja panna. Arvuti teeb selle tööd ära kiiresti ja üsna täpselt. Ja parimad on siis, kui see tehisintellekt õpib eesti keelt tegelikult hästi.

Järgmised aastad toovad palju muutusi. Reaalajas tõlkimine, heliredigeerijad, isegi muusikaline transkriptsioon — need kõik muutuvad võimalikuks paremate kõnetuvastuse mudelitega. Ja kõik see algab helistest, mis teisendatakse tekstiks.

Kui soovid rohkem teada eesti keeletehnoloogia muudest aspektidest, vaata meie teisi artikeleid. Iga lugu aitab paremini mõista, kuidas keelt ja tehisintellekti saab koos kasutada.

Teabeavaldus

Käesolev artikkel on informatiivne ja hariduslik materjal. Selle eesmärk on tutvustada kõnetuvastuse tehnoloogiat ja selle rakendusi eesti keeles. Artiklil ei ole eesmärgiks pakkuda erialast nõu ega garanteerida, et kirjeldatud tehisintellekti mudelid on sobivad teie konkreetsetele vajadustele. Kui plaanite kasutada kõnetuvastuse tehisintellekti oma organisatsioonis, palun konsulteerige spetsialistidega, kes saavad hinnata teie konkreetset konteksti ja vajadusi.