Keelekonverents paneb masintõlke proovile Vikipeedia häkatonil

11. apr. 2017 Tartu ülikool - Kommenteeri artiklit

19. ja 20. aprillil toimub Tallinnas konverents „Eesti keeletehnoloogia 2017”. Konverentsi eelpäev, 18. aprill on aga huvitavate töötubade päralt. Üks neist on masintõlkimise häkaton, kus proovitakse järele, kuidas saavad masinad Vikipeedia arendamisele kaasa aidata.
Emakeelepäeval käivitunud „Miljon+” projektiga soovitakse eestikeelse Vikipeedia tekstimahtu suurendada miljoni artiklini. „Kuidas saavad eesmärgile kaasa aidata tõlkemasinad, et seejuures keeleline ja sisuline kvaliteet säiliks? Just sellele küsimusele häkatonil lahendusi otsitaksegi,” rääkis konverentsi üks korraldajatest Kadri Vare.
Häkatonil kasutatakse uusimaid närvivõrkudel põhinevaid masintõlkemudeleid, mis pakuvad ladusat eestikeelset tõlget just järeltoimetamise otstarbeks. Osalevad nii tõlkijad, kes annavad hinnanguid tõlkimismeetoditele, kui ka toimetajad, kes pimesi hindavad järeltoimetatud masintõlget ning inimtõlget.
Üheks masintõlkevahendiks, mida kasutatakse, on TÜ arvutiteaduse instituudi masintõlkeprojekt „KaMa” („Kasutatav eesti masintõlge”), mida arendab TÜ keeletehnoloogia õppetooli juhataja Mark Fišel. Proovile pannakse ka eraturul masintõlget pakkuv Tilde Eesti OÜ tõlkeprogramm.
Samuti toimub Pythoni tarkvarateegi töötuba. Python pakub eestikeelsete tekstide töötlemiseks mitmeid kasutusvõimalusi. Töötoa korraldab ka Eesti esimene keeletehnoloogia idufirma TEXTA, mis on töövahendite raamistik vabatekstiliste (suur)andmetega tutvumiseks ja nende analüüsimiseks. Töötoa raames kasutatakse seda ühe Eesti ministeeriumi dokumendiregistri uurimiseks. „Näiteks, kes ja millistel teemadel kirjutab ministeeriumisse kõige rohkem kirju, mil määral ja milliseid isikuandmeid leidub avaldatud dokumentides või milliseid tüüpvastuseid ametlikus kirjavahetuses kasutatakse,” rääkis Vare.
19. aprillil on kavas ka lõppeva riikliku Eesti keeletehnoloogia programmi ülevaade ning uue programmi tutvustus. Samuti saab tutvuda keeletehnoloogilise tarkvara ja rakendustega. 20. aprillil on keeleressurssidega tegelevate projektide päev Eesti Keele Instituudis, mis toimub rööpselt traditsioonilise rakenduslingvistika kevadkonverentsiga.
Oodatud on kõik huvilised! Konverents ja õpipajad on tasuta, vajalik on registreerumine aadressil www.keeletehnoloogia.ee.


Kirjuta kommentaar

Õpetajate Lehel on õigus avaldada teie kirjutatud kommentaar paberväljaandes. Kommentaari pikkus ei tohi ületada 3000 tähemärki. Õpetajate Lehe kodulehe kommentaarid on modereeritavad ja avaldatakse pärast toimetamist hiljemalt kommentaari saatmisele järgneva tööpäeva hommikuks. Lehel on õigus jätta saadetud kommentaar kodulehel avaldamata. Iga kommentaari edastaja arvuti IP-aadress, sessiooni identifikaator ja kommenteerimise aeg salvestatakse andmebaasis. Õpetajate Leht ei vastuta kommentaaride sisu eest!