Õppematerjalide jõukohasuse elektrooniline hindamine

20. nov. 2015 Jaan Mikk Tartu ülikooli emeriitprofessor - 2 kommentaari

Vajame eesti keele loetavuse valemit, et hinnata meie õppetekstide jõukohasust eri vanuses õpilastele.

Üldtuntud põhimõtte järgi peaksid õppeülesanded olema õpilastele jõukohased. Jõukohane õppetöö võimaldab saavutada edu ja tunda koolist rõõmu. Liiga keerulised ülesanded tekitavad frustratsiooni, vähendavad soovi õppida ja võivad põhjustada käitumisprobleeme.

Õppetekstide keerukuse kohta tegid meil viimati ulatusliku uuringu Helin Puksand ja Krista Kerge (emakeele seltsi aastaraamat, 2011). Põhikooli teise astme uuritud õpikute seas oli kaks õpikut, mille tekst oli raskem täiskasvanutekstidest.

Helin Puksand ja Krista Kerge kasutasid tekstide keerukuse näitajatena kõigepealt sõnade ja lausete pikkust. Need on tõesti olulised ja lihtsad näitajad. Pikemad sõnad esinevad keeles harvemini ja on vähem tuntud. Samuti tähistavad pikemad sõnad sagedamini mõisteid, mida pole võimalik meeltega tajuda ja mida on seetõttu keeruline mõista. Pikad laused on sageli struktuurilt keerukad, nad ületavad õpilaste töötava mälu mahu ja neist on raske esimesel lugemisel aru saada.

Sõna ja lause pikkus on sageli kombineeritud üheks teksti loetavuse (keerukuse) näitajaks. Neid valemeid on eri keeltele tuletatud üle saja ja neid kasutatakse tekstide jõukohasuse hindamiseks hariduses, meditsiinis, sotsioloogias jne. Eesti keeles tehtud uuring näitas, et keerukamate õpikute puhul ei suuda suur hulk õpilasi nende sisu nõuetekohaselt omandada. Kui tekst osutub kavandatud auditooriumile liiga keerukaks, tuleks seda enne trükkimist muuta. Tuleb tõdeda, et need tekstimuudatused võivad tähendada kogu teksti sisu kriitilist ülevaatamist.

Populaarsemad loetavuse valemid

Loetavuse valemite olulisusest räägib fakt, et inglise keele populaarseim loetavuse valem – Flesch-Kincaidi valem – on programmeeritud Microsoft Office’is. Valemi sisselülitamiseks tuleb valida File Options Proofing Show readability statistics. Microsoft Office näitab siis peale keelekorrektuuri ka seda, millise klassi tasemel peaks olema õpilase lugemisoskus, et analüüsitavat teksti korralikult mõista.

Tänapäeva täiuslikem teksti keerukuse hindamise süsteem on Coh-Metrixs (http://cohmetrix.com/). Programm näitab, mil määral on analüüsitav tekst jutustav, kuivõrd keerukas on teksti süntaks, kui konkreetsed on teksti sõnad ja kui hästi on teksti osad omavahel seotud. Lisaks arvutab programm välja teksti loetavuse ülalnimetatud indeksi.

Teksti mõistetavuse määramiseks on internetis vabalt kättesaadavad mitu kalkulaatorit, näiteks http://www.online-utility.org/english/readability_test_and_improve.jsp. Need kalkulaatorid arvutavad välja analüüsitava teksti loetavuse mitme populaarse valemi järgi. Probleem on aga selles, et valemid arvutavad õigesti vaid inglis­keelsete tekstide keerukust. Eesti­keelsetel tekstidel teevad nad küll arvutused ära, kuid keerukuse näitaja pole ilmselt õige. Näiteks Flesch-Kincaidi valem hindas eestikeelsed tekstid umbes viie klassi jagu keerulisemaks, kui need olid eesti keeles tehtud katsete kohaselt. Nii suur erinevus tuleneb keelte erinevusest: eesti keeles on tunduvalt pikemad sõnad ja selle tõttu tulebki Flesch-Kincaidi keerukuse indeks kõrgem.

Kriteeriumiks sõna- ja lausepikkus?

Kuni meil pole programmeeritud eestikeelsete tekstide keerukusvalemit, jääb meil üle teine tee: me saame tekstide keerukust hinnata kahe põhinäitaja järgi: sõna pikkus ja lause pikkus. Elektroonilistes õppematerjalides on neid näitajaid suhteliselt lihtne leida. Tuleb tekst kopeerida mõnda interneti loetavuse (readability) kalkulaatorisse ja tulemustes annab kalkulaator tavaliselt ka teksti sõnade ja lausete keskmise pikkuse. Kuna need kalkulaatorid leiavad aga teksti lausete arvu, kasutades punktide arvu tekstis, on oluline jätta analüüsitavasse teksti vaid lausete lõpul olevad punktid.

Kasutasin ülalnimetatud kalkulaatorit mõne meil internetis vabalt kättesaadava õpiku keerukuse hindamiseks. Igast õpitekstist oli vaatluse all vähemalt viis väljavõtet kogumahuga umbes tuhat sõne ehk eksemplarsõna. Analüüsi tulemused on tabelis 1.

Tabelist näeme, et kõige keerulisema sisuga olid väljavõtted füüsika ja ühiskonnaõpetuse õpikust – sõne keskmine pikkus üle seitsme tähe. Sisult kõige lihtsamaks osutus õpikutele võrdluseks võetud „Mahtra sõja” ümberjutustus. Esituse struktuur oli kõige keerulisem ühiskonnaõpetuse ja kirjanduse teooria õpikutes – lause keskmine pikkus üle 16 sõna. Ülejäänud õpikute ja „Mahtra sõja” ümberjutustuse esituse struktuur oli tunduvalt lihtsam, kusjuures füüsika õpikus oli struktuurikeerukus väikseim.

Taolise analüüsi tulemused võivad õpetajaid ja õpikute autoreid aidata. Õpetajad saavad vaadata, kas õpiku keerukus võiks vastata nende õpilaste lugemisoskuse tasemele. Õpikute autorid saavad vaadata, kas nende kirjutatud tekst on tunduvalt lihtsam või keerukam kui teistes õpikutes, mis on samale vanuseastmele kirjutatud. Kui tekst on traditsioonilistest headest tekstidest tunduvalt erineva lause- või sõnapikkusega, võib autoritel tekkida soov oma teksti arendada.

Mitmenda klassi õpilasele õpik sobib?

Oleks hea, kui õppeteksti keerukuse analüüsi järel saaks kohe teada, millise klassi õpilastele üks või teine õppematerjal sobib. Ingliskeelsete tekstide puhul ongi see ju võimalik – nende teksti loetavuse valemid näitavad, millise klassi õpilastele on õppematerjal jõukohane.

Praegu võib meil siin kasu olla keskmistest lause- ja sõnapikkustest tekstides, mis õpilastele sobivad eri klassides. Eestikeelsete populaarteaduslike tekstidega tehtud katsete põhjal võib meie gümnaasiumiõpilastele sobivaks pidada tabelis 2 toodud keskmisi sõne- ja lausepikkusi.

Tabelite võrdluses näeme, et sisu keerukuselt sobib gümnaasiumi lõpuklassile ainult kirjanduse õpik, teised õpikud kipuvad keerukad olema. Ka Mahtra sõja ümberjutustus ei sobi gümnaasiumis õppetööks – see on sisult liiga lihtne. Kahe pikimate lausetega õpiku lausestruktuur tundub olevat gümnaasiumiõpilastele liiga keerukas, kaks ülejäänud õpikut sobivad hästi gümnaasiumiõpilastele.

Lühimad laused olid õpikus, mille sõnad olid pikimad – milline koondhinnang sellele õpikule siis anda? Vastata saame, kui meil on tänapäeva eestikeelsete õppetekstide keerukuse valem. Eesti keeles on väga hästi arenenud arvutilingvistikaalane uurimistöö ja oskusteave keerukuse valemi arendamiseks on samuti olemas. Programmeeritud keerukusvalemi olemasolu oleks meil samm edasi veelgi kvaliteetsemate õppematerjalide loomisel.


2 kommentaari teemale “Õppematerjalide jõukohasuse elektrooniline hindamine”

  1. Avar Pentel ütleb:

    Arvutustehniliselt on analoogse loetavuse indeksi loomine eestikeelsete tekstide jaoks väga lihtne. Tegin ühe programmi ja kirjutasin paar artiklit sellest, kuidas loetavuse valemites kasutatavate muutujate abil automaatselt ennustada eestikeelse teksti autori vanust.

    Kuid loetavuse valemi loomine eeldab suurt kogumit erinevate vanusegruppide peal eelnevalt testitud tekste. Kui soovime, et meie loetavuse valem väljastaks numrilise väärtuse, mis näitaks mitu aastat haridust on vaja mingi teksti mõistmiseks, siis peaks olema kuni 20 vanusegruppi testitavaid.

    Artiklis oli viide mingile eestikeelsete tekstide loetavuse uuringule. Kas oleks võimalik saada selle kohta täpsemat informatsiooni või viite? Millised vanusegrupid seal osalesid, kui suur oli valim ja millise metoodikaga hinnati teksti loetavust?

  2. Jaan Mikk ütleb:

    Tere,

    Lugesin Teie kommentaari alles nüüd.

    Väga hea, et olete teinud teksti analüüsi programmi. Täiesti nõus, et vajalikud on ka teksti mõistmise katsete tulemused.

    Olen selle kohta avaldanud raamatu inglise keeles. Võime pikemalt võimalusi analüüsida e-maili teel.

    Jaan Mikk
    jaan.mikk@ut.ee

Leave a Reply to Avar Pentel

Õpetajate Lehel on õigus avaldada teie kirjutatud kommentaar paberväljaandes. Kommentaari pikkus ei tohi ületada 3000 tähemärki. Õpetajate Lehe kodulehe kommentaarid on modereeritavad ja avaldatakse pärast toimetamist hiljemalt kommentaari saatmisele järgneva tööpäeva hommikuks. Lehel on õigus jätta saadetud kommentaar kodulehel avaldamata. Iga kommentaari edastaja arvuti IP-aadress, sessiooni identifikaator ja kommenteerimise aeg salvestatakse andmebaasis. Õpetajate Leht ei vastuta kommentaaride sisu eest!