Onderzoek

Potlood, drop en toets

Tekst Bea Ros
Gepubliceerd op 11-07-2016 Gewijzigd op 28-07-2016
Ruim elf miljoen woorden staan er in het kindertaalcorpus BasiLex. Niet alleen handig voor toetsontwikkelaars en methodeschrijvers, ook leerkrachten kunnen er veel aan hebben.

Bij aanvang op de basisschool kennen kinderen gemiddeld 5.000 woorden. Ze breiden hun woordenschat onder meer uit door alles wat ze lezen. Na groep 8 beslaat hun woordenschat maar liefst 15.000 tot 17.000 woorden (tenminste voor kinderen met Nederlands als moedertaal). In BasiLex staan alle geschreven woorden die kinderen van zes tot twaalf jaar onder ogen krijgen. Deze database ontwikkelden taalonderzoekers van de Radboud Universiteit hebben met subsidie van NWO.

Daarvoor putten ze niet alleen uit onderwijsmateriaal (lesboeken, toetsen, samen goed voor 42%), maar ook uit lees- en stripboeken (38%). Ook haalden ze woorden uit door kinderen veel gebruikte massamedia (20%), zoals de websites van het Jeugdjournaal en voetbalclubs, en de ondertitels van veelbekeken kinderprogramma's, zoals Dance Academy en programma's op Disney Channel. Alle woorden zijn gelabeld op onder meer frequentie, woordsoort, lengte en leerjaar (voor welke leeftijd is de tekst waaruit het woord komt).

In totaal bevat het corpus 11,5 miljoen woorden. Daaruit proberen de onderzoekers nu een lijst met de 20.000 meest frequente woorden te destilleren. Die vergelijken ze met eenzelfde lijst uit SoNaR, het corpus van geschreven volwassenentaal. 'Zo ontstaat een streeflijst van woorden die kinderen aan het eind van groep 8 idealiter zouden moeten kennen,' vertelt projectleider Agnes Tellings.

De onderzoekers werken daarnaast aan een tool waarmee leerkrachten de moeilijkheidsgraad van teksten kunnen meten. 'Daarbij kijken we naar de hoeveelheid frequente woorden. Die zegt meer dan zinslengte.'

Leerkrachten kunnen in BasiLex ook zoeken naar de meest frequente woorden voor zeg leerlingen uit groep 5. Handig als je op zoek bent naar geschikte dicteewoorden, of als je wilt nagaan of de woordenschat van leerlingen aansluit bij het gemiddelde.

De onderzoekers werken ook aan een bestand van woorden die leerlingen zelf schrijven, BasiScript (zie Didactief Dating hieronder). Tellings: 'De vergelijking van beide bestanden kan een schat aan informatie opleveren over onder meer de ontwikkeling van spelling en woordenschat van leerlingen.'

Tekst: Bea Ros

Dit artikel is verschenen in de rubriek Onderzoek Kort van Didactief (april 2014).

Click here to revoke the Cookie consent