De uitdaging van het verdere overleg is te komen tot een gemeenschappelijk perspectief om van daaruit meer duidelijkheid te geven over zowel de waarde als de problematische kanten van toetsing, en wat dit betekent voor de stappen die gezet moeten worden. Dit artikel is te zien als een tussenbalans, waaruit blijkt dat overeenstemming bestaat over drie functies van toetsen. De inhoud geeft alleen de visie van de auteurs en heeft niet de pretentie om een samenvattend beeld van de gevoerde discussie te geven.
Een debat over toetsing is zinvol én nodig in verband met de curriculumherziening. Zo’n herziening biedt weer ruimte opnieuw over toetsing na te denken. Discussie over toetsen leidt echter al snel tot kampen van voor- en tegenstanders met weinig ruimte voor nuance. De auteurs van dit artikel doen daarom een handreiking om in verder overleg de polarisatie te overstijgen en een waardevol debat over toetsing mogelijk te maken.
In het onderwijs onderscheiden we grofweg drie categorieën functies van toetsen. Er zijn toetsen gericht op selectie- of plaatsingsbeslissingen (Wie is waarvoor wel of niet toelaatbaar?). Bovendien zijn er toetsen gericht op het vaststellen van resultaten vanuit een accountability-gedachte (Hebben deze leerlingen genoeg geleerd? Is dat in lijn met wat verwacht mag worden?) en ten slotte zijn er toetsen bedoeld om feedback te genereren (Waar staat de leerling nu? Wat gaat goed en wat kan beter?).
In het hedendaagse onderwijs wordt groot belang gehecht aan de scores op toetsen en examens. Daarom moeten we samen om de tafel om vanuit verschillende perspectieven na te denken over de mogelijkheden die toetsen bieden. Onderstaande indeling is bedoeld om het gesprek over toetsing in nieuwe banen te leiden, weg van de polarisatie.
1 Selectie en plaatsing
Het Nederlandse onderwijsstelsel kent diverse vormen van voortgezet onderwijs met verschillen in de mogelijkheden voor vervolgonderwijs ná het voortgezet onderwijs. Concreet betekent dit dat de overgang van basis- naar voortgezet onderwijs gevolgen heeft voor de vervolgstappen. Het Nederlandse stelsel heeft zich daarom over het vraagstuk van selectie moeten buigen. Belangrijkste vraag is: hoe zorgen we dat we de leerlingen voor de best bij hen passende schoolsoorten selecteren?
Deze selectie wordt in Nederland primair door de leerkracht in het po bepaald. Het oordeel van de leerkracht is leidend in de totstandkoming van het schooladvies voor het voortgezet onderwijs. Echter, als het onafhankelijke toetsadvies hoger uitvalt dan het oorspronkelijke advies van de leerkracht, moet deze het advies bijstellen.
In de wereld van toetsing is de vraag naar de juiste keuze begrijpelijkerwijs aangepast naar: hoe zorgen we dat de kans zo klein mogelijk is dat we iemand ten onrechte toelaten of afwijzen. Dat laatste wordt belangrijker geacht dan het eerste. Daarmee wordt duidelijk dat de selectie gepaard gaat met ‘fouten’.
Juist omdat toetsen en menselijke oordelen beperkingen hebben, wordt de combinatie toegepast van toetsuitkomsten en de inschatting van de leerkrachten. Deze aanpak geldt niet alleen bij de overgang van po naar vo, maar ook in het vo. Daar is het schoolexamen samen met de uitkomsten van het centraal schriftelijk examen bepalend voor slagen of zakken.
2 Accountability
Onderwijs is een post op de begroting waar veel geld mee gemoeid is. De vraag of dit geld de investering waard is, lijkt in dat licht dan ook begrijpelijk. Het onderwijsproces is gericht op het bereiken van doelen, die voor het curriculum zijn geformuleerd. Die doelen zijn voor een deel te toetsen en deels niet of moeilijk meetbaar. Aan het eind van een leergang of opleiding wordt de balans opgemaakt. Zijn de doelen bereikt?
Bij accountability wordt meestal verantwoording afgelegd aan een externe partij, bijvoorbeeld de Onderwijsinspectie. Maar ook de term ‘interne accountability’ wordt gebruikt, bijvoorbeeld bij schoolzelfevaluatie. Externe accountability is met name gebaseerd op meetbare opbrengstindicatoren en maakt daarnaast gebruik van procesindicatoren van het aangeboden onderwijsprogramma. Bij accountability gaat het om summatieve toetsing, gericht op een eindoordeel.
In Nederland worden opbrengstindicatoren zowel gebaseerd op toetsen (referentieniveaus en examens) als op doorstroomuitkomsten. Een voorbeeld van deze laatste categorie in het voortgezet onderwijs is het percentage leerlingen dat zonder vertraging het einddiploma haalt.
In Angelsaksische landen, met name de VS, wordt gebruikgemaakt van op toetsen gebaseerde accountability-procedures die grote consequenties hebben voor scholen en leraren (bijvoorbeeld schoolsluiting, vermindering van budget of salaris, of zelfs ontslag voor leraren). In vergelijking daarmee is het accountabilitybeleid van de Nederlandse overheid mild. Het komt zelden voor dat drastische maatregelen genomen worden. Scholen tillen wel aan eventuele reputatieschade bij lage scores op de inspectie-indicatoren.
Er is dus alle reden om ook vanuit het accountability perspectief oog te hebben voor de kwaliteit van toetsgegevens, die de basis zijn voor sommige opbrengstindicatoren. In het basisonderwijs zijn dat de gegevens die gebruikt worden om de referentieniveaus te bepalen en in de tweede fase van het voortgezet onderwijs de examens.
3 Toetsen om te leren
Iedereen die lesgeeft heeft behoefte te weten of de overdracht geslaagd is. Dat is een soort ‘reality check’ bij het lesgeven. Het is ingeburgerd in de onderwijspraktijk door vragen te stellen of beurten te geven. Ook toetsen worden hiervoor ingezet. Dit gebruik van toetsen wordt wel aangeduid als ‘assessment for learning’.
Het vaststellen van ‘leren’ is buitengewoon lastig. Soms is er juist bij een leerling die fouten maakt, sprake van een ontwikkeling in de goede richting. En is er bij een leerling die alles goed doet juist sprake van een korte termijneffect, wat maakt dat hij de leerstof een week later helemaal kwijt is. Het monitoren van ‘leren’ vraagt dan ook om creativiteit en veelvormigheid waar toetsen een onderdeel van kunnen vormen. Herhaald gebruik van toetsen kan daarbij tevens bijdragen aan het ‘inslijpen’ van het geleerde en daarmee van nut zijn bij het daadwerkelijk leren. Alle informatie die in de onderwijspraktijk wordt verzameld, helpt de leerkracht om tot een professioneel oordeel te komen waarmee hij de leerling verder kan helpen.
4 Meerdere functies van toetsen
Alle drie de functies van toetsing zijn van waarde. Bijzonder is dat de verschillende functies van toetsing nogal eens gecombineerd worden in één toets. Het praktische voordeel hiervan is synergie. Maar het hybride gebruik van toetsen roept ook vragen op. Een passende toets bedenken voor een bepaalde functie is al razend ingewikkeld, maar verschillende functies bedienen met één toets is een nog grotere uitdaging.
Dit is aan de orde bij de doorstroomtoets. Daarbij worden de functies plaatsing/selectie en accountability gecombineerd. De doorstroomtoets is enerzijds bedoeld om de leerlingen individueel van een passend schooladvies te voorzien. Tegelijkertijd moeten scholen op basis van de uitkomsten aantonen of ze resultaten weten te boeken bij het behalen van de referentieniveaus, waarmee een fel begeerde ‘voldoende’ van de Inspectie van het Onderwijs kan worden verkregen.
Iets vergelijkbaars geldt voor de meeste LVS-toetsen. Die zijn een combinatie van plaatsing en toetsing om te leren. De LVS-toetsen geven een beeld van de algemene schoolse ontwikkeling van de leerlingen in vergelijking met het landelijke gemiddelde en bieden mogelijkheden om de vooruitgang van leerlingen te bepalen. Het is echter maar de vraag of er een voldoende afspiegeling van de leerdoelen wordt geboden als waardevolle informatie voor de leerkracht om instructie op te baseren. Doorstroomtoetsen en volgsystemen hebben momenteel in de dagelijkse werkelijkheid van het onderwijs meerdere functies tegelijkertijd. De hierboven opgeworpen vragen zijn echter aanleiding om de bestaande praktijk nog eens verder door te lichten.
5 Discussie
Het blijft zaak de mogelijkheden en beperkingen van toetsing in het licht van de beoogde functies te blijven zien. Toetsen zijn hulpmiddelen die hun waarde kunnen hebben, mits welbewust ingezet en gebruikt. En tegelijkertijd moet nagedacht worden over hoe toetsen hun weg kunnen vinden naar functies die ze nu misschien veel te beperkt kunnen vervullen. Voor het verbeteren van kwaliteit van onderwijs is het gebruik van goede, passende toetsen van cruciaal belang. De op handen zijnde curriculumherziening vormt een goed moment om opnieuw, grondig en vanuit de waarde van het streven naar (meer) onderwijskwaliteit naar toetsen en hun functies te kijken, en te zorgen voor waardevolle aanvulling van het toets arsenaal passend bij de ambities die we hebben. Daar zijn leerlingen bij gebaat, hun leerkrachten en daarmee ook hun scholen en toezichthouders. De toegenomen belangstelling voor een goede aansluiting tussen toetsen en curriculum, aangeduid met de term ‘alignment’, en voor criteriumgericht toetsen, kan dan ook als een positieve ontwikkeling worden gezien.
Het onderschrijven van de drie functionele toepassingen van toetsen impliceert een positieve grondhouding ten opzichte van de specifieke waarden die toetsen wel degelijk kunnen hebben, zoals meetbaarheid en onpartijdigheid, in aanvulling op professionele beoordeling door betrokkenen in het onderwijs. Daarbij is het van belang dat er ruimte komt om met alle betrokkenen het gesprek te voeren over wat aan toetsing voor wie in het onderwijs van waarde is. De indeling die we hier in dit artikel hanteren is bedoeld om het gesprek over toetsing in nieuwe banen te leiden, weg van de polarisatie. Onder het woord ‘toets’ kan een veelheid aan type metingen schuilgaan en het is relevant hierover eerst meer duidelijkheid te hebben om zowel duiding te kunnen geven aan de huidige toetsen en hun waarde, maar ook om toekomstige behoeften goed te kunnen duiden. In het licht van het nadenken over kwaliteit van onderwijs is het van belang dat de discussie van ‘al dan niet toetsen’ verschuift naar hoe ‘zo goed mogelijk toetsen’ kan worden vormgegeven. Dat is een belangrijke stap vooruit, voorbij de polemiek die nu nog wel eens een goed gesprek over toetsing in de weg staat.
Impact toetsen Menig toetsontwikkelaar vreest dat een toets voor een ander doel wordt gebruikt dan waarvoor die is ontworpen. Het is zaak om niet alleen bij de ontwikkeling de waarde van toetsen te bepalen, maar ook oog te hebben voor de lange termijn. Dragen de effecten bij aan wat ooit de bedoeling van de toets was (consequential validity)? |
Kwaliteit verbeteren Het is daarbij van belang dat de discussie verschuift van het thema ‘al dan niet toetsen’ naar de vraag hoe zo goed mogelijk toetsen kan worden vormgegeven. Dat is een belangrijke stap vooruit, voorbij de polemiek die nu nog wel eens een goed gesprek over toetsing in de weg staat. |
Effect van toetsen op onderwijs Dat is niet erg, mits de toets een goede afspiegeling vormt van wat er in de volle breedte van het onderwijs aan bod moet komen. Maar dat is veel gevraagd van een toets en voor een toets primair bedoeld voor selectie is dat ook niet nodig. Als dat niet expliciet duidelijk gemaakt wordt, ligt verschraling van onderwijs echter op de loer. |
Dr. Karen Heij is taalkundige, toetsexpert en onderwijsadviseur. Zij promoveerde in 2021 op Eindtoets basisonderwijs bezien vanuit bestuurlijk perspectief.
Jaap Scheerens is emeritus hoogleraar aan de Universiteit Twente en lid van het Red Team Onderwijs.
Claire Boonstra is oprichter van Stichting Operation Education.
Remco Prast is bestuurder bij Blosse en lid van de Kerngroep Leve het Onderwijs.
En blijf op de hoogte van onderwijsnieuws en de nieuwste wetenschappelijke ontwikkelingen!
Inschrijven