Dat Didactief uitgebreid aandacht besteedt aan het debacle van de rekentoets is terecht. Er zijn miljoenen uitgegeven, op scholen werkten mensen zich uit de naad voor invoering. Allemaal weggegooid geld. Van dichtbij maakte ik bij het CvTE opkomst en ondergang van de rekentoets mee. Vanuit die positie heb ik een andere kijk op de oorzaak van het debacle dan Didactief. Het wantrouwen van politiek Den Haag dat Didactief benoemt, dat herken ik. Misschien is dat wantrouwen gemengd met dédain, in ieder geval met gebrekkige kennis (van rekenen, en van het veld). Die houding, gekoppeld aan de bureaucratische vlucht in pseudoregels, was fnuikend voor de noodzakelijke zoektocht naar verbeteringen. Didactief ziet echter ook in de keuze voor een centrale toets een blijk van wantrouwen. Dat betwijfel ik. Centrale toetsing is immers in het voortgezet onderwijs een ingeburgerde vanzelfsprekendheid. Didactief bespeurt daarnaast brede kritiek op de toets zelf en veronderstelt bij Cito een verborgen agenda. Ook dat betwijfel ik. Het is in ieder geval niet de toets op zichzelf die rekenen om zeep hielp.
Was het Citoproduct slecht?
Er was kritiek op opgaven. Soms was de kritiek terecht, geen wonder bij honderden opgaven per afname. Maar de kritiek richtte zich vooral op de kaders , niet van Cito afkomstig. Sommigen vonden het niets dat leerlingen de rekenmachine mochten gebruiken. Anderen vonden het belachelijk dat de rekenmachine deels niet was toegestaan. Sommigen stoorden zich aan een realistische context, anderen aan kale opgaven. Dat je voor tussenstappen geen punt kreeg , vonden docenten niet fair. Dat de toets onevenredig zwaar telde bij de uitslag en een onwrikbare normering kende, evenmin. Die kaders bezegelden het einde van de rekentoets. En dan vooral de verabsolutering van die kaders. Aan de hand van één fundamenteel onderdeel, de normering , licht ik dat toe.
Wat is normering?
In de Wet op de referentieniveaus (de Wet-Meijerink) zijn de niveaus omschreven als een soort examenprogramma: wat mag van een leerling op, bijvoorbeeld, havo worden verwacht? Wat moet hij kennen of kunnen? Dat is nog niet de normering. In de wet is niet vastgelegd hoeveel opgaven je goed moet hebben. De normering ligt niet in de wet vast.
Met normering heeft het CvTE, met Cito, ruime ervaring bij de centrale examens. Die worden genormeerd met een mix van analyse en gezond verstand. De analyse richt zich op equivalering. Twee verschillende examens, nooit precies even moeilijk, worden als het ware gelijk getrokken. En het gezond verstand? Pas na afname weet je hoe ver leerlingen kunnen komen bij een nieuw vak of een nieuw examenprogramma. Je fixeert dus niet vooraf de normering. Toen bijvoorbeeld in 2003 het vmbo centrale examens kreeg, werd voorzichtig genormeerd en mochten scholen van de vastgestelde normering afwijken.
De rekentoets: grondige analyse zonder gezond verstand
Bij de rekentoets werd zo mogelijk nog grondiger geanalyseerd. Nodig vanwege de varianten in één afname. Maar het gezond verstand is daar losgelaten. Door deskundigen is vooraf een norm geprikt, en die werd tot een harde eis waaraan alle leerlingen bij 2F (vmbo) resp 3F (havo en vwo) moesten voldoen. Dit stond haaks op de voorzichtigheid die het CvTE bij het centraal examen aan de dag legt. Nieuwe centrale toetsen en examens kunnen steevast op verzet rekenen. Dat was zo in de vorige eeuw bij geschiedenis havo en vwo, in 2003 bij de nieuwe centrale examens in het vmbo, en recent bij de rekentoets. Maar: geschiedenis havo en vwo, en de nieuwe centrale examens vmbo, bleken wél gewoon maakbaar. Dan verstomt de kritiek en leert de docent leven met opgaven ook als die niet steeds samenvallen met wat hij essentieel vindt. Fixeer je daarentegen de norm, en regent het onvoldoendes, dan organiseer je breed verzet.
En zo ging het bij de rekentoets met zijn in beton gegoten normering. Allereerst door de CvTE-mantra ‘3F = 3F’ (of ‘2F = 2F’). Aan havo-leerlingen (3F) werden dezelfde eisen gesteld als aan vwo-leerlingen. Terwijl je op je vingers kunt uittellen dat dat tot dramatische uitslagen leidt in een groep die wat zwakker is en een jaar minder heeft. Aanvankelijk werd ‘2F=2F’ bij het vmbo niet gehanteerd: de eisen liepen van BB via KB naar TL op. Zo gebeurt het al decennia bij Nederlands (ook 2F voor het hele vmbo). De BB-leerling krijgt daar een ander examen met andere eisen dan de leerling TL. Ergens bij de beleidsmakers vatte echter het idee post dat differentiatie in eisen binnen 2F niet kan, in een stelsel dat zelf toch doorgeslagen gedifferentieerd is. Dus werden de rekeneisen van BB tot TL gelijkgeschakeld. De toets bleek daardoor onhaalbaar op BB en havo. En dat is funest voor het draagvlak. Wie stelt ‘3F = 3F’ of ‘2F = 2F’, die weet niet hoe ons onderwijs in elkaar zit.
Daarnaast werd die gelijkgeschakelde norm ook nog eens absoluut. Ook dat is niet vanzelfsprekend. Het CvTE wilde de norm als streefnorm te zien, waarnaar geleidelijk kon worden toegegroeid. Dat werd op het hoogste beleidsniveau afgewezen: dan zou je toegeven aan de luiheid van scholen. Een paar jaar later stond juist het CvTE pal voor de absolute norm. ‘Absoluut’ klinkt immers logisch en vanzelfsprekend. Het ambitieuze prestigeproject rekenen was inmiddels bij CvTE losgezongen van de rest van de organisatie en daarmee van de ervaring met het onderwijsveld. En zonder die ervaring is het verleidelijk om te vluchten in zelf verzonnen regels, en de nuance te vergeten.
De door de absolute norm desastreuze resultaten werden onderzoeksstof voor twee commissies. De commissie-Bosker stelde voor voorlopig relatief te normeren. Dit pragmatische voorstel vond kennelijk geen genade. Er kwam een tweede commissie, de commissie-Steur. Gezien de samenstelling mocht voldoende benul van onderwijs en normering worden verwacht om de voorstellen van Bosker te herhalen. Dat gebeurde niet: de commissie koos voor aanpassing van de uitslagregels zodat je met een 3,5 kon slagen (volgens dankbare cartoonisten het einde van de zesjescultuur). Wie verzint zoiets? Dat kan alleen als je denkt dat de normering door de wet op de referentieniveaus vastligt. En dat dachten kennelijk de opdrachtgevers die een tweede commissie noodzakelijk vonden.
Het eindspel
Augustus 2015: start van het schooljaar waarin de rekentoets voor het eerst zou meetellen, in vo en mbo. Minister Bussemaker constateerde dat bij zorg en welzijn op het mbo meer dan de helft dreigde te zakken. Zij aarzelde. Zij nodigde een aantal mensen van het mbo-veld uit. Als betrokkene bij de toetsen voor leerlingen met ernstige rekenproblemen was ik erbij. De mensen uit het veld waren unaniem. Meer dan de helft laten zakken, dat is onverantwoord. Maar je kunt toch gewoon met gezond verstand normeren, zoals bij de centrale examens vo, en zoals de commissie-Bosker voorstelde? Gewoon mikken op, zeg maar, 90% geslaagden? Helder, simpel en unaniem was het voorstel. Alleen het CvTE-rekenmanagement protesteerde: de norm ligt vast.
Staatssecretaris Sander Dekker was verantwoordelijk voor het rekenen in het vo. Hij sprak niet met mensen uit het veld, wel met het rekenmanagement van CvTE.
De uitkomst is bekend. Geen gezond-verstandnormering. Bussemaker stelde invoering uit, Dekker ging met een kansloze harde lijn de Kamer in. PvdA-woordvoerder Jadnanansing kwam, onder kritiek van alle kanten, met de door de onwrikbare norm enige voor leerlingen verantwoorde oplossing: uitstel als de norm niet haalbaar is. Dus voor vmbo tot en met havo. En van uitstel komt afstel…
Waarom kwamen Dekker en Bussemaker niet op één lijn? Waarom omarmden zij niet beide de voor de hand liggende oplossing: vooralsnog een beetje relatief normeren? Waarom werd het kind met het badwater weggegooid? Dat zullen we nooit weten. Maar vaststaat dat het dogma van absolute normering verstandig beleid blokkeerde. Een dogma dat in leven kon blijven door overheidsmanagement dat de nuances van de onderwijspraktijk niet snapt en de zekerheid van schijnregels zoekt. Dat gebeurt helaas vaker, zie het debacle-Maastricht in 2018. Zoals ook Sociale Zaken lang vluchtte in een veilige maar dode levensverwachtingsformule voor de AOW-leeftijd. Regels zijn regels, politiek is politiek maar wat in de samenleving leeft is te complex en dus irrelevant. Het poldermodel is immers exit. Dan liever een harde schijnregel.
Centrale toetsing: op zichzelf niet verkeerd
Didactief suggereert dat beleidsmakers ten onrechte denken dat centrale toetsing de kwaliteit stimuleert. Ik vraag me af wat daar mis mee is. Centrale toetsing geeft helderheid en stimuleert daardoor beter dan de vage curriculumvernieuwingen die nu worden omarmd. We hebben in Nederland een traditie met centrale toetsing naast schooltoetsing. Als scheikunde en textiele werkvormen centraal worden getoetst, waarom dan rekenen niet? Het probleem bij rekenen was niet de centrale toetsing, maar de uitwerking. Zonder schoolbeoordeling, zonder correctie door de docent en met een keiharde normering en uitslagregel.
De schuldigen
Wie zijn de hoofdschuldigen van het drama? In ieder geval OCW en het rekenmanagement van CvTE. Een top die uitging van lakse scholen, die de praktijk niet kende, en regelgeving en uitwerking verwarde, dat is fnuikend voor het draagvlak. Sensitiviteit voor de samenleving en de onderwijspraktijk is vervangen door ‘politieke sensitiviteit’. En om je in te dekken tegen de grillen van de politiek vlucht je in regels. Beleidsmedewerkers die creatief zochten naar oplossingen met draagvlak, die waren er. Maar die krijgen in die context geen ruimte.
Het College, het hoogste orgaan van het CvTE, heeft een eigen verantwoordelijkheid. Het zelfstandig bestuursorgaan is opgezet vanuit het participatiemodel: draagvlak in de samenleving. Het zou bij uitstek hebben moeten pleiten voor draagvlak en dus voor een realistische normering. Bij de later ingevoerde A-toets voor onder andere BB-leerlingen deed het College dat helder en duidelijk: normeer op grond van de resultaten. Bij het grote project hadden ze dat ook moeten zeggen. Is het ze gevraagd? Of lag de normeringsramkoers van hogerhand vast? En durfden ze niet een ongevraagd advies uit te brengen?
Het veld is niet smetvrij. De vereniging van wiskundeleraren hield zich eerst afzijdig en kwam te laat met constructieve voorstellen. Maar in het geheel is dat een kleinigheid, de teerling was al geworpen. Hetzelfde geldt voor politici met scoringsdrift die denken dat afschaffing op hun blazoen beter staat dan verbeteringen.
En dan Cito. Dat kan verweten worden dat het binnen de kaders een zo goed mogelijke toets probeerde te maken. Met grondige analyses achteraf om te zien of misschien juist goede rekenaars door een kleine hobbel veel punten kwijtraakten. Impliciet wordt Cito soms verweten dat het uit is op zo veel mogelijk staatstoetsen die door hen gemaakt worden. Als dat hun drijfveer zou zijn, is het niet slim bezig. Zie maar wat gebeurde met de Cito-eindtoets primair onderwijs als staatstoets. Ik denk dat je Cito hoogstens kunt ‘verwijten’ dat het voorstander is van gestandaardiseerde toetsen die een vergelijking van leerlingresultaten mogelijk maken.
De Fyra van het onderwijs
De Fyra van het onderwijs, zo werd de rekentoets getypeerd door toenmalig Kamerlid Arie Slob. De Fyra was een mooie trein, door een Italiaanse bouwer geleverd voor het Nederlandse hogesnelheidsnet. De trein kwam in dienst toen er sneeuw viel, en viel net als de andere treinen uit. De Fyra moest weg. Wij hebben aan die trein meebetaald, en rijden sindsdien in stokoude, langzame en storingsgevoelige treinen. De Fyratreinen zoeven intussen storingsvrij door Italië. En de bouwer krijgt desondanks de schuld. Slobs vergelijking gaat dus niet helemaal op. Zo bleven bij het rekentoetsdebacle personele gevolgen uit. Maar bij beide is sprake van een megaproject, bestuurd met oogkleppen op zonder oog voor wat werkt, bij beide kreeg de bouwer de schuld, bij beide is het kind met het badwater weggegooid.
Ameling Algra was docent en schoolleider in het voortgezet onderwijs, en tot zijn pensionering manager bij het College voor Toetsen en Examens; o.a. belast met de centrale examens havo en vwo, en met de regels voor aanpassing ten behoeve van kandidaten met een beperking.
1 Georganiseerd wantrouwen (1): Reconstructie rekentoets
2 Georganiseerd wantrouwen (2): Tjeenk Willink over Groter denken, kleiner doen
En blijf op de hoogte van onderwijsnieuws en de nieuwste wetenschappelijke ontwikkelingen!
Inschrijven