RTL Nieuws meldde half december nog – op basis van eigen onderzoek – dat middelbare scholieren in 2012 en 2013 beter scoorden op het centraal examen dan in 2011. Het College voor Toetsen en Examens had half juni de vlag al uitgestoken en gemeld dat vwo-ers voor de kernvakken Nederlands, Engels en wiskunde in 2014 zelfs iets beter scoorden dan de jaren hiervoor.
Onderwijskundige Lyset Rekers-Mombag van de Rijksuniversiteit Groningen verklaarde de betere resultaten bij RTL vanuit de mogelijkheid dat de leerlingen in de bovenbouw harder zouden zijn gaan werken. Het was niet zo, volgens haar, dat de examenopgaven makkelijker zouden zijn gemaakt.
Gratis punten
Onderzoek van Michel Couzijn, docent aan de Universiteit van Amsterdam en het Pieter Nieuwland College, doet vermoeden dat er nog een andere verklaring is. Hij zette de N-termen (de correctie die het Cito toepast op een gemaakt examen) eens op rijtje over de periode 2010-2014 voor de kernvakken Nederlands, Engels en wiskunde. Als een examen te moeilijk of juist te makkelijk blijkt (en daardoor te veel leerlingen dreigen te zakken of ten onrechte slagen) past het Cito de normering aan. Daardoor kunnen examenkandidaten gemiddeld enkele tienden tot een heel punt winnen of verliezen vergeleken met de standaardnormering. Het middel is bedoeld om de examens van jaar op jaar ongeveer even moeilijk te maken.
Maar Couzijn kwam tot een opmerkelijke ontdekking. Hij ging voor de kernvakken in de jaren 2010, 2011 en 2012 na bij welke gebleken moeilijkheid er een bepaalde corrigerende N-term was toegekend. In technische termen vond hij een mooie lineaire relatie tussen de p-waarden en de N-termen. Vervolgens bleek dat drie examens van kernvakken zowel in 2013 als in 2014 sterk van die norm afweken. De examens voor Nederlands en wiskunde-C houden zich in 2013 en 2014 redelijk aan de eerder aangehouden norm. Maar in 2013 blijken examenkandidaten er opeens voor wiskunde A en B en voor Engels zo'n zeven tiende punt bij te hebben gekregen, en in 2014 bij Engels acht tiende en bij wiskunde A en B drie tiende.
Minder gezakten
Waren die examens dan zoveel moeilijker? Nee, zegt Couzijn, over alle kernvakken gemeten was de moeilijkheidsgraad vergelijkbaar met de voorgaande jaren. Onderling varieerde die wat; zo bleek Nederlands iets moeilijker dan voorheen, maar Engels en wiskunde-B gemakkelijker. Waar het om gaat is dat er voor drie examens uitzonderlijk hoge N-termen zijn toegekend in relatie tot hun gebleken moeilijkheid, en de verklaring daarvoor is onbekend.
Neem als voorbeeld het examen vwo Engels in 2011 en 2013. In beide gevallen maakten kandidaten eenzelfde percentage vragen goed (64%). Maar in 2011 werd daarbij een N-term van 0,4 gehanteerd en in 2013 maar liefst 1,1. Die zeven tiende punt verschil leidde tot heel wat hogere examencijfers.
Ook voor het aantal zakkers en geslaagden lijkt deze aanpassing consequenties te hebben gehad. In 2011 zakte 26% van de kandidaten voor het examen Engels, in 2013 voor het examen met dezelfde p-waarde maar 12%. Dat scheelt zo'n 5500 leerlingen die misschien wel zijn geslaagd in plaats van gezakt voor zo'n cruciaal vak, dankzij de aangepaste N-term.
College voor Toetsen en Examens: niks aan de hand
Stichting Cito, gevraagd naar de extreme aanpassing van de N-termen, weigert commentaar en verwijst naar de opdrachtgever, het College voor Toetsen en Examens.
Het CvTE zegt zich niet in de voorstelling van zaken zoals geschetst in het artikel te herkennen. Het erkent wel verantwoordelijk te zijn voor de vaststelling van de normen: 'Cito heeft hierin een adviserende rol.' Over de hogere cijfers zegt het CvTE: 'Door de wijze waarop de bepaling van de N-termen tot stand komen zorgt het CvTE er voor dat een zes voor een vak in het ene jaar ook een zes voor datzelfde vak in het andere jaar is. Met behulp van de niveauhandhavingsmethoden bleek ook dat groepen kandidaten na de invoering van de nieuwe uitslagregels (in 2012) beter presteerden dan voor die tijd. Met hogere gemiddelde cijfers als gevolg.'
Lisette Rekers-Mombarg van de RUG zegt: 'Een mogelijk verklaring voor de hogere eindexamencijfers zou een makkelijker centraal eindexamen kunnen zijn. Ik ben uitgegaan van de aanname dat de Centrale Eindexamens van jaar tot jaar even moeilijk zijn. De moeilijkheidsgraad van de centraal eindexamens wordt jaarlijks zorgvuldig onderzocht door onder meer nieuwe opgaven te ijken aan oude opgaven. Indien nodig wordt de normering aangepast aan de moeilijkheid, niet aan een (wenselijk) slagingspercentage zoals in dit artikel wordt gesuggereerd. Het feit dat er jaarlijks aanpassingen moeten worden gedaan is op zich niet verontrustend. Details van hoe en wanneer de normering wordt aangepast zijn mij niet bekend.'
Noch het CvTE, noch Mombarg leveren een verklaring voor de door Couzijn geïdentificeerde afwijkende N-termen voor Engels, wiskunde-A en wiskunde-B. Met enige argwaan kan men daarom vermoeden dat deze N-termen zijn aangepast op basis van beleidswensen. Immers, sinds de aanscherping van de exameneisen volgde OCW het verloop van de examens met argusogen. Veel deskundigen verwachtten vooraf een slachting op havo en vwo, sinds verplicht is geworden dat alle CE-cijfers gemiddeld een 5,5 moeten zijn en kandidaten voor de kernvakken Nederlands, Engels en wiskunde nog maar één onvoldoende (en dan niet lager dan een 5) op de eindlijst mogen hebben. Met de aanpassing van de N-termen kon dat risico in ieder geval behoorlijk verkleind worden. / MM
Integrale reactie van het CvTE op bovenstaand artikel:
Hoe werkt normering?
Het CvTE levert elk jaar een nieuw centraal examen. Van jaar op jaar moeten kandidaten aan dezelfde prestatie-eis voldoen, ook al kunnen examens in opeenvolgende jaren in moeilijkheidsgraad verschillen. Hoe makkelijker een examen, hoe meer punten je moet halen om een voldoende te halen.
Met de N-term kunnen de scorepunten van een vak in een cijfer vertaald worden. Een N van 1,0 betekent dat de moeilijkheid van het examen heeft uitgepakt zoals bedoeld. Bij een N van 2,0 is achteraf gebleken dat de moeilijkheidsgraad van het examen hoog was. Een N van 0,0 is een norm voor een relatief makkelijk examen.
Het College voor Toetsen en Examens vergelijkt en ijkt voor de bepaling van de N-termen de resultaten van verschillende jaren. Dit kan het CvTE doen dankzij de niveauhandhavingsmethoden van Cito. Op basis daarvan worden de N-termen vastgesteld. Het CvTE betrekt bij dit proces ook de reacties van docenten en vakverenigingen en van het LAKS.
Door de wijze waarop de bepaling van de N-termen tot stand komen zorgt het CvTE er voor dat een zes voor een vak in het ene jaar is ook een zes voor datzelfde vak in het andere jaar is. Met behulp van de niveauhandhavingsmethoden bleek ook dat groepen kandidaten na de invoering van de nieuwe uitslagregels (in 2012) beter presteerden dan voor die tijd. Met hogere gemiddelde cijfers als gevolg.
Meer informatie over normering.
Tekst Monique Marreveld.
Gepubliceerd op 29 december 2014.
En blijf op de hoogte van onderwijsnieuws en de nieuwste wetenschappelijke ontwikkelingen!
Inschrijven