Bij zowel de selectie als de beoordelingen van leraren spelen subjectieve oordelen een steeds grotere rol. Maar kan dat zomaar? Hoe betrouwbaar zijn die beoordelingen door collega’s of leerlingen? Onlangs verscheen hierover een mooie metastudie.
Helaas ben ik – en samen met mij een reeks onderzoekingen - niet zo positief over hoe betrouwbaar beoordelingen van leraren door leerlingen zijn. Het LAKS (Landelijk Aktie Komitee Scholieren) schrijft bijvoorbeeld: ’Een belangrijke plek voor leerlingenparticipatie is de aanstelling en de boordeling van docenten. Leerlingen zouden een belangrijke rol moeten krijgen in het aanstellen en beoordelen van docenten. Scholen kunnen een goed beeld krijgen van het functioneren van docenten door leerlingen jaarlijks een enquête over hun docenten in te laten vullen…Het LAKS is [daarom] een groot voorstander van LED: Leerlingen Evalueren Docenten.’ Het LAKS heeft er zelfs een handboek voor gemaakt. Best raar als je naar onderzoek over de betrouwbaarheid van zulke leerlingevaluaties kijkt. Hier een kleine bloemlezing.
Leerlingen leren niet meer of
beter van docent met hoge beoordelingen
Neem de metastudie van Uttl, White en Wong Gonzalez uit 2016 waarin zij concluderen dat er geen enkele correlatie is (nou ja, .03, maar dat is statistisch gezien gelijk aan NUL) tussen de beoordelingen van studenten en wat zij leren. Je zou denken dat de maat voor een goede leraar/lerares is dat je veel van hem of haar leert, toch?! De onderzoekers schrijven: ´Het hele idee dat het mogelijk is om de effectiviteit van het doceren te meten door het stellen van een aantal vragen aan de lerenden over hoe zij de lessen ervoeren, is onrealistisch’. En: ‘leerlingen leren niet meer of beter van docenten met hoge beoordelingen.’
Twintig jaar eerder vonden Krautman en Sander in een studie over de relatie tussen het gegeven cijfer en de beoordeling van leraren dat beoordelingen sterk samenhangen met het (verwachte) cijfer dat zij geven. Krautman cum suis spreken van het ‘kopen’ door leraren van gunstiger beoordelingen door mild te beoordelen, waarbij ‘cijferinflatie’ mogelijk op de loer ligt.
Vierentwintig jaar daarvoor – we zijn inmiddels in 1972 - schreven Rodin en Rodin in Science over de relatie tussen subjectieve en objectieve maten voor een goede leraar. De drie leraren die de laagste subjectieve (anonieme) beoordelingen kregen, behaalden de hoogste objectieve beoordelingen (meting van hoeveel er werkelijk geleerd werd). Zij poneren dat de reden hiervoor misschien is dat leerlingen een hekel hebben aan leraren die hen (te) hard laten werken, dat wil zeggen harder dan zij zelf willen. Conclusie van de auteurs: ‘Als de hoeveelheid die geleerd wordt hoofdonderdeel is van goed onderwijs, dan moeten wij tot de conclusie komen dat beoordeling door de leerling geen valide manier is om dat te meten.’
En tot slot blijkt de gegeven beoordeling zelfs af te hangen van het geslacht van de leraar. Een reeks onderzoekingen laat zien dat een lerares anders (vaak lager) wordt beoordeeld dan haar mannelijke collega. In een recente studie in een online omgeving (waar dus het geslacht van de leraar niet met eigen ogen te bepalen was), kregen leraren van wie werd verteld dat het mannen waren betere beoordelingen dan wanneer verteld werd dat het om vrouwen ging – zelfs als het in beide gevallen een vrouw was! Als je een beetje lol wilt beleven, raad ik je aan om naar de blog van Ben Schmidt te gaan waar je met een interactief programma kunt nagaan welke woorden gebruikt worden op RateMyProfessors.com (veertien miljoen beoordelingen) om mannelijke versus vrouwelijke docenten te karakteriseren. Mannen worden bijvoorbeeld gezien als briljant en geniaal, vrouwen als bazig en lastig.
Misschien moet de ‘ruime meerderheid van vo-scholen die leerlingen betrekt bij de evaluatie van docenten’ zoals de AVS rapporteert zich even achter de oren krabben en de oren niet zo sterk laten hangen naar de wensen en dromen van LAKS.
Paul Kirschner is hoogleraar Onderwijspsychologie aan de Open Universiteit en schrijft elke maand over internationaal onderwijsonderzoek.
Deze column verscheen in Didactief, december 2016.
1 LAKS
2 LAKS: handboek voor docentevaluatie door leerlingen
3 Grades and student evaluations of teachers
4 Grades and student evaluations of teachers
5 Student Evaluations of Teachers
6 What’s in a Name: Exposing Gender Bias in Student Ratings of Teaching
7 Gendered Language in Teacher Reviews
8 AVS over de beoordeling van docenten door leerlingen
En blijf op de hoogte van onderwijsnieuws en de nieuwste wetenschappelijke ontwikkelingen!
Inschrijven