Hoe komen je cijfers tot stand?
Zelfde werk, ander oordeel
Toen student digital humanities Aarti na dagen gespannen afwachten eindelijk het cijfer voor haar masterscriptie kreeg, zakte de grond onder haar voeten vandaan. Ze had een 5,1 en kwam dus vier tiende te kort voor een voldoende. ‘Ik barstte bijna in huilen uit, want ik had het echt niet verwacht’, zegt ze. Maar toen ze de toelichting las, veranderde de paniek die ze voelde al snel in woede.
‘Er stonden feitelijke onjuistheden in en het was gewoon heel verwarrend. Het leek alsof ze mijn scriptie niet eens goed gelezen hadden.’ Zo zou er aan het eind van elk hoofdstuk een bibliografie hebben gestaan, een fout die Aarti in de laatste versie had aangepast.
Dus deed ze haar beklag bij de Examencommissie, die een onafhankelijke derde lezer toewees. ‘Alleen gaf hij me een nog lager cijfer, een 4,3. En hij noemde mijn scriptie “semi-hoogdravende bullshit”. Dat is toch niet professioneel?’
Wat haar echter het meest stoorde, was de voornaamste reden voor de onvoldoende: ze had geen data-analyse of empirische onderzoeksmethodes toegepast. Maar dat was omdat het een literatuuronderzoek was, zegt Aarti. ‘Zowel mijn scriptiebegeleider als de tweede lezer zei dat dit niet van toepassing is op mijn werk. Dus dat slaat nergens op. Het is gewoon oneerlijk.’
Student Europees recht Iram – niet haar echte naam – heeft een vergelijkbaar verhaal. Ze was geschokt toen ze maar een 4 kreeg voor het eerstejaars vak constitutioneel recht, in plaats van de verwachte 8. En dat gevoel werd alleen maar sterker toen ze haar werk vergeleek met dat van haar vrienden. Dezelfde antwoorden, iets anders opgeschreven, hadden totaal verschillende cijfers gekregen. ‘Dat was enorm frustrerend.’
Beleid
Aarti en Iram zijn maar twee voorbeelden. Er zijn veel meer studenten die weinig snappen van de cijfers die ze krijgen, of die vinden dat ze oneerlijk beoordeeld zijn. Dus waar baseren docenten hun cijfers eigenlijk op? En waar komen die tegenstrijdigheden en verwarring vandaan waar studenten over klagen?
Het leek alsof ze mijn scriptie niet eens goed gelezen hadden
~ Student Aarti
Lorena Florez Rojas, die technologierecht doceert, geeft toe dat er op de RUG wel verwarring heerst wat betreft de regels rond becijferen. Elke faculteit heeft een beoordelingsbeleid, maar veel docenten weten dat eigenlijk niet te vinden, zegt ze, of weten zelfs niet eens dat het bestaat.
‘Ik had ook geen idee waar dat document stond voordat ik de cursus voor mijn onderwijskwalificatie volgde’, zegt Florez Rojas. ‘Het is niet zo dat alle informatie ergens centraal te vinden is, dus het kan lastig zijn om bij te houden wat waar staat. Dus moet je veel op collega’s vertrouwen, wat niet 100 procent betrouwbaar is.’
Leerdoelen
Vraag het een willekeurige docent en die zal je vertellen dat becijferen begint bij de leerdoelen van een vak. ‘Je moet bedenken: wat wil je dat je studenten kunnen aan het eind?’ legt hoogleraar rechten Edwin Woerdman uit. ‘Dan stel je tentamenvragen of opdrachten op die deze doelen kunnen beoordelen.’
Dat is ook wat startende docenten leren, zegt Marlies Venhuizen-Ter Beek, onderwijsadviseur en trainer bij de afdeling Educational Support and Innovation ‘Dit is de eerste stap om de betrouwbaarheid van cijfers te vergroten. We adviseren docenten altijd om hun leerdoelen kritisch te beoordelen: maak ze specifiek, meetbaar, haalbaar, realistisch en tijdgebonden.’
Hoe zet je die doelen vervolgens om in een cijfer? Daar heb je een beoordelingstabel voor, ook wel een rubric genoemd. ‘De criteria voor een bepaald cijfer moet je tot in detail vaststellen’, legt Venhuizen-Ter Beek uit. ‘Als je dezelfde rubric aan twee docenten geeft, zullen zij het werk van studenten waarschijnlijk op dezelfde manier beoordelen.’
Hoofdzaken
Woerdman deelt het tentamen het liefste op in steeds kleinere stukjes. ‘Je verdeelt de punten over de vragen en binnen elke vraag verdeel je de punten per hoofdzaak’, zegt hij. Maar wat nou eigenlijk die hoofdzaken zijn en hoe zwaar ze meetellen, dat is het grijze gebied.
De criteria voor een bepaald cijfer moet je tot in detail vaststellen
~ Marlies Venhuizen-Ter Beek
‘Daar kun je wel wat mee schuiven, maar dat moet dan voor iedereen gelden en je moet het goed uitleggen. Daar gaat het om’, zegt hij. Maar dan is er nog een uitdaging: deelcijfers. ‘Dan hangt het ervan af hoe soepel je bent, of je punten geeft voor antwoorden die deels goed zijn. Je kunt strenger zijn, maar ook dat moet dan weer voor alle studenten opgaan.’
Die worsteling herkent universitair docent geschiedenis Arie van Steensel wel. ‘Als we de rubric opstellen, discussiëren we hier veel over de vraag hoe zwaar een bepaald aspect weegt.’
Soms houden ze intervisiebijeenkomsten, waarbij twee mensen het werk van dezelfde student nakijken om te zien waar de discrepanties zitten. Omdat dit veel tijd vergt, is het geen staande praktijk, maar Venhuizen-ter Beek denkt dat dit wel de eerlijkste cijfers oplevert. Toch, stelt Van Steensel, ‘zal er altijd een persoonlijk aspect blijven zitten aan becijferen.’
Subjectiviteit
De meeste docenten zullen het daarmee eens zijn: subjectiviteit is nooit helemaal te voorkomen, het blijft immers mensenwerk. Bij sommige docenten, zoals Woerdman, zit dat hem in de ruimte die je hebt voor eigen interpretaties. Voor anderen, zoals hoogleraar astronomie Eline Tolstoy, gaat het om de belangenverstrengeling die je voelt als je zowel doceert als becijfert. ‘Ik wil het liefst alle studenten laten slagen. Ik geef ze het voordeel van de twijfel, misschien meer dan zou moeten’, zegt ze. Dan gaat het niet om een 5 versus een 7, benadrukt ze, maar om kleine verschillen.
Maar wanneer wordt die subjectiviteit een probleem? Voor Mara, die astronomie studeert – niet bij Tolstoy – was dat toen ze een onvoldoende kreeg voor een opdracht die een andere docent een jaar eerder met een hoog cijfer had beoordeeld. ‘Ik moest het vak Statistiek voor Astronomie opnieuw doen, maar de opdrachten waren hetzelfde’, vertelt ze. ‘Dus heb ik gewoon dezelfde dingen nog een keer ingevoerd.’
Voor de eerste opdracht kreeg ze vrijwel hetzelfde cijfer. Maar tot haar verrassing leverde de tweede opdracht haar een 4 op, waar ze eerder een 9,5 had gekregen. ‘Ik snapte er niets van, het voelde zó oneerlijk’, zegt ze. En de feedback hielp ook niet echt. ‘Dat was maar twee zinnen per vraag, en ook alleen maar negatief.’
Ze stapte naar de docent. ‘Die zei dat ik mijn proces niet voldoende had uitgelegd en dat mijn cijfer dan misschien hoger zou worden’, zegt ze. Maar toen ze dat deed, kreeg ze nog steeds maar een 6. ‘Het was frustrerend, maar ik het het maar opgegeven toen ik een voldoende had.’
Weinig feedback
Voor veel studenten zit het probleem hem in het gebrek aan feedback. Daardoor snappen ze niet waarom ze een bepaald cijfer hebben gekregen. Iram weet nog goed hoe gefrustreerd ze daarover was. ‘Ik ging naar de tentamenbespreking, maar de docenten waren totaal niet behulpzaam. Ze zeiden telkens dat ik naar de rubric moest kijken, in plaats van uit te leggen wat ik de volgende keer beter kon doen.’
Als je het goed uitlegt, begrijpen studenten het vaak wel
~ Arie van Steensel
‘Ze leven zich niet in het perspectief van de student in’, vindt ze. ‘Ze verwachten dat we aan de hand van twee zinnen uit een rubric snappen wat we verkeerd hebben gedaan en dat is niet eerlijk.’ Op het hertentamen kreeg Iram een 9, maar wat ze die keer anders deed, weet ze nog steeds niet precies. ‘Toen snapte ik er helemaal niks meer van, maar ik heb het er maar bij laten zitten.’
Volgens Venhuizen-Ter Beek zijn er twee dingen die je kunt doen om te zorgen dat studenten cijfers als ‘eerlijk’ ervaren: je verwachtingen communiceren en constructieve feedback geven. ‘Het is jouw rol als supervisor om te laten weten wat je van het werk van studenten verwacht. En als je feedback geeft, moet je vertellen wat er aan ontbreekt, maar ook wat iemand anders kan doen en op welke manier.’
200 tentamens
Daar kunnen de docenten zich wel in vinden: hoe meer feedback en toelichting ze geven, hoe minder klachten ze krijgen. ‘Als je het goed uitlegt, begrijpen studenten het vaak wel’, zegt Van Steensel.
Tolstoy neemt die taak zelfs zo serieus dat ze voor elk tentamen een video opneemt waarin ze elk punt van de rubric toelicht. ‘Je kunt niet aan tweehonderd individuele studenten feedback geven. Maar dit verduidelijkt de zaken wel’, denkt ze.
Maar wat het meest zou helpen, zegt ze, is als het aantal medewerkers in het departement zou meestijgen met het aantal studenten. Dat is nu niet zo. ‘De kwaliteit van het onderwijs lijdt daaronder. Er worden meer fouten gemaakt bij het nakijken van tentamens en er is ook niet genoeg tijd voor discussie.’
Woerdman is het daar mee eens. ‘Nakijken vraagt gewoon heel veel tijd. Elke keer dat ik tweehonderd tentamens moet beoordelen, hoop ik maar dat ik niet ziek word. Er zijn weken dat ik dag na dag aan het nakijken ben.’