Op welke manier kunnen we de visie op onderwijs en leren écht de basis laten zijn voor het ontwerp van het onderwijs en de toetsing, zodat het meer ontwikkelingsgericht is?. Samen met 9 scholen werken we hieraan, in het lerend netwerk eigentijds toetsen in het voortgezet onderwijs. Dit in samenwerking met Tamara van Schilt-Mol (HAN) en Kelly Beekman (Fontys). In dit artikel alles over een andere kijk op toetsing, zes praktische handvatten én de eerste bijeenkomst van het ons lerend netwerk.
Wat is een toets?
Gaat het over een toets, dan gaat het vaak over zoiets als een schriftelijk schoolexamen of tentamen. Gaat het over toetsen, dan gaat het vaak over het het vellen van een eindoordeel. Dit wordt nog eens versterkt door het gebruik van de begrippen formatief en summatief, wat in de praktijk nog vaak neerkomt op: ‘het telt mee of het telt niet mee‘. Zoals we al eerder beschreven in ons artikel ‘waartoe dient toetsing‘, wordt er mede door die tweedeling – en het introduceren van bijbehorende modellen als oplossing – binnen scholen en opleidingen vaak voorbij gegaan aan de échte dialoog over toetsing.
Er wordt nog vaak gekozen voor een maximaal aantal summatieve toetsen ‘en de rest is dan formatief’. Dat in plaats van als team gezamenlijk te werken aan de toetsbekwaamheid en daarmee de kwaliteit van de toetsing (Meijer et al., 2020).
Toetsen is letterlijk het ‘onderzoeken in hoeverre iemand wat kan of weet’. In het Engels wordt het omschreven als: ‘assessment is a procedure for drawing inferences’ (Cronbach, 1971), oftewel: toetsing is een procedure op basis waarvan conclusies kunnen worden getrokken ten aanzien van het leerproces. Het wordt ook wel omschreven als een ‘brug tussen didactiek en leren’ (William, 2021). Het is een integraal onderdeel van je onderwijs, dat kan helpen om op basis van informatierijke beoordelingen zorgvuldige beslissingen te nemen over (het leren van) leerlingen en studenten en de kwaliteit van je onderwijs te optimaliseren (Van Schilt-Mol, 2022).
Waarom toetsen we?
Daar waar het harde onderscheid tussen formatief en summatief gaat over hoe er wordt omgegaan met de informatie die een toets oplevert (iets vaststellen of leren stimuleren), kun je als dwarsdoorsnede bij een toets drie functies onderscheiden: (Brown, 2008; Van der Vleuten et al., 2015).
- de leerfunctie: het stimuleren van leren,
- de beslisfunctie: het nemen van beslissingen op basis van data,
- de evaluatiefunctie: het evalueren van het eigen handelen op basis van die data
Mede door op deze manier naar toetsing te kijken, ontstaat er meer denkruimte om het te hebben over het waartoe van toetsen.
Zo zien we in de praktijk vaak terug dat er vrijwel geautomatiseerd een PTA wordt samengesteld met één of twee (of meer) beoordelingen per periode, die worden samengesteld op basis van bijvoorbeeld een hoofdstuk in een boek: al aanwezige data wordt gebruikt om de toetsing vorm te geven (data-driven decision-making). Kijkend naar de de beslisfunctie van toetsing zou het juist moeten dan over de vraag: welke data heb je nodig om een goede beslissing te nemen? En wat betekent dit voor het toetsprogramma? De toetsing wordt dan vorm gegeven om de data te verzamelen die nodig is: decision-driven data-collection (Wiliam, 2013).
Hoe gaan we om met de informatie uit een toets?
Door zo naar toetsing te kijken, ontstaat er onderscheid tussen beoordelen en beslissen. Bij beoordelen wordt vastgesteld waar de leerling zich bevindt ten opzichte van zijn leerdoel/de beoogde leerresultaten, op basis daarvan wordt gerichte feedback gegeven (waar staat de leerling nu en hoe kan hij het beoogde resultaat behalen). Bij beslissen wordt een consequentie verbonden aan één of meerdere beoordelingen (Van Schilt-Mol, 2022). Beoordelen en beslissen zijn daarmee twee activiteiten die elkaar opvolgen.
Om tot betekenisvolle informatie te komen, is het belangrijk om een krachtig leerproces neer te zetten waarin in ruimte is om regelmatig feedback te geven en aan te sturen op een opbouwende zelfstandigheid. Zo versterk je de zelfregulatievaardigheden (Beekman et al., 2015a) en self-efficacy van leerlingen (Beekman et al., 2016). Dit helpt leerlingen om steeds meer zelf het eigenaarschap te kunnen pakken, waardoor de informatie meer zegt over zowel de capaciteiten als interesses van leerlingen.
Informatierijk beslissen
Om te kunnen beoordelen waar een leerling of student écht staat in zijn of haar ontwikkeling, heb je voldoende informatie nodig. Binnen een ‘regulier toetsprogramma’ wordt deze informatie vaak beperkt tot enkele moment-opnames, waarbij vaak onvoldoende leerruimte en samenhang is (zie Figuur 1). Hieruit komen vaak cijfers naar voren, die dan weer een gemiddelde vormen. Maar wat zegt een cijfer?
“Maarten heeft gedurende periode 4 van 4 havo drie toetsen gehad voor Aardrijkskunde. Achtereenvolgens haalde hij een 5, een 6,4 en een 8. In de laatste toetsweek sloot Maarten de periode af met een toets waarin alle aan- geboden stof uit periode 4 getoetst werd. Voor deze toets haalde Maarten een 9. Op zijn rapport staat ‘dus’ een 7,1. Wat zeggen de cijfers op deze toetsen en op het rapport nu eigenlijk? Zeggen deze dat de gemiddelde beheersing van Maarten een 7,1 ‘is’? Of laten de afzonderlijke cijfers zien dat Maarten aan het begin van periode 4 nog niet alle vaardigheden beheerste en zich gedurende de onderwijsperiode op deze vaardigheden heeft ontwikkeld? En dat die ‘9’ dus wellicht een beter beeld geeft van wat Maarten nu kan?” (Van Mol-Schilt, 2022, p. 44).
We baseren vaak grote beslissing op gemiddelde cijfers (zoals ook het laten zitten van leerlingen), zonder al te kritisch na te gaan in hoeverre deze goed tot stand zijn gekomen, zoals bijvoorbeeld de kwaliteit van de toets zelf, de mate van constructieve afstemming (zie Figuur 2) of door überhaupt na te gaan of het juiste wel wordt getoetst. Ditzelfde kan overigens ook gezegd worden voor het geven van een O/V/G , plusje, kleur of wat je ook gebruikt om informatie te duiden: het komt allemaal op hetzelfde neer zolang het op dezelfde manier tot stand komt en er op dezelfde manier mee wordt omgegaan.
Een continuüm van toetsen
Toetsen is belangrijk: het is leerzaam en levert informatie op. Veel toetsen – in de ruimste zin van het woord – is dan ook belangrijk. Eigenlijk kunnen alle onderwijsactiviteiten informatie bieden over waar een leerling staat, van een geplande presentatie tot een spontaan gesprek op de gang. In wezen is er een continuüm van toetsen en is iets pas summatief als er een consequentie aan wordt verbonden. Het onderscheid tussen formatief en summatief als functie van één afzonderlijke toets wordt hiermee minder relevant (Van der Vleuten, et al., 2018).
De vraag is dan wel: welke informatie heb je nodig voor onderbouwde consequenties, oftewel beslissingen? Dit hangt mede af van waarover je een beslissing wilt nemen: heb je bijvoorbeeld informatie nodig om leerlingen of student een stap verder te helpen in het eigen maken van de leerdoelen? of heb je informatie nodig om het niveau vast te stellen voor bijvoorbeeld het programma van toetsing en afsluiting (PTA)? Daartussen zit nogal een verschil. Je kunt daarbij spreken over drie soorten niveaus van beslissingen: low-stake, medium-stake en high-stake (zie Figuur 3).
Dit principe van toetsen komt bijvoorbeeld ook terug bij programmatisch toesen. Meer hierover kun je bijvoorbeeld lezen in dit artikel over programmatisch toetsen in het hoger onderwijs of dit artikel over programmatisch toetsen in het voortgezet onderwijs.
Zes praktische handvatten
Als school streven we vanuit de visie vaak naar aspecten als ontwikkelingsgericht onderwijs, zelfregulerende leerlingen en het bieden van maatwerk, maar hoe zien we dat terug in het toetsprogramma, oftewel PTA en PTO en het handelen daar omheen? Het hierboven omschreven biedt daarvoor de ingrediënten, maar hoe kun je hier als team (school) mee aan de slag? Vanuit het lectoraat Eigentijds Beoordelen en Beslissen zijn er zes praktische handvatten geformuleerd om daar mee aan de slag te gaan (Van Schilt-Mol, 2022):
1. Maak bewuste en geïnformeerde beslissingen
Maak bewuste en beargumenteerde ontwerpkeuzes over de inrichting van het toetssysteem, waarbij je je laat informeren door actuele kennis en inzichten (evidence-informed). Belangrijk is dat je met elkaar in gesprek blijft over waarom je doet wat je doet.
2. Maak onderscheid tussen beoordelen en beslissen
Wees je ervan bewust dat beoordelen en beslissen twee verschillende activiteiten zijn die elkaar opvolgen. Afhankelijk van het type beslissing kan deze gebaseerd zijn op één beoordeling, maar ook op meerdere beoordelingen.
3. Verzamel informatie ten behoeve van de beslissing die je wilt nemen
Ontwikkel je onderwijs vanuit de beslissing die je wil nemen over leerlingen. Stel jezelf bij het ontwerpen steeds de vraag welke informatie je nodig hebt om de beslissing die je wil nemen betrouwbaar en zorgvuldig te kunnen nemen. Dit wordt ook wel aangeduid als decision-driven data-collection.
4. Ga in gesprek met de leerling over de waarde van beoordelingen
Feedback krijgen is immers geen garantie voor het gebruiken hiervan. Het is belangrijk dat de leerling de waarde van informatie uit beoordelingen inziet: dat zorgt ervoor dat hij deze zal accepteren, actief aan de slag zal gaan met deze informatie én ook actief op zoek zal gaan naar extra informatie. Blijf voortdurend met de leerling in gesprek over hoe de leerling informatie uit de beoordelingen kan gebruiken ten behoeve van zijn ontwikkeling.
5. Geef en benut informatierijke beoordelingen
Een beoordeling krijgt pas een waarde als de leerling op basis van de beoordeling richting kan geven aan zijn verdere leerproces. Het geven van alleen een cijfer of de indicatie (on)voldoende geeft niet de informatie waarmee de leerling dit kan doen. Voorzie iedere beoordeling daarom van een narratieve onderbouwing.
6. Blijf bewust toetsbekwaam
De kwaliteit van een beoordeling en een beslissing is niet afhankelijk van de (afzonderlijke) toetsactiviteit(en), maar van degene die de beoordeling geeft en beslissing neemt. Ben je ervan bewust dat toetsbekwaamheid expliciet onderdeel uitmaakt van je bekwaamheid als docent.
Lerend netwerk eigentijds toetsen in het voortgezet onderwijs
Het bovenstaande verhaal kan aanzetten tot denken, maar hoe kan dit worden vertaald naar de praktijk? Op iedere school is wel een visie aanwezig, met vaak prachtige termen als ontwikkelingsgericht en zelfregulatie, maar hoe is dit terug te zien in de toetsing? Met andere woorden: hoe kunnen we er in het voortgezet onderwijs voor zorgen dat de visie en manier van beoordelen en beslissen sterk met elkaar worden verweven?
Vanuit die vraag hebben we in samenwerking met Tamara van Schilt-Mol (lector Eigentijds Beoordelen en Beslissen aan de Hogeschool van Arnhem en Nijmegen) en Kelly Beekman (lector Technology Enchanced Assessment aan Fontys Hogescholen) het lerend netwerk eigentijds toetsen in het voortgezet onderwijs opgericht.
Als lerend netwerk, bestaande uit 9 scholen uit het voortgezet onderwijs, willen samen aan de slag met de genoemde vraag. Dat hebben we de eerste bijeenkomst gedaan door met elkaar kennis te maken, stil te staan bij de hierboven omschreven inhoud en middels school-overstijgende gesprekken te komen tot enkele meer concrete vraagstukken waar we dit jaar samen mee aan de slag gaan. Zo hopen we van en met elkaar te leren en zo samen te werken aan het meer eigentijds toetsen in het voortgezet onderwijs.
Brown, G. T. L. (2008). Conceptions of assessment: Understanding what assessment means to teachers and students. New York: Nova Science Publishers.
Beekman, K. & Kools, Q. Ontwikkelen en waarderen van future skills, 6-10. In: Ros, A., Thunnissen, M., & van Beelen, H. (2021) Duurzaam leren en werken in een veranderende
samenleving: Praktijkgericht onderzoek en tools voor praktijk en onderzoek.
Peeters et al. (2021). Curriculumontwerp in een notendop. Helmond: Onderwijs Maak Je Samen.
Meijer, K., Van Schilt-Mol, T, Baartman, Dobbelaer, M., Van der Linden, J. &, Munneke, L. (2020), Voortdurende toetsbekwaamheid in het hoger beroepsonderwijs, een eerste verkenning. Examens 2020 (2), 24-34.
Van der Steen, J., Van Schilt-Mol, T., Joosten-ten Brinke, D. &, Van der Vleuten, C. (2020). Formatief evalueren: naar een programma van formatieve leeractiviteiten. Tijd- schrift voor Docentenopleiders 41(4), 274-285.
Van der Vleuten, C., Schut, S. & Heeneman, S. (2018). Programmatisch toetsen als motor voor professioneel leren in het hoger onderwijs. In D. Sluijsmans & M. Segers. Toetsrevolutie. Naar een feedbackcultuur in het hoger onderwijs (p. 124-133). Culemborg: Phronese.
Wiliam, D. (2013a). Assessment: The Bridge between Teaching and Learning. Voices from the Middle, 21(2), 15–20. Retrieved on 23 June 2021, from https://library.ncte.org/ journals/vm/issues/v21-2/24461
William, D. (2021), ResearchEd – Assessment.
Als Vernieuwenderwijs helpen we scholen en opleidingen te komen tot krachtig onderwijs. Dit doen we door diensten en producten te bieden op het gebied van visie, curriculumontwerp, toetsing en didactiek. Daarbij geloven we sterk in leren door ontwerp: als team werken aan een gedeelde taal en handelen door samen actief onderwijs te ontwikkelen, op basis van weloverwogen keuzes.