Formatief handelen en programmatisch toetsen, wat is het verschil?

Werken jullie op je opleiding aan formatief handelen? Of wordt er gewerkt vanuit programmatisch toetsen? Het lijkt vaak om een keuze te gaan. Vooropgesteld: het één is niet beter dan het ander. Sterker nog: het gaat eigenlijk niet om het één of het ander. Maar, ben je met één van deze concepten bezig en vraag je je af wat nu écht het verschil? Lees dan hieronder verder, of luister de podcast onderaan het artikel.

Assessment en toetsen

Om een vergelijking te maken, is het allereerste belangrijk om stil te staan bij de twee begrippen. Zowel formatief handelen als programmatisch toetsen stammen af van Engelse begrippen: formative assessment en programmatic assessment. Het gaat dus beide over ‘assessment’; ‘a procedure for drawing inferences’ (Cronbach, 1971). Vertaald naar het Nederlands: ‘onderzoeken in hoeverre iemand wat kan of weet’. In de context van het Nederlandse onderwijs wordt dit vaak vertaald naar ’toetsen’; een procedure waaruit conclusies worden getrokken. Toetsen wordt zo ook wel omschreven als ‘een brug tussen didactiek en leren’ (William, 2021). Echter, omdat formatief toetsen soms verkeerde associaties oproept, wordt er soms gekozen voor begrippen als ‘formatief evalueren’ of ‘formatief handelen’. Dit zijn dus allemaal synoniemen.

Voor een duidelijk vergelijking schrijven we in dit artikel verder over formatief toetsen en programmatisch toetsen.

De functies van een toets

Een toets is dus de brug tussen didactiek en leren. Dat is breed: of leerlingen of studenten nu hun vinger opsteken, een quiz maken, presentatie geven of een tentamen maken – het zijn allemaal vormen van toetsing die kunnen leiden tot inzichten op basis waarvan je conclusies kunt trekken. Zo hebben toetsen om tot beslissingen te komen (assessment of learning), de eerste functie van toetsing (van Schilt-mol, 2021). De tweede functie is dat leerlingen en studenten kunnen leren van een toets (assessment as learning), bijvoorbeeld omdat zij hierdoor de leerstof herhalen (zie bv retrieval practice, spaced practice en interleaved practice) of er feedback op krijgen. De derde functie, ook wel een nevenfunctie genoemd, is dat toetsen ons als docenten helpen het onderwijs te evalueren: toetsen geven ons informatie over het verloop van het leerproces; over wat goed gaat of juist om bijsturing of doorontwikkeling vraagt. Zie figuur 1.

De drie functies van toetsing en formatief handelen — Figuur 1. De drie functies van toetsing.

Gaat het over de leerfunctie, dan wordt dat ook wel diagnostische- of formatieve functie genoemd: toetsen helpen om het leerproces te versterken (Tran, 2014). Hierbij is feedback een essentieel onderdeel: informatie door docent en leerling of student op basis waarvan het leerproces kan worden bijgestuurd, zodat de kloof tussen de huidige situatie van de student en de beoogde leerdoelen of leeruitkomsten verkleind wordt. Gaat het over de beslisfunctie, dan wordt dat ook wel de selecterende- of summatieve functie genoemd: het toekennen van een cijfer (of ander zwaarwegende gegeven), studiepunten, toelating tot een volgend onderdeel, afronding van examenonderdelen of certificering.

Bij zowel formatief toetsen en programmatisch toetsen heb je te maken met alle drie functies, alleen zijn de keuzes en het taalgebruik die bij de leerfunctie en beslisfunctie worden gemaakt anders.

Drie scenario’s

Gebaseerd op een beschrijving van Allal (2011; verder uitgewerkt in Laveault & Allal, 2016), kunnen er drie onderwijs- en toetsscenario’s onderscheiden worden ten aanzien van de wijze waarop de functies tot elkaar in verhouding staan: (1) het scenario waarin het vaststellen van wat geleerd is (onderdeel van de beslisfunctie) leidend is voor het ontwerp van het onderwijs- en toetsprogramma, (2) het scenario waarin de leerfunctie én de beslisfunctie als twee separate aspecten leidend zijn voor het ontwerp van het onderwijs- en toetsprogramma, en (3) het scenario waarin de leer- en beslisfunctie met elkaar verweven zijn. In deze scenario’s is de evaluatiefunctie niet expliciet meegenomen (Schilt-Mol, 2021). Zie figuur 2.

Vertaald naar de praktijk is scenario 1 een ‘klassiek’ scenario, waarbij er een sterke nadruk ligt op de beslisfunctie van toetsing en relatief weinig aandacht is voor de leerfunctie. De eindbeslissing ligt vast en daar wordt, veelal aan de hand van een kant-en-klare planning, naartoe gewerkt. Hierbij is er doorgaans relatief weinig leerruimte en wordt er relatief weinig ingespeeld op wat er tijdens het leerproces gebeurt bij leerlingen of studenten.

Scenario 2 (formatief toetsen)

Bij scenario 2 spreek je van formatief toetsen. Een veelal bekend scenario ofwel concept, al hoewel er zeker ook misvattingen leven. Binnen dit scenario zijn de leerfunctie en beslisfunctie volledig gescheiden. Formatieve toetsen behoren dus weging te hebben of te worden gekenmerkt als ‘verplicht’ of ‘voorwaardelijk’. Leerlingen of studenten maken tussentijds formatieve toetsen die er op gericht zijn het leerproces te ondersteunen, bijvoorbeeld doordat zij leerstof herhalen, feedback krijgen en werken aan meer kwaliteitsbesef. Zo wordt er middels een doordacht, waar mogelijk adaptief leerproces toegewerkt naar een veelal analytische, summatieve beslissing, oftewel toets met een summatieve functie. Lees in dit artikel alles over formatief toetsen.

Figuur 3. Formatief toetsen, de leer-en beslisfunctie gescheiden.

Het idee van dit scenario is dat er stap voor stap wordt toegewerkt naar een waardevolle summatieve beslissing. Voorbeelden van formatieve toetsen zijn een kennisquiz, vergelijkend beoordelen, groepsgewijze feedback of deze 7 werkvormen om te checken op begrip.

Scenario 3 (programmatisch toetsen)

Bij dit scenario spreek je van programmatisch toetsen. Een scenario wat de laatste jaren populairder is geworden, met name in het mbo en hoger onderwijs, maar ook toepasbaar op het voortgezet onderwijs. Binnen dit scenario zijn de leerfuctie en beslisfunctie met elkaar verweven. Leerlingen of studenten maken toetsen, die worden gekenmerkt als – of kunnen worden aangedragen als – datapunten. Dit zijn betekenisvolle handelingen of producten (‘artefacten’) waarop feedback wordt gegeven, wat rijke informatie moet opleveren voor én het leren én het nemen van beslissingen. Een ‘continuüm van toetsen’. Zo wordt er middels de datapunten (ook wel ‘low-stake’ genoemd) toegewerkt naar een zwaarwegende, holistische beslissing, ook wel de ‘high-stake’ beslissing genoemd (‘er staat veel op het spel’). Tussentijds wordt er vaak uitgebreider stilgestaan bij de ontwikkeling, met als doel deze bij te sturen; deze momenten worden ‘medium-stake’ momenten genoemd. Bekijk deze poster voor een duidelijker beeld van de begrippen.

Je spreekt bij programmatisch toetsen niet van de formatieve óf summatieve functie, omdat deze dus met elkaar verweven zijn. Meer dan formatief toetsen is programmatisch een concept met verschillende kenmerken.

Figuur 4. Programmatisch toetsen, de leer-en beslisfunctie verweven.

Het idee van dit scenario is dat de doorgaans complexe beroepspraktijk vraagt om een intergratie van kennis en vaardigheden, wat daarom doorlopend integraal moet worden beoordeeld, bij voorkeur in verschillende contexten. Op die manier voorkom je dat je ‘appels met peren’ vergelijkt en zorg je ervoor dat je écht een goed beeld hebt van de leerling of student. Dit met als idee dat je leren meer betekenisvol maakt én meer valide kunt stellen of een leerling of student de leeruitkomsten beheerst.

Concrete verschillen

Concreet wordt er bij formatief toetsen en programmatisch toetsen dus een andere keuze gemaakt in de leerfunctie en beslisfunctie, waarbij het bij formatief toetsen volledig is gescheiden en bij programmatisch toetsen is verweven. Ten aanzien van de beslisfunctie wordt er daarnaast ook een andere keuze gemaakt, waarbij formatief toetsen doorgaans meer analytisch is en programmatisch toetsen meer holistisch.

Kan beiden dan naast elkaar? Zeker! Sterker nog: het is onlosmakelijk met elkaar verbonden, als je scenario 3 bekijkt. Kies je voor programmatisch toetsen, dan vermeng je de leerfunctie en ben je, als het goed is, dus ook doorlopend bezig met formatief toetsen – dit kan zowel slaan op ‘datapunten’ als kleinere toetsactiviteiten die enkel gericht zijn op de leerfunctie (zoals één van deze werkvormen).

Hoe kom je tot een keuze?

Is het één dan beter dan het ander? Nee. De keuze voor het scenario, of het nu om meer klassiek onderwijs, formatief toetsen of programmatisch toetsen gaat, hangt af van verschillende factoren. Allereerst is er jullie collectieve visie op toetsen; hoe kijken jullie hier als team naar? Ten tweede is er de context: werken studenten doelgericht toe naar producten en vind je het als opleiding vooral belangrijk dat die voldoende zijn; dan is het holistisch beoordelen van kennis en vaardigheden wellicht niet passend, wat programmatisch toetsen dan ook minder passend maakt. Daarnaast is het ook noemenswaardig dat goed programmatisch toetsen een meer omvangrijk concept is, wat dus een sterker beroep doet op zowel de didactiek, als het curriculum en de systemische inrichting. Daar tegenover staat dat het kan leiden tot een krachtiger leer- én beslisproces.

Decision-driven data collection

Terugkomend op de eerste alinea: het gaat niet om een keuze voor een scenario. Het gesprek zou moeten beginnen bij jullie visie en context. Vervolgens zou je als team vanuit de gestelde leeruitkomsten (of leerdoelen) moeten toewerken naar het antwoord op deze twee vragen: 1) welke informatie hebben we nodig om valide beslissing te nemen over de beheersing van de leeruitkomsten of leerdoelen van onze leerlingen of studenten? 2) doormiddel van welke handelingen of producenten komen we aan die informatie? (‘decision-driven data collection‘). Werk zo samen toe naar een valide, betrouwbaar toetsprogramma, passend bij jullie visie en context – en staar je niet blind op concepten.

Podcast luisteren

Literatuur

Cronbach, L. J. (1971). Test Validation. In R. Thorndike (Ed.), Educational Measurement (2nd ed., p. 443). Washington DC: American Council on Education

Laveault, D. & Allal, Linda. (2016). Implementing Assessment for Learning: Theoretical and Practical Issues. 10.1007/978-3-319-39211-0_1.

Tran, N. (2014). The impact of assessment on learners’ identities. In: ARECLS Vol.11, 90 -106.

William, D. in ResearchEd – Assessment (2021).

Download artikel

Wessel Peeters

Mede-oprichter van Vernieuwenderwijs. Daarvoor onderwijskundige in het hoger onderwijs en leraar geschiedenis en maatschappijleer in het voortgezet onderwijs. Praat graag over en is graag bezig met: didactiek, curriculumontwerp, toetsing, leren leren en veranderkunde. Actieve ontwikkelaar, onderzoeker en spreker.

2 thoughts on “Formatief handelen en programmatisch toetsen, wat is het verschil?”

Irene Biemond schreef:

25 januari 2024 om 19:09

Hoi Wessel,
Je schrijft: ‘Werken leerlingen of studenten doelgericht toe naar producten, dan is het holistisch beoordelen van kennis en vaardigheden wellicht niet passend, wat programmatisch toetsen dan minder passend maakt. Dit zie je bijvoorbeeld bij leeruitkomsten die zijn geformuleerd vanuit de ‘Tuning-systmatiek’. ‘
Ik snap eigenlijk niet wat je hiermee bedoelt en ook niet wat de relatie met Tuning is. Ik denk dat dit niet kan kloppen (studenten werken immers heel vaak/altijd toe naar producten/handelingen). Kun je toelichten wat je hiermee bedoelt?

Beantwoorden
1. Wessel Peeters schreef:
  
  25 januari 2024 om 19:49
  
  Dag Irene, dank voor je reactie en goede vraag. Het staat er wellicht wat te scherp. Wat we in de praktijk veel zien, is dat opleidingen die zich strak vasthouden aan de Tuning-normen (en dan met name rondom de standaard en scope/reikwijdte), relatief snel sturen op producten in plaats van handelingen. Dan is het lastig een vaardigheid, kennis of attitude meer holistisch te beoordelen (omdat ‘het product voldoende moet zijn’, en niet zozeer het gedrag). Maar: dit ligt niet zozeer aan de systematiek zelf, meer het gebruik er van (daarom nu aangepast).
  
  Beantwoorden

Formatief handelen en programmatisch toetsen, wat is het verschil?

Assessment en toetsen

De functies van een toets

Drie scenario’s

Scenario 2 (formatief toetsen)

Scenario 3 (programmatisch toetsen)

Concrete verschillen

Hoe kom je tot een keuze?

Decision-driven data collection

Podcast luisteren

2 thoughts on “Formatief handelen en programmatisch toetsen, wat is het verschil?”

Geef een reactie Reactie annuleren

De Wijsneuzen – Aflevering 25: Een goed verhaal

4 Boeken voor in de meivakantie (2024)

Is de single-point rubric een betrouwbaar instrument?

De Wijsneuzen – Aflevering 24: Scaffolding

Is de single-point rubric een betrouwbaar instrument?

Van analytisch naar holistisch: 7 vraagtukken en overwegingen

De 4 kwarten van Dylan Wiliam; een effectieve aanpak voor het nakijken

Vernieuwenderwijs

Nieuwsbrief

Bedankt, je staat op onze mailinglijst!

Nieuwste artikelen

De Wijsneuzen – Aflevering 25: Een goed verhaal

4 Boeken voor in de meivakantie (2024)

Contact

Assessment en toetsen

De functies van een toets

Drie scenario’s

Scenario 2 (formatief toetsen)

Scenario 3 (programmatisch toetsen)

Concrete verschillen

Hoe kom je tot een keuze?

Decision-driven data collection

Podcast luisteren

iPabo – Tweedaagse curriculumcommissie

PDSA – deel 1: Verbetering vraagt om verandering

2 thoughts on “Formatief handelen en programmatisch toetsen, wat is het verschil?”

Geef een reactie Reactie annuleren

De Wijsneuzen – Aflevering 25: Een goed verhaal

4 Boeken voor in de meivakantie (2024)

Is de single-point rubric een betrouwbaar instrument?

De Wijsneuzen – Aflevering 24: Scaffolding

Mogelijk ook interessant:

Is de single-point rubric een betrouwbaar instrument?

Van analytisch naar holistisch: 7 vraagtukken en overwegingen

De 4 kwarten van Dylan Wiliam; een effectieve aanpak voor het nakijken

Vernieuwenderwijs

Nieuwsbrief

Bedankt, je staat op onze mailinglijst!

Nieuwste artikelen

De Wijsneuzen – Aflevering 25: Een goed verhaal

4 Boeken voor in de meivakantie (2024)

Contact