fbpx

Formatief handelen en programmatisch toetsen, wat is het verschil?

Werken jullie op je opleiding aan formatief handelen? Of wordt er gewerkt vanuit programmatisch toetsen? Het lijkt vaak om een keuze te gaan. Vooropgesteld: het één is niet beter dan het ander. Sterker nog: het gaat eigenlijk niet om het één of het ander. Maar, ben je met één van deze concepten bezig en vraag je je af wat nu écht het verschil? Lees dan hieronder verder, of luister de podcast onderaan het artikel.

Assessment en toetsen

Om een vergelijking te maken, is het allereerste belangrijk om stil te staan bij de twee begrippen. Zowel formatief handelen als programmatisch toetsen stammen af van Engelse begrippen: formative assessment en programmatic assessment. Het gaat dus beide over ‘assessment’; ‘a procedure for drawing inferences’ (Cronbach, 1971). Vertaald naar het Nederlands: ‘onderzoeken in hoeverre iemand wat kan of weet’. In de context van het Nederlandse onderwijs wordt dit vaak vertaald naar ’toetsen’; een procedure waaruit conclusies worden getrokken. Toetsen wordt zo ook wel omschreven als ‘een brug tussen didactiek en leren’ (William, 2021). Echter, omdat formatief toetsen soms verkeerde associaties oproept, wordt er soms gekozen voor begrippen als ‘formatief evalueren’ of ‘formatief handelen’. Dit zijn dus allemaal synoniemen.

Voor een duidelijk vergelijking schrijven we in dit artikel verder over formatief toetsen en programmatisch toetsen.

De functies van een toets

Een toets is dus de brug tussen didactiek en leren. Dat is breed: of leerlingen of studenten nu hun vinger opsteken, een quiz maken, presentatie geven of een tentamen maken – het zijn allemaal vormen van toetsing die kunnen leiden tot inzichten op basis waarvan je conclusies kunt trekken. Zo hebben toetsen om tot beslissingen te komen (assessment of learning), de eerste functie van toetsing (van Schilt-mol, 2021). De tweede functie is dat leerlingen en studenten kunnen leren van een toets (assessment as learning), bijvoorbeeld omdat zij hierdoor de leerstof herhalen (zie bv retrieval practicespaced practice en interleaved practice) of er feedback op krijgen. De derde functie, ook wel een nevenfunctie genoemd, is dat toetsen ons als docenten helpen het onderwijs te evalueren: toetsen geven ons informatie over het verloop van het leerproces; over wat goed gaat of juist om bijsturing of doorontwikkeling vraagt. Zie figuur 1.

De drie functies van toetsing en formatief handelen
Figuur 1. De drie functies van toetsing.

Gaat het over de leerfunctie, dan wordt dat ook wel diagnostische- of formatieve functie genoemd: toetsen helpen om het leerproces te versterken (Tran, 2014). Hierbij is feedback een essentieel onderdeel: informatie door docent en leerling of student op basis waarvan het leerproces kan worden bijgestuurd, zodat de kloof tussen de huidige situatie van de student en de beoogde leerdoelen of leeruitkomsten verkleind wordt. Gaat het over de beslisfunctie, dan wordt dat ook wel de selecterende- of summatieve functie genoemd: het toekennen van een cijfer (of ander zwaarwegende gegeven), studiepunten, toelating tot een volgend onderdeel, afronding van examenonderdelen of certificering.

Bij zowel formatief toetsen en programmatisch toetsen heb je te maken met alle drie functies, alleen zijn de keuzes en het taalgebruik die bij de leerfunctie en beslisfunctie worden gemaakt anders.

Drie scenario’s

Gebaseerd op een beschrijving van Allal (2011; verder uitgewerkt in Laveault & Allal, 2016), kunnen er drie onderwijs- en toetsscenario’s onderscheiden worden ten aanzien van de wijze waarop de functies tot elkaar in verhouding staan: (1) het scenario waarin het vaststellen van wat geleerd is (onderdeel van de beslisfunctie) leidend is voor het ontwerp van het onderwijs- en toetsprogramma, (2) het scenario waarin de leerfunctie én de beslisfunctie als twee separate aspecten leidend zijn voor het ontwerp van het onderwijs- en toetsprogramma, en (3) het scenario waarin de leer- en beslisfunctie met elkaar verweven zijn. In deze scenario’s is de evaluatiefunctie niet expliciet meegenomen (Schilt-Mol, 2021). Zie figuur 2.

Figuur 2. Drie scenario’s van toetsing (Bewerking van Laveault & Allal, 2016)

Vertaald naar de praktijk is scenario 1 een ‘klassiek’ scenario, waarbij er een sterke nadruk ligt op de beslisfunctie van toetsing en relatief weinig aandacht is voor de leerfunctie. De eindbeslissing ligt vast en daar wordt, veelal aan de hand van een kant-en-klare planning, naartoe gewerkt. Hierbij is er doorgaans relatief weinig leerruimte en wordt er relatief weinig ingespeeld op wat er tijdens het leerproces gebeurt bij leerlingen of studenten.

Scenario 2 (formatief toetsen)

Bij scenario 2 spreek je van formatief toetsen. Een veelal bekend scenario ofwel concept, al hoewel er zeker ook misvattingen leven. Binnen dit scenario zijn de leerfunctie en beslisfunctie volledig gescheiden. Formatieve toetsen behoren dus weging te hebben of te worden gekenmerkt als ‘verplicht’ of ‘voorwaardelijk’. Leerlingen of studenten maken tussentijds formatieve toetsen die er op gericht zijn het leerproces te ondersteunen, bijvoorbeeld doordat zij leerstof herhalen, feedback krijgen en werken aan meer kwaliteitsbesef. Zo wordt er middels een doordacht, waar mogelijk adaptief leerproces toegewerkt naar een veelal analytische, summatieve beslissing, oftewel toets met een summatieve functie. Lees in dit artikel alles over formatief toetsen.

Figuur 3. Formatief toetsen, de leer-en beslisfunctie gescheiden.

Het idee van dit scenario is dat er stap voor stap wordt toegewerkt naar een waardevolle summatieve beslissing. Voorbeelden van formatieve toetsen zijn een kennisquiz, vergelijkend beoordelen, groepsgewijze feedback of deze 7 werkvormen om te checken op begrip.

Scenario 3 (programmatisch toetsen)

Bij dit scenario spreek je van programmatisch toetsen. Een scenario wat de laatste jaren populairder is geworden, met name in het mbo en hoger onderwijs, maar ook toepasbaar op het voortgezet onderwijs. Binnen dit scenario zijn de leerfuctie en beslisfunctie met elkaar verweven. Leerlingen of studenten maken toetsen, die worden gekenmerkt als – of kunnen worden aangedragen als – datapunten. Dit zijn betekenisvolle handelingen of producten (‘artefacten’) waarop feedback wordt gegeven, wat rijke informatie moet opleveren voor én het leren én het nemen van beslissingen. Een ‘continuüm van toetsen’. Zo wordt er middels de datapunten (ook wel ‘low-stake’ genoemd) toegewerkt naar een zwaarwegende, holistische beslissing, ook wel de ‘high-stake’ beslissing genoemd (‘er staat veel op het spel’). Tussentijds wordt er vaak uitgebreider stilgestaan bij de ontwikkeling, met als doel deze bij te sturen; deze momenten worden ‘medium-stake’ momenten genoemd. Bekijk deze poster voor een duidelijker beeld van de begrippen.

Je spreekt bij programmatisch toetsen niet van de formatieve óf summatieve functie, omdat deze dus met elkaar verweven zijn. Meer dan formatief toetsen is programmatisch een concept met verschillende kenmerken.

Figuur 4. Programmatisch toetsen, de leer-en beslisfunctie verweven.

Het idee van dit scenario is dat de doorgaans complexe beroepspraktijk vraagt om een intergratie van kennis en vaardigheden, wat daarom doorlopend integraal moet worden beoordeeld, bij voorkeur in verschillende contexten. Op die manier voorkom je dat je ‘appels met peren’ vergelijkt en zorg je ervoor dat je écht een goed beeld hebt van de leerling of student. Dit met als idee dat je leren meer betekenisvol maakt én meer valide kunt stellen of een leerling of student de leeruitkomsten beheerst.

Concrete verschillen

Concreet wordt er bij formatief toetsen en programmatisch toetsen dus een andere keuze gemaakt in de leerfunctie en beslisfunctie, waarbij het bij formatief toetsen volledig is gescheiden en bij programmatisch toetsen is verweven. Ten aanzien van de beslisfunctie wordt er daarnaast ook een andere keuze gemaakt, waarbij formatief toetsen doorgaans meer analytisch is en programmatisch toetsen meer holistisch.

Kan beiden dan naast elkaar? Zeker! Sterker nog: het is onlosmakelijk met elkaar verbonden, als je scenario 3 bekijkt. Kies je voor programmatisch toetsen, dan vermeng je de leerfunctie en ben je, als het goed is, dus ook doorlopend bezig met formatief toetsen – dit kan zowel slaan op ‘datapunten’ als kleinere toetsactiviteiten die enkel gericht zijn op de leerfunctie (zoals één van deze werkvormen).

Hoe kom je tot een keuze?

Is het één dan beter dan het ander? Nee. De keuze voor het scenario, of het nu om meer klassiek onderwijs, formatief toetsen of programmatisch toetsen gaat, hangt af van verschillende factoren. Allereerst is er jullie collectieve visie op toetsen; hoe kijken jullie hier als team naar? Ten tweede is er de context: werken studenten doelgericht toe naar producten en vind je het als opleiding vooral belangrijk dat die voldoende zijn; dan is het holistisch beoordelen van kennis en vaardigheden wellicht niet passend, wat programmatisch toetsen dan ook minder passend maakt. Daarnaast is het ook noemenswaardig dat goed programmatisch toetsen een meer omvangrijk concept is, wat dus een sterker beroep doet op zowel de didactiek, als het curriculum en de systemische inrichting. Daar tegenover staat dat het kan leiden tot een krachtiger leer- én beslisproces.

Decision-driven data collection

Terugkomend op de eerste alinea: het gaat niet om een keuze voor een scenario. Het gesprek zou moeten beginnen bij jullie visie en context. Vervolgens zou je als team vanuit de gestelde leeruitkomsten (of leerdoelen) moeten toewerken naar het antwoord op deze twee vragen: 1) welke informatie hebben we nodig om valide beslissing te nemen over de beheersing van de leeruitkomsten of leerdoelen van onze leerlingen of studenten? 2) doormiddel van welke handelingen of producenten komen we aan die informatie? (‘decision-driven data collection‘). Werk zo samen toe naar een valide, betrouwbaar toetsprogramma, passend bij jullie visie en context – en staar je niet blind op concepten.

Podcast luisteren

Meer weten?

Op 25 september zijn we weer terug voor de 3e editie van het congres Programmatisch Toetsen. Het thema van dit jaar: ‘Van recept naar concept’. Of je nu bezig bent met programmatisch toetsen of vooral meer wilt weten over het concept, we hebben een breed aanbod aan proeverijen en keynotes, voor het mbo en hbo.

Tijdens het congres komen onderwerpen aan bod als: lerend kwalificeren, zelfregulatie bij programmatisch toetsen, feedback bij programmatisch toetsen, het inrichten van de besliscommissie, de cultuuromslag, ontwerpkeuzes en nog veel meer. Meer informatie vind je op fotonaarfilm.nl.

Literatuur

Cronbach, L. J. (1971). Test Validation. In R. Thorndike (Ed.), Educational Measurement (2nd ed., p. 443). Washington DC: American Council on Education

Laveault, D. & Allal, Linda. (2016). Implementing Assessment for Learning: Theoretical and Practical Issues. 10.1007/978-3-319-39211-0_1.

Tran, N. (2014). The impact of assessment on learners’ identities. In: ARECLS Vol.11, 90 -106.

William, D. in ResearchEd – Assessment (2021).

image_pdfDownload artikel

4 thoughts on “Formatief handelen en programmatisch toetsen, wat is het verschil?

  1. Hoi Wessel,
    Je schrijft: ‘Werken leerlingen of studenten doelgericht toe naar producten, dan is het holistisch beoordelen van kennis en vaardigheden wellicht niet passend, wat programmatisch toetsen dan minder passend maakt. Dit zie je bijvoorbeeld bij leeruitkomsten die zijn geformuleerd vanuit de ‘Tuning-systmatiek’. ‘
    Ik snap eigenlijk niet wat je hiermee bedoelt en ook niet wat de relatie met Tuning is. Ik denk dat dit niet kan kloppen (studenten werken immers heel vaak/altijd toe naar producten/handelingen). Kun je toelichten wat je hiermee bedoelt?

    1. Dag Irene, dank voor je reactie en goede vraag. Het staat er wellicht wat te scherp. Wat we in de praktijk veel zien, is dat opleidingen die zich strak vasthouden aan de Tuning-normen (en dan met name rondom de standaard en scope/reikwijdte), relatief snel sturen op producten in plaats van handelingen. Dan is het lastig een vaardigheid, kennis of attitude meer holistisch te beoordelen (omdat ‘het product voldoende moet zijn’, en niet zozeer het gedrag). Maar: dit ligt niet zozeer aan de systematiek zelf, meer het gebruik er van (daarom nu aangepast).

  2. Heldere plaatjes Wessel om het e.e. a. duidelijk te maken.
    Ik vraag me af hoe een examencommissie in het hbo hier naar kijkt. Vallen de data punten onder het toezicht van de examencommissie? Of alleen het laatste bolletje als één puur summatief assessment met daaraan gekoppelde studiepunten /ects. Hoe worden datapunten geregistreerd? Is een systeem als Osiris daartoe in staat? Kortom nogal wat vragen vanuit een ander perspectief.

    1. Dag Jan, zeer goede, en bekende vraag. Bij programmatisch toetsen vervaagt de enigszins de rol van een examinator, omdat toetsen meer onderdeel wordt van het leerproces (de verwevenheid leer- en beslisfunctie). Het ’traditionele kader’ (geen waarde oordeel) sluit hier dus moeilijk op aan. Vaak zie je dat er vooral gekeken wordt naar de high-stake, en dus dat je als examencommissie vooral naar dit moment kijkt. Echter, de opbouw hier naartoe is dus wel meer van belang: het gaat dus meer over het totale proces van datapunten (low-stage) en de medium-stakes.

      Wat betreft je vraag over vastleggen: hiervoor heb je diverse speciale systemen, zoals Scorion. Wellicht kan het interessant zijn om ons congres in september te bezoeken: https://fotonaarfilm.nl? Meer kun je ook hier lezen: https://vernieuwenderwijs.nl/programmatisch-toetsen.

      Het is complexe materie, lastig om zo even snel te beantwoorden 🙂 Helpt dit wel wat?

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *