Programmatisch toetsen ontwerpen: 11 ontwerpkeuzes (tool)

Van theorie naar praktijk: dat is de stap waar veel opleidingen vastlopen bij Programmatisch toetsen en Lerend Kwalificeren. De theoretische principes zijn inmiddels goed beschreven, de urgentie wordt breed gevoeld en steeds meer teams willen aan de slag. Maar hoe vertaal je die theorie naar concrete keuzes in je curriculum? Wat doe je met datapunten ofwel bewijzen, feedbackmomenten en high-stakes beslissingen in jouw specifieke context? Samen met de Hogeschool Utrecht ontwikkelden we de Ontwerptool Programmatisch Toetsen: een interactief instrument dat teams helpt om die stap gestructureerd te maken, langs 11 essentiële ontwerpkeuzes die rechtstreeks uit onderzoek zijn gedestilleerd. In dit artikel lees je wat de tool inhoudt, wat de achterliggende concepten zijn en hoe je hem het beste inzet.

Van momentopname naar ontwikkelingsbeeld

Toetsing in het hoger onderwijs heeft lang gedraaid om één principe: sluit elke module af met een toets, bepaal of de student voldoende heeft laten zien, en ga verder. Dat modulaire model heeft voordelen. Het is overzichtelijk, controleerbaar en studenten weten waar ze aan toe zijn. Maar het heeft ook een fundamentele keerzijde. Een toets is een momentopname. Een student geeft een presentatie van 20 minuten, scoort een 7 en de module is klaar. Maar wat zegt die 7 nu echt? Hoe betrouwbaar is een oordeel op basis van één moment? En in hoeverre heeft de student iets geleerd van het proces ernaartoe?

Onderzoek laat zien dat de betrouwbaarheid van de meeste toetsvormen pas na twee tot vier uur beoordelingstijd een stabiel beeld oplevert (Van der Vleuten, 2016). In de praktijk halen de meeste toetsen dat bij lange na niet. Bovendien leiden losse modules met afzonderlijke toetsen tot wat studenten zelf omschrijven als hoepeltjes springen: halen, afsluiten, vergeten en door naar de volgende.

Toetsing heeft in de kern drie functies: de leerfunctie (toetsing als middel om te leren), de evaluatiefunctie (inzicht krijgen in de voortgang van het programma) en de beslisfunctie (vaststellen of een student de beoogde leerresultaten en kwalificaties beheerst). In het modulaire model domineerde lange tijd de beslisfunctie. Bij Programmatisch toetsen en Lerend Kwalificeren zijn de leer- en beslisfunctie verweven, maar niet in één toets of één datapunt. Een enkel datapunt of bewijs heeft primair een leerfunctie: de student levert iets in, krijgt feedback en leert daarvan. Pas een verzameling van datapunten over tijd maakt zichtbaar hoe de ontwikkeling van een student eruitziet, en maakt een onderbouwde beslissing mogelijk. De verwevenheid zit dus in het geheel van het programma, niet in elk afzonderlijk moment. Dat is ook precies het verschil met formatief handelen: bij formatief handelen kun je naar een los toetsmoment kijken en vaststellen of het gericht is op leren of op beslissen. Bij Programmatisch toetsen en Lerend Kwalificeren zijn die twee functies structureel met elkaar verweven in het ontwerp als geheel.

Programmatisch toetsen en Lerend Kwalificeren zetten het leerproces centraal en kijken naar een breder beeld van de ontwikkeling van een student, in plaats van naar losse momentopnames. Het gaat om het verzamelen van meerdere datapunten ofwel bewijzen over tijd, waarbij feedback de motor is van de leerontwikkeling en beslissingen over het beheersen van leeruitkomsten en kwalificaties bewust en holistisch worden genomen op basis van het geheel. Bij Lerend Kwalificeren is eigenaarschap van de student daarin zowel een doel als een middel: studenten krijgen steeds meer regie over hun eigen leerproces én over de onderbouwing van hun eigen beoordeling. Cruciaal in het gehele concept is het begrip saturatie: het punt waarop er voldoende informatie beschikbaar is om een onderbouwde beslissing te nemen. Dat punt is overigens niet eenvoudig te bepalen, voor de ontwerper, de docent én de student; het vraagt om goede begeleiding én een goed ontwerp.

Van rapport naar gereedschap

De theorie achter Programmatisch toetsen en Lerend Kwalificeren is de afgelopen jaren goed beschreven. Maar hoe zet je die theorie om in een concreet curriculumontwerp? En welke keuzes maak je daarin, als opleiding, passend bij jouw context? Goed curriculumontwerp vraagt om constructieve samenhang tussen doelen, toetsing en leeractiviteiten, en juist bij de twee genoemde toetsconcepten raken die drie dimensies nauw met elkaar verweven.

Precies die vraag stond centraal in het onderzoeksproject Naar een nieuwe balans in toetsfuncties (Agricola, De Vos, Baartman & Van Schilt-Mol, 2024), uitgevoerd door de Hogeschool Utrecht en de HAN. Uit analyse van 19 hbo-opleidingen destilleerden de onderzoekers 11 specifieke ontwerpkeuzes waarop opleidingen onderling verschilden.

Als Vernieuwenderwijs en de Hogeschool Utrecht hebben we die 11 keuzes vertaald naar een interactief instrument (mede met dank aan CivAI voor het vormgeven er van): de Ontwerptool Programmatisch Toetsen. Niet een samenvatting van de theorie, maar een instrument waarmee je als team de keuzes maakt die bij jullie opleiding passen. Vergelijkbaar met hoe backward design teams helpt om vanuit beoogde leerresultaten terug te redeneren naar toetsing en onderwijs, helpt deze tool om die redenering ook voor programmatisch toetsen expliciet te maken.

De 11 ontwerpkeuzes

Programmatisch toetsen en Lerend kwalificeren zijn concepten, geen recepten. De 11 keuzes uit het onderzoek laten zien hoe breed het ontwerpvraagstuk eigenlijk is. Ze lopen van de inrichting van datapunten (bewijzen) tot de manier waarop zwaarwegende beslissingen worden genomen:

  • Vaste en vrije datapunten: hoeveel keuzevrijheid krijgen studenten in welke bewijzen ze inleveren? Meer vrijheid stimuleert eigenaarschap, maar vraagt ook om meer zelfsturing.
  • Feedbackperspectieven: wie geeft feedback, vanuit welke rol? Denk aan medestudenten, docenten, mentoren of werkveldprofessionals. Meerdere perspectieven versterken de betrouwbaarheid én de leerwaarde.
  • Feedbackmomenten: wanneer in het leerproces is feedback het meest waardevol? Hoe zorg je voor een ritme dat leren stimuleert zonder te verzanden in feedbackmoeheid?
  • Self-assessment als datapunt: in welke mate speelt de eigen beoordeling van de student mee in het totaalplaatje?
  • Kennis in datapunten: hoe wordt kennistoetsing verweven met de rest van het programma, zonder terug te vallen op losstaande kennistoetsen?
  • Feedbackformulieren: welke structuur geef je aan het geven en ontvangen van feedback? Denk aan single-point rubrics of meer open vormen.
  • Medium-stakes beslissingen: hoe richt je tussentijdse go/no-go momenten in, zodat studenten tijdig inzicht krijgen in hun voortgang?
  • Holistisch beslissen over leeruitkomsten: hoe weeg je de verzamelde datapunten als geheel? Mogen leeruitkomsten elkaar compenseren, of moeten alle afzonderlijk voldoende zijn?
  • Prestaties bij high-stakes beslissingen: wat verwacht je van een student op het eindmoment? Welke rol speelt een eindpresentatie of -gesprek?
  • De rol van mentoren: hoe betrek je studiebegeleiders bij de besluitvorming, en hoe zwaar weegt hun advies?
  • De grootte van high-stakes beslissingen: hoe groot is de stap die een student zet bij een eindmoment? Een semester of een heel jaar?

Elke keuze heeft meerdere mogelijke benaderingen, met elk hun eigen implicaties voor de leeromgeving, de rol van de docent en de verantwoordelijkheid van de student. Er is geen universeel goed antwoord. Wat werkt, hangt af van de context van jouw opleiding, jullie studenten en het beroepenveld waar ze naartoe opleiden. Dat vraagt ook om curriculair leiderschap: iemand die het ontwerpproces bewaakt en het team helpt om keuzes bewust en collectief te maken.

Hoe werkt de tool?

De Ontwerptool Programmatisch Toetsen is een interactieve webapplicatie waarmee een team de 11 ontwerpkeuzes stap voor stap doorloopt. De tool is bewust laagdrempelig opgezet: je hebt geen account nodig.

Bij elke ontwerpkeuze worden theoretische principes uit de literatuur gecombineerd met ervaringen uit de praktijk van de vijf onderzochte opleidingen: Toegepaste Biologie aan de HAS, Voeding en Diëtetiek aan de HAN, MOVEL aan de HAN, Bedrijfskunde aan de Saxion en de Pabo van de Marnix Academie. Zo krijg je niet alleen een conceptueel kader, maar ook herkenbare voorbeelden van hoe andere opleidingen die keuze hebben gemaakt en wat ze daarin hebben geleerd: wat werkte, maar ook waar ze tegenaan liepen.

Terwijl je de keuzes doorloopt, leg je direct de overwegingen van jouw team vast. Aan het eind ontvang je een visueel overzicht in PDF van het ontwerp dat je als team hebt gemaakt. Dat overzicht werkt meteen als praatplaat voor verdere besluitvorming, als input voor een curriculumcommissie, of om collega’s die nog niet bij het proces betrokken waren snel bij te praten.

‘De tool helpt je team om het gesprek gestructureerd te voeren, op basis van de theorie én de praktijk.’

Waarom dit gesprek zo belangrijk is

Een van de hardnekkige problemen bij de invoering van programmatisch toetsen is dat teams langs elkaar heen praten. Iedereen heeft een beeld van wat het inhoudt, maar die beelden lopen uiteen. De ene docent denkt aan meer feedback, de andere aan het afschaffen van cijfers, een derde aan zelfsturing bij studenten. Zonder een gedeeld kader wordt de implementatie al snel een warboel van goede bedoelingen. Dat is ook een van de klassieke valkuilen bij curriculumontwerp: keuzes worden impliciet gemaakt, in plaats van expliciet en collectief.

De tool biedt dat gedeelde kader. Door als team dezelfde 11 keuzes te maken en te verantwoorden, wordt expliciet wat voorheen impliciet bleef. Welke keuzes hebben we al gemaakt? Waar zijn we het met elkaar over eens, en waar niet? Welke keuzes passen bij onze studenten, ons beroepenveld, onze onderwijscultuur? Vergelijkbare ervaringen zie je ook terug bij praktijkvoorbeelden zoals dat van Scalda, waar het werken met concrete toetsingtools het teamgesprek structureerde en verdiepte.

De tool is daarmee niet alleen een ontwerphulpmiddel, maar ook een instrument voor teamprofessionalisering. Het gesprek dat je voert terwijl je de keuzes doorloopt, is minstens zo waardevol als de PDF die er aan het eind uitkomt.

Aan de slag

Aan de slag met de tool

Of je nu aan het begin staat van een curriculumherziening of jullie bestaande toetsprogramma wilt aanscherpen: de tool is gratis beschikbaar via ontwerptoolpt.nl (of de knop hierboven). Je kunt hem individueel verkennen, maar hij is het meest waardevol als je hem met je team gebruikt. Plan er een werksessie voor in, zorg dat de juiste mensen aan tafel zitten, en laat de 11 keuzes het gesprek structureren.

Ondersteuning bij programmatisch toetsen of lerend kwalificeren

Wil je na het gebruik van de tool verder met begeleiding of training rondom programmatisch toetsen? Vanuit Vernieuwenderwijs ondersteunen we opleidingen bij het ontwerpen en implementeren van Programmatisch toetsen en Lerend Kwalificeren. Neem gerust contact op als je wilt sparren over de mogelijkheden.

Meer weten?
Op onze pagina Programmatisch Toetsen en Lerend Kwalificeren vind je artikelen, podcasts, boekentips, materialen en nog meer om hier mee aan de slag te gaan. Wil je de onderliggende theorie eerst beter begrijpen? Het volledige rapport Naar een nieuwe balans in toetsfuncties van Agricola et al. (2024) geeft een uitgebreide onderbouwing van alle keuzes, inclusief vijf rijke casusbeschrijvingen van opleidingen die je zijn voorgegaan. En voor wie nog niet vertrouwd is met de basisprincipes: het artikel Programmatisch toetsen: waarom, wat en hoe? is een goede startplek.

Veel succes met het ontwerp!

Literatuur
Agricola, B., De Vos, M., Baartman, L., & Van Schilt-Mol, T. (2024). Naar een nieuwe balans in toetsfuncties: van formatief en summatief naar een continuüm van beslissingen. Hogeschool Utrecht / HAN. NRO projectnummer 40.5.22945.016.

Van der Vleuten, C. P. M. (2016). The assessment of professional competence: Developments, research and practical implications. Advances in Health Sciences Education, 21(5), 731–743.

image_pdfDownload artikel

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *