Stop het verplichten van de doorstroomtoets
Hieronder zetten we uiteen hoe de doorstroomtoets in het basisonderwijs werkt, waarom we scholen willen helpen te stoppen met de verplichten eindtoets/doorstroomtoets, en hoe het dan wél kan en we het beste zicht kunnen houden op de ontwikkeling van het kind. Wetenschap wijst uit dat het geven van goede feedback de meest krachtigste interventie blijkt te zijn om tot leren te komen.
Hoe werkt de doorstroomtoets basisonderwijs?
De eindtoets is ingericht om de getoetste groep (alle leerlingen in groep 8) in te delen op basis van de gemiddelde prestatie van de groep. Op basis van het gemiddelde berekent de toets eindscores op een schaal van 501-550. Deze scores worden vervolgens omgezet naar categorieën die corresponderen met het te geven eindadvies. De opgaves zijn ontleend aan de gebieden “begrijpend lezen”, “taalverzorging” en “rekenen”. De opgaves zijn zo geconstrueerd dat zij discrimineren, zodat ook de best presterende leerlingen op de toets fouten maken en zo in de rangorde kunnen worden geplaatst.
Hoe worden de scores omgezet in adviezen?
501-504 pro/vmbo bb
505-524 vmbo bb/kb
525-532 vmbo kb/gl-tl
533-539 vmbo gl-tl/havo
540-544 havo/vwo
545-550 vwo
Waarom willen we scholen helpen te stoppen met de verplichte eindtoets PO?
De wettelijk verplichte eindtoets basisonderwijs én de verplichting tot het gebruik van een leerlingvolgsysteem bepalen meestal de manier van toetsen in het PO. De eindtoets en het daarop geënte leerlingvolgsysteem hebben bovendien een sterke invloed op het eindadvies in het PO. Vanwege de vroege selectie in het VO is dat eindadvies geen advies, maar een toegangsbewijs tot een schooltype. De kwaliteit van de eindtoets (en andere vergelijkbare toetsen) is echter zo problematisch, dat we er onmiddellijk mee moeten stoppen.
Wat is er mis met de eindtoets en de daarop gebaseerde volgsystemen?
- De getoetste vaardigheden (lezen, spelling & grammatica en rekenen) vormen een veel te smalle basis om iets zinnigs te kunnen zeggen over wat de leerlingen hebben geleerd en wat hun toekomstige mogelijkheden zijn, terwijl dat wel de belangrijkste intentie van de toets is. Gevolg: één van de belangrijkste keuzemomenten in de schoolcarrières van kinderen is gebaseerd op drijfzand.
- De gemiddelde prestatie op begrijpend lezen, taalverzorging en rekenen is geen geschikte norm om kinderen op in te delen voor het vervolgonderwijs. De “grenzen” tussen de verschillende niveaus zijn afhankelijk van de gemiddelde prestatie van de groep in plaats van wat de leerling moet kennen en kunnen voor het vervolgonderwijs. Gevolg: de “adviezen” op basis van de scores houden geen verband met kenmerken van het vervolgonderwijs. Daardoor worden kinderen op grote schaal op de verkeerde gronden ingedeeld.
- In de grootste groep leerlingen die rond het gemiddelde scoren, komen de foute uitkomsten van de toets het vaakst voor. Gevolg: de keuze tussen een advies beroepsgericht en algemeen vormend is vrij willekeurig. Dat is erg, omdat het voortgezet onderwijs vaak geen gemengde onderbouw heeft met beroepsgericht en algemeen vormend bij elkaar, waardoor deze “fout” bijna niet kan worden hersteld.
- Individuele vooruitgang leidt niet tot een betere positie in de rangorde. In de metingen van het volgsysteem bepaalt de gemiddelde groei van de groep ook de “vooruitgang” van de norm. De kans dat een ondergemiddeld scorende leerling bovengemiddeld gaat scoren is heel klein. Gevolg: de prestatie van kinderen wordt niet beloond met een betere score. Integendeel: kinderen lopen een grote kans steeds bevestigd te worden in hun “lage/ondergemiddelde” niveau. In het beroepsonderwijs zitten daardoor veel kinderen die ieder vertrouwen in zichzelf en in hun leermogelijkheden hebben verloren. Dat heeft een vernietigende invloed op hun motivatie en het leerklimaat in het vmbo en mbo.
- Toetstraining loont: daarmee verandert het ontwikkelpotentieel van de leerling niet, maar wel de plaats in de gemeten rangorde. Gevolg: voor iedere leerling die daardoor hoger in de rangorde komt moet een andere leerling lager uitkomen. Dat vergroot de kansenongelijkheid in het onderwijs, bijvoorbeeld omdat welgestelde ouders zich toetstraining kunnen veroorloven.
- De eindtoets wordt ook gebruikt in de opbrengstenbeoordeling van de inspectie. Ook daar is het gemiddelde de norm. Voldoen aan de inspectienorm is een bekostigingsvoorwaarde voor scholen. Gevolg: daardoor krijgen de getoetste vaardigheden in het onderwijsprogramma buitensporig veel aandacht, juist op scholen waar leerlingen zitten die relatief meer moeite met deze onderdelen hebben. Tweede gevolg: bij iedere school die “vooruitgaat” in de rangorde is er een andere school die “zakt”, terwijl de prestatie hetzelfde kan zijn.
- Uit de eindtoets worden de referentieniveaus “gereconstrueerd” en gemiddeld. Gevolg: de referentieniveaus taal gaan over veel meer dan alleen begrijpend lezen en taalverzorging. Voor het opbrengstenmodel van de inspectie worden taal en rekenen zelfs gemiddeld genomen. Daarmee is het fundament van de opbrengstenmeting onjuist.
- Leerlingvolgsysteemtoetsen die op dezelfde leest geschoeid zijn geven geen goede informatie voor het leerproces, omdat vanuit een gemiddelde prestatie de rangorde wordt bepaald en de leerlingen worden ingedeeld. De toets verschaft de leerling en de leraar maar beperkte informatie over welke doelen de leerling heeft gehaald en welke (nog) niet. Gevolg: Leraren en leerlingen hebben weinig tot niets aan de feedback die de toets geeft voor het leren.
Het Nederlandse onderwijssysteem is een sorteermachine en dat moet stoppen
Nederland is ongeveer het enige ontwikkelde land waar kinderen zo vroeg op niveau worden ingedeeld op zo’n wankele en smalle basis gebeurt. Zelfs als we beter gaan toetsen en beoordelen is een stelselverandering die die vroege scheiding onmogelijk maakt noodzakelijk en moet er een veel breder curriculum komen. Zolang dat niet lukt zal er in ieder geval een andere basis moeten komen voor de keuze van de onderwijssoorten:
- In plaats van de prestaties op het gebied van lezen, taalverzorging en rekenen zou een brede blik op de talenten, wensen en mogelijkheden van kinderen leidend moeten zijn in de keuze voor het onderwijstype.
- Een grotere flexibiliteit in het moment van overstap van PO naar VO kan bijdragen aan betere leerervaring voor veel leerlingen.
- Met een compleet volgsysteem krijgen we een veel completer en getrouwer beeld van wat kinderen kennen en kunnen en van de opbrengst van het onderwijs.
En hoe moet het dan wel?
Wij verzetten ons niet tegen toetsen of beoordelen in het funderend onderwijs. Het is immers heel belangrijk om te weten hoe de leerlingen vorderen en of ze zich de aangeboden leerstof hebben eigen gemaakt. We willen allemaal dat de kinderen zich kunnen ontwikkelen en dat de manier waarop we de ontwikkeling van de leerlingen volgen helpt om het leren te bevorderen. De behoefte om betrouwbaar te toetsen, ook omdat de toetsen voor kwaliteitsmeting worden gebruikt, heeft echter de inhoudelijke kwaliteit van de toetsen volledig uitgehold. Ter vergelijking: we geven geen rijbewijs af op basis van een – zeer betrouwbare – multiple-choicetoets over de verkeersregels. Om te mogen deelnemen aan het verkeer, zal je moeten laten zien dat je kunt rijden en daarbij vertrouwen we op het professionele oordeel van de rij-examinator.
De toetsing en beoordeling moet dus iets zeggen over wat er geleerd is en wat nog geleerd moet worden.
Kenmerken van goed beoordelen en toetsen
- De beoordeling of de toets geeft goede feedback aan de leerkracht en de leerling ter ondersteuning van het leren. Indelen naar het niveau ten opzichte van het gemiddelde van de groep is niet zinvol en gebeurt dan ook niet.
- De leerdoelen zijn leidend bij wat voor soort toets er gegeven wordt of hoe er wordt beoordeeld.
- Het beoogde effect van de beoordeling/toetsing moet duidelijk zijn. We bepalen eerst wat we willen weten en dan hoe we daar het beste achter komen. In ieder geval is er een duidelijk verschil tussen formatief beoordelen (hoe ver zijn we?) en summatief beoordelen (hebben we het doel bereikt?). In het leerproces beoordeel je altijd formatief aan het eind summatief.
- Een formatieve beoordeling/toets daagt uit om verder te komen, omdat de leraar en de leerling zicht hebben op waar de leerling zich bevindt op de ontwikkellijn. De leraar kan de leerling vervolgens helpen bij de volgende stap op die lijn.
- Leerlingen worden systematisch gevolgd op alle aspecten van hun ontwikkeling; toetsing en beoordeling draagt bij aan die brede blik op ontwikkeling.
- Als leerkrachten steeds goed in het vizier hebben wat de volgende ontwikkelstap van kinderen is en op basis van het al dan niet bereiken van die volgende stap steeds hun pedagogisch-didactisch handelen aanpassen dan is er zeker sprake van goed onderwijs.
Toetsen van rekenen en taal en het opbrengstenmodel van de inspectie
Er valt veel af te dingen op het feit dat rekenen en taal gezien worden als de belangrijkste uitkomsten van het primair onderwijs, maar zolang dat het geval is maken we in ieder geval een grote stap vooruit door:
- de doorlopende leerlijnen rekenen en taal en de te bereiken referentieniveaus in de volle breedte de basis te laten zijn voor de (summatieve) beoordeling van rekenen en taal;
- de data voor het opbrengstenmodel van de inspectie hierop te baseren.
Hoe kan het wel: een goed voorbeeld uit het internationale onderwijs.
Het International Baccalaureate (IB) heeft een evidence-based toetsfilosofie. De vorderingen van leerlingen worden beoordeeld aan de hand van toetsonafhankelijke beoordelingscriteria, die ook inzichtelijk zijn voor de leerlingen. Het effect ervan is dat de beoordeling altijd ten dienste staat van het leren. De summatieve beoordeling (het eindresultaat) wordt niet bepaald op grond van een gemiddelde van toetsen of een eindtoets, maar op grond van een “best-sustained-effort”, het niveau dat de kinderen gedurende een langere tijd laten zien. Gestandaardiseerde toetsen op basis van het gemiddelde worden door het IB afgeraden en alleen getolereerd als de lokale overheid ze verplicht stelt.