Onderwerpen

woensdag 16 december 2009

De dood van AVI







Met de AVI-niveaus  
is in de loop der tijden 
iets geks gebeurd … (!)








Bij de AVI-toetskaarten, versie A en B, R. van den Berg, H. te Linteloo, Katholiek Pedagogisch Centrum (KPC), ’s-Hertogenbosch 1977 (schaal uit: A.J.C. Struiksma, A. van der Leij en J.P.M. Vieijra, Diagnostiek van technisch lezen en aanvankelijk spellen, VU uitgeverij, Amsterdam 1991, 4e herziene druk.) begon AVI 9 bij DLE 30.

Bij het AVI-toetspakket. Handleiding, J. Visser, A. van Laarhoven en A. ter Beek, Katholiek Pedagogisch Centrum (KPC), ’s-Hertogenbosch 1994 begon AVI 9 bij DLE 36.

We maakten daarbij in ons DLE Boek toen de volgende opmerking:

'De genoemde normen zijn afgeleid uit de in de AVI-handleiding - op de bladzijden 16 t/m 19 - visueel weergegeven verdelingen van AVI-niveaus.
Gezien de aard van de aldaar weergegeven originele AVI-normindelingen treft het ons als verrassend en vooralsnog onverklaarbaar dat de van daaruit door ons vastgestelde DLE-normen betekenisvol verschillen van die welke door Struiksma, Van der Ley en Vieijra verstrekt worden in hun zesde herziene uitgave van ‘Diagnostiek van technisch lezen en aanvankelijk spellen’. '

In de afbeelding drukken we de conversietabel van het Cito af (aangevuld met onze DLE-schaal), waarin het begin van AVI 9 ook een plek krijgt … De vraag daarbij is, moeten we nu DLE 45 aanhouden als het èchte begin van AVI 9?

In dat geval zou het begin van AVI 9 in de loop der tijden van DLE 30 naar DLE 45 zijn opgeklommen?!?

Het mag duidelijk zijn: het is het beste om AVI gewoon helemaal definitief te vergeten: er is onderhand te veel mee ‘gerommeld’.
Het is verstandig om voor de niveaubepaling en de indeling van de boekjes gewoon de Cito-indeling, die zij nu –om er aan te wennen- nog even AVI (NIEUW) noemen, te hanteren. Cito zet daar (hun) AVI (OUD) tegenover, maar ook die schaal lijdt weer aan enige ‘oprekking’ t.o.v. de schaal van 1994 ...

Het mooie van het hele verhaal vind ik, dat wij in 1994 al voorstelden om een indeling te hanteren op basis van DLE’s (zoals de schaal op de afbeelding), omdat in dat geval het niveau kan worden vastgesteld met àlle leestesten (mits ze beschikken over een DLE-schaal).

En wat zien we? Gelukt!


We kunnen dus net zo goed zeggen: ‘Het niveau van het technisch lezen komt overeen met dat van de eerste helft groep 3 (Start = DLE 1 t/m 4) of met dat van de tweede helft groep 6 (M6 = DLE 35 t/m 39) …’ Nog preciezer is om het niveau uit te drukken in een DLE (DLE 43) en dat kan dan vervolgens met èlke toets voor technisch lezen, want die hebben allemaal een DLE-schaal!

Wilt u technisch lezen toetsen d.m.v. een tekst?       Kijk dan even hier.


dinsdag 10 november 2009

Cito in de Cotan, is dat verstandig?


De laatste tijd komt op deze plek de COTAN nogal eens ter sprake. Meestal heb ik dan (pittig) commentaar …
Dat is niet omdat ik een ‘COTANhater’ ben, integendeel: we mogen blij zijn dat er in ons land tenminste één club is, die zich inspant om onze testen te beoordelen.
Echter, ik vind dat sommige dingen beter kunnen of anders moeten.





De COTAN is vaak niet mals met kritiek. Vaak terecht, maar naar mijn mening soms onterecht. Hoe dan ook, je mag van een commissie als de COTAN verwachten dat ze eenduidige uitgangspunten hanteert en dat ze elke test op dezelfde manier beoordeelt.
Dat lijkt soms niet het geval ...

Onlangs is door de COTAN beoordeeld de ‘Intelligentietest, groep 8’ van het Cito. Voor ‘Normen’ geeft de COTAN het oordeel ‘Goed’ met de volgende voetnoot:

1) De normgroep is gebaseerd op een representatieve steekproef van leerlingen van groep 8 in het reguliere basisonderwijs en niet op een doorsnede van alle Nederlandse kinderen in de betreffende leerjaargroep.

Niet lang geleden werd door de COTAN onze ‘Drempeltest’ beoordeeld. Bij de eerste indiening was ook bij ons het SBO niet in de normgroep vertegenwoordigd. De normen werden door de COTAN als onvoldoende beoordeeld. Een zinsnede uit de toelichting bij die beoordeling:

‘Echter, wanneer men de pretentie heeft intelligentie te meten en men wil dit weergeven in een IQ-score dan betekent dit dat de normgroep per definitie een afspiegeling moet zijn van alle kinderen in Nederland van een bepaalde leeftijd of een bepaald leerjaar.
De IQ-score van 100 verwijst immers naar het landelijk gestandaardiseerde gemiddelde.
In dat geval kan men zich dus niet tot het basisonderwijs beperken, maar dient men ook leerlingen van het speciaal onderwijs naar evenredigheid in de normgroep op te nemen.’

Doet men dit niet, zegt de COTAN, dan wordt het IQ van de leerlingen onderschat.
Dat betekent bijvoorbeeld dat de test moeilijk/niet te gebruiken is in het kader van de verwijzing naar het PrO en LWOO: er zouden op basis van de uitslag méér kinderen voor verwijzing in aanmerking komen dan nodig is.
Daarom hebben we bij de geactualiseerde normen van de ‘Drempeltest’ wèl leerlingen uit het speciaal onderwijs naar evenredigheid opgenomen in de normgroepen èn gebruiken we de IQ-score.

Gelet op noot 1) bij de uitslag van de ‘Intelligentietest, groep 8’ heeft het Cito dat dus niet gedaan. Dat is op zich geen probleem, als je dan maar niet de term IQ gebruikt.
Maar … dat doet het Cito wel (!)

Waarom ziet de COTAN dit dan toch door de vingers en krijgt de test zelfs een kwalificatie ‘Goed’ voor de normen?

Pikant is in dit geval het feit dat een van de auteurs van de test -namens het Cito- lid is van de COTAN. Natuurlijk komt het vaker voor dat de COTAN mede-commissieleden de maat moet nemen. Ik neem aan dat men daar zorgvuldig mee omgaat, maar de COTAN maakt zich daarmee wèl kwetsbaar. Zeker als men soortgelijke tests verschillend behandelt ...

Ik stel voor: óf alle testuitgevers/auteurs zijn vertegenwoordigd in de COTAN óf geen van alle. Het laatste is natuurlijk het beste; hoeven ze elkaars (of nog erger hun eigen) testen niet te beoordelen …

zondag 4 oktober 2009

DLE, wat is daarmee?



Bij het opsommen van bezwaren tegen DLE’s worden niet alleen veel oude koeien uit de sloot gehaald, maar worden bovendien veel zaken
aangehaald die net zo goed voor andere schalen kunnen gelden, zoals ‘ondeugdelijke normgroepen’.
Vervelender is echter dat er voorbeelden worden gegeven van toetsen die niet ontwikkeld zijn voor ‘DLE-gebruik’ of die al lang uit de tijd zijn.
Daarom beschrijf ik hier kort een voorbeeld van een hedendaagse toets en roep de criticasters op aan te geven wat dààr aan mankeert,
want als het beter kan ... graag!


(Klik op de afbeelding voor een vergroting)


SchoolVaardigheidsToets Technisch Lezen

De toets bestaat uit een leeskaart waarvan de tekst oploopt in moeilijkheid: van korte zinnen en eenvoudige woorden naar lange zinnen en moeilijke woorden. Daardoor kan de kaart worden gebruikt in de groepen 3 t/m 8. Er is uitgezocht hoever de leerlingen binnen de minuut gemiddeld kunnen komen. De tekst van de kaart is daarop aangepast. M.a.w. een gemiddelde leerling uit groep 3 krijgt binnen de minuut geen tekst voor ogen die hij ‘nog niet heeft gehad’.

Vervolgens is nagegaan hoeveel woorden de leerlingen (meer dan 400 per groep, ruim voldoende volgens de COTAN) in de groepen 3 t/m 8 in het land gemiddeld lezen binnen die minuut. Het zal u niet verbazen dat dit aantal stijgt naarmate de toets wordt afgenomen in een hoger leerjaar, ook al wordt de tekst steeds moeilijker.

De aantallen op de meetmomenten in de maand april zijn (voor deze uitleg mooi rond gemaakt):

groep 3: 50,
groep 4: 100,
groep 5: 130,
groep 6: 150,
groep 7: 165 en
groep 8: 175.

We zien een sterke groei in de groepen 3 t/m 5 en een mindere groei in de groepen 6 t/m 8. Dat klopt, want op een gegeven moment heb je het lezen wel onder de knie en is de groei eruit.

Stel, je toetst (in april) een leerling uit groep 7 en er komt een score uit van 100 (waar je normaal een score van 165 zou verwachten). Mag je dan zeggen dat het leesniveau van die leerling uit groep 7 (zo'n beetje) overeenkomt met dat van de gemiddelde leerling uit groep 4? Ik dacht het wel ...
En andersom: stel, een leerling uit groep 4 leest 165 woordjes in de minuut. Mag je dan zeggen dat zijn leesniveau (ongeveer) gelijk is aan dat van de gemiddelde leerling in groep 7? Ik dacht het wel ... Bij het beoordelen van de lichaamslengte redeneren we toch ook zo? En we laten het daar niet bij; we doen bovendien uitspraken over het ontwikkelingsperspectief: 'als de groei in dit tempo doorgaat, zal de uiteindelijke lichaamslengte zo'n ... centimeter bedragen.' Alleen hebben we in dat geval een veel degelijker maat: een meetlat die bij iedereen altijd even lang is. Bij een test moeten we rekening houden met afwijkingen veroorzaakt door allerhande factoren. Vandaar dat we ook spreken van 'zo'n beetje' en 'ongeveer'. Het is een indicatie van het niveau, waarmee niet gezegd is dat dit voor de praktijk onbruikbaar is, we moeten er echter niet te absoluut mee omgaan. Dat geldt voor alle psychometrische instrumenten, ook voor intelligentietesten (!)

Bij het maken van DLE-schalen op basis van bovenstaande meetpunten gaan we nog een stapje verder: we hebben een meetpunt van 50 in groep 3 en een meetpunt van 100 in groep 4. Omdat we uitgaan van tien onderwijsmaanden kunnen we een schatting maken van de groei per onderwijsmaand. Per maand komen er 5 woordjes bij … Omdat we van dezelfde toets meer meetpunten hebben (groep 3 t/m 8) kunnen we op deze wijze een lange schaal maken en dus de scores behaald in bijvoorbeeld groep 7 vergelijken met die van bijvoorbeeld groep 5. Omdat we niet zeker weten of de stapjes tussen de meetmomenten wel in tien gelijke stukjes gaan, moeten we niet te absoluut redeneren in maanden ‘voor’ en/of ‘achter’. Spreken van ‘voor’ en/of ‘achter’ is sowieso niet verstandig: het wekt de indruk dat ‘achter’ in te halen is en dat is maar zelden het geval. Lees daarvoor maar eens mijn bijdrage over Marietje in 'Meten is niet àlles weten ...'

Toch kunnen we die geschatte tussenmaten in de DLE-schaal prima gebruiken, we komen verderop in de schaal immers steeds weer een gemeten maat tegen die ons weer op het rechte pad brengt voor het geval we daarvan iets* zouden zijn afgeweken (daarom kan de schaal ook prima gebruikt worden bij het formuleren van een ontwikkelingsperspectief). Overigens, dat afwijken geldt ook voor de gemeten maat zèlf: het had net zo goed ietsje meer of minder kunnen zijn ... (!) Een leestest is geen meetlat waarop je een absoluut cijfer kunt aflezen, het gaat hier altijd over kinderen in bepaalde omstandigheden, die van het ene op het andere moment kunnen veranderen. Het is dus verstandig om –welke test of welke maat** u ook gebruikt- met enige behoedzaamheid en misschien zelfs met enige argwaan de uitslagen te gebruiken.

*) Met de nieuwe regressietechnieken komen we er dankzij de vele meetpunten héél dichtbij. Bij de vertaling van deze toets, de SkoalFeardigensToets Technysk Lêzen (Fries), doen we dat nòg beter: we hebben daar meetpunten om de vijf onderwijsmaanden i.p.v. om de tien. Elke maand meten zou natuurlijk ideaal zijn, maar dat is praktisch niet te doen. Bovendien zou het heel weinig meer toevoegen: veel minder onzeker wordt het niet.

**) Bij de SchoolVaardigheidsToets Technisch Lezen zijn naast de DLE-schalen o.m. Cito-schalen (A t/m E en I t/m V), percentielen, T-scores en AVI-scores beschikbaar.

Zie ook: Kritiek op DLE's weerlegd

zondag 12 juli 2009

Ton Kapinga en Prem


Ton Kapinga van Onderwijs Advisering 6 7 8, o.m. bekend van het Drempelonderzoek, schreef een open brief aan Prem. U weet wel, van dat t.v. - programma waarin Prem Radhakishun een poging deed kinderen beter te laten scoren op de Cito Eindtoets. We willen u de brief niet onthouden, mede vanwege de verhelderende beschrijving die Ton geeft van het begrip 'Leerachterstand'.

Dag Prem,
Met tien kinderen op weg naar een betere Citoscore. Wat was ik vanaf de eerste aankondiging nieuwsgierig. Hoe zou hij dat aanpakken, wat voor kinderen worden er gekozen, hoe laat je intensiever leren zien en hoe meet je het resultaat van de noeste arbeid?

Met plezier maar vaak ook met kromme tenen heb ik naar de programma’s gekeken. Een schuchtere groep kinderen ontwikkelt zich via een uitgelaten boel naar een zelfbewustere groep. Aan het eind stralende kinderen en een trotse Prem. Negen van de tien beter!

De keuze van de leerlingen en vooral de eerste presentaties vielen bij mij niet zo goed. Hier is Joep en hij heeft 4 maanden leerachterstand. Een commentaar stem heeft al gemeld dat de kinderen een leerachterstand hebben die veroorzaakt is door hun eigen basisschool. Prem gaat doen wat op de basisschool niet is gelukt. Hij vindt het belachelijk dat de kinderen zo onder druk gezet worden. Het onderwijssysteem faalt, hij twijfelt geen moment aan de capaciteiten van de kinderen.

Leerachterstand
Prem, je hebt mensen van enig formaat in de studio gehaald. Peter Tellegen, de maker van de NIO en Marleen van der Lubbe, verantwoordelijk voor de Cito Eindtoets kwamen langs en namen een grote hoeveelheid deskundigheid mee en ook John Biharie en Freeke Freriks van het IBOS weten van de hoed en de rand in het onderwijs. Toch staat er op 8 april 2009 nog als eerste zin op je website dat leerachterstand een wanprestatie van de school is. Het ligt anders Prem. Leerachterstand is een heel fout woord voor prestatieplek.

Als ik een toets maak en deze normeer in juni groep 8, dan zijn de 60 maanden basisonderwijs (tellend vanaf september in groep 3) vol. De leerling die de middelste prestatie levert geeft de maat aan. Hij/zij krijgt het getal 60, evenals alle leerlingen (ruim de helft dus) die evenveel of meer weten. Alle anderen krijgen een getal lager dan 60, die hebben “leerachterstand”. Als nu dezelfde toets gemaakt wordt door leerlingen in de maand januari in groep zeven, dan krijgt de middelste prestatie daar het getal 45. Er zijn 45 lesmaanden voorbij en er komen nog 15 maanden voor het juni is in groep 8. Nu kan het best zijn dat die middelste leerling in groep 7 maar 5 vragen minder goed heeft dan die in juni groep 8. Een vraag extra goed scheelt dan meteen 3 maanden!
Bijna de helft van de kinderen die in Nederland de basisschool verlaten hebben dus leerachterstand. Dat is vanwege de definitie van dat akelige woord en heeft niets met wanprestaties van scholen te maken. Leerachterstand veronderstelt dat er iets in te halen valt en dat het een kwestie van maanden is. Dat is onjuist want zouden alle kinderen naar de school van Prem mogen en daar stevig van profiteren, dan geldt nog steeds dat de middelste prestatie in juni groep 8 de maat slaat en dat bijna de helft van de kids leerachterstandscijfers krijgen. Het criterium schuift gewoon op.

4, 4, 4, 6, 7, 9, 12 en 15 maanden leerachterstand turf ik als ik de eerste programma’s nog eens doorkijk. Van twee leerlingen heb ik die score gemist. Schande dat deze leerachterstand het resultaat is van ons Nederlands onderwijs. Ik vind het nogal meevallen. Van ruim 25.000 leerlingen in groep 8 op gewone basisscholen heb ik gegevens. Die groep gedraagt zich precies volgens de definitie. 49,7% heeft een leerachterstand van 1 maand of meer. 45,5% heeft een voorsprong van 1 maand of meer maar daar hoor ik in het programma niets over. Bijna 5% scoort even hoog als die middelste leerling die de maat aangeeft.
Nu komt het. 19% heeft volgens de definitie een leerachterstand van 1 tot 5 maanden, 14% een achterstand van 6 tot 10 maanden en 8% van 11 tot 15 maanden. Op diezelfde basisscholen heeft 8% een achterstand van meer dan 15 maanden.
Op het speciaal basisonderwijs heeft 73% meer dan 15 maanden leerachterstand. Voor ongeveer 10% van de leerlingen in het voortgezet onderwijs geeft de Minister geld uit om extra hulp mopgelijk te maken. Meestal wordt dit geld uitgegeven door de groepsgrootte te verlagen naar ongeveer 15 leerlingen, dit naast de inzet van meer zorgleerkrachten.

De groep die voor de School van Prem is uitgekozen komt op een leerling als Denzel na voor deze extra zorg niet in aanmerking. De kinderen in jouw school Prem behoren tot de “normale” groep. Ik zei al, leerachterstand is een fout woord voor leerplek. Als 100 het midden is, kan nu eenmaal niet iedereen een IQ boven 100 hebben, ook niet als je dat nodig hebt om je dromen te verwezenlijken, om bijvoorbeeld piloot te worden.

Gewone kinderen dus en daar heb ik van genoten. Het saaie werk van John Bihari wordt in het programma flink naar de achtergrond gedrukt en voorop komt de interactie te staan. Joost verovert stuiterend over het beeld de harten van mij en Nederland, Denzel leert wat maskerende truckjes af, de kinderen worden zichzelf, groeien in zelfvertrouwen en postuur. Je hebt gelijk, daar gaat het om. Vertrouwen hebben in jezelf en niet bij de pakken neerzitten.

Een instituut als het IBOS weet daar goed mee om te gaan. Een kind komt uit school, je geeft hem een kop thee en je maakt een praatje. Dan gaat de tas open, komt de agenda op tafel en wordt het rijtje opdrachten een voor een afgewerkt. Gemaakt werk wordt doorgekeken en even besproken, leerwerk wordt overhoord. Is het werk om half zes nog niet klaar, dan ligt er een boterhammetje en het kind dat naar huis gaat heeft het werk af. De volgende ochtend blijkt de helft van de klas weinig gedaan te hebben, komt er een goed cijfer voor de overhoring en dat motiveert om na schooltijd de boeken weer open te doen.
Natuurlijk heeft het instituut een boel didactische en pedagogische kennis in huis, maar voornamelijk zijn het prima oudervervangers. Dat mis ik in het programma.

Ouders
De school heeft het fout gedaan en de School van Prem gaat er wat aan doen om te laten zien dat het anders kan. Dat gaat met extra uren werk, veel aandacht naar teambuilding, saamhorigheid, een goede conditie en een prima sfeer. Als slagroom op de taart komen er wereldkampioenen en beroemdheden langs. Zo doe je dat in een TV-programma.

De verhouding school-ouders wordt nog eens extra op scherp gezet als Denzel de Citotoets niet hoeft te maken. Gezien zijn leerachterstand en laag uitvallende IQ-score is dat een uitstekend advies. Niet mag maken maak je er van Prem en je hebt het maar meteen over een advocaat en een kort geding. De ouders worden op het matje geroepen en moeten uitleggen hoe het komt dat ze met het advies instemmen. Mij bekruipt het gevoel dat Denzel de Citotoets moet maken omdat er leerwinst bewezen moet worden.

Resultaat
Heel nieuwsgierig was ik naar het resultaat. Hoe “bewijs” je dat de extra inspanning resultaat heeft. Wat is de beginmeting, hoe betrouwbaar is de koppeling naar het uiteindelijke Citogetal? Uitzending 10 deed een aanslag op de al geplaagde tenen.

Justin heeft een percentielscore van 80 op de Entreetoets groep 7 en een NIO-score van 116. Ik heb de eerste uitzendingen nog eens bekeken maar de leerachterstand van Justin heb ik gemist. Was die er wel? Deze twee gemelde scores komen overeen en wijzen inderdaad naar minstens havo en mogelijk vwo. De bijlessen van het IBOS hebben het profiel van Justin zeker niet verbeterd. Dat is zonder specifiek oefenen niet mogelijk en John Bihari is te veel professional om dat zelfs maar te overwegen.
Nee, het advies van de school roept vragen op, maar we hebben Justin in de School van Prem zien winnen aan zelfvertrouwen. Zonder dat zelfvertrouwen is een keus voor theoretische leerweg wel te begrijpen. Het is beter dat een kind door goede prestaties gemotiveerd wordt dan dat het alle vertrouwen verliest als er te hoge eisen aan hem gesteld worden.

Joost is een intelligent joch maar reageert (enthousiast) op alle prikkels die langs komen. Niets ontsnapt aan zijn aandacht en als het wat saai wordt, zet hij eigenhandig de boel op stelten. Als iets zijn interesse heeft, dan leert hij, zo niet dan verlegt hij zijn aandacht naar leukere zaken. Het is een hele kunst om zijn neus in saaie boeken te houden en dat is je goed gelukt Prem. Joost gooit alles in de strijd en spant huilend op de achterbank ook zijn bezorgde ouders nog voor zijn karretje, maar het lukt je om hem bij de groep te houden. Met goed resultaat. Cito 537, havo! Nu maar hopen dat hij binnen die leerweg een team treft is dat het voor elkaar krijgt om hem gericht op zijn werk te houden. Zelf zou ik de veilige weg bewandelen en maximaal een plek zoeken met de naam theoretisch/havo op de gevel.

De eerste zes of zeven kids die plechtig de citoscore uitgereikt kregen werden uitgebreid bejubeld. Eén, twee, drie leerwegen hoger dan verwacht! Afgaand op de cijfers wil ik daar nog wel wat over discussiëren. Elke leerweg heeft een range van veel voorkomende scores en die van naast liggende leerwegen overlappen elkaar behoorlijk. Om een score die wijst naar stevig kader en mager theoretisch maar meteen als theoretisch en dus een leerweg beter te bejubelen, gaat wat ver en 534 wijst niet naar havo. Maar ja, het is televisie!

Dan komt Lisa wat bedremmeld naar voren. Ze voelt de bui hangen en dekt zich vast in. Toch niet zo goed gemaakt, fluistert ze. Met gevoel voor drama wordt verteld over een te verwachte score op basis van een eerdere toets van 523 en het is geworden…… 519! Niet vooruit gegaan! Hoe komt dat Lisa, heb ik iets verkeerd gedaan, vraagt Prem. Natuurlijk niet, snikt Lisa. Het is alleen haar fout. Tranen, treurmuziek, een ongemakkelijke zaal, troostende ouders. Lisa heeft gefaald.

Maar Prem, elke te verwachte score heeft een boven en een ondergrens en bij 523 zijn die grenzen een stuk ruimer dan bij scores rond het gemiddelde van 534. Is het niet zo dat 519 netjes in dit verwachtingsinterval ligt en dat het feitelijk betekent dat Lisa volgens verwachting gepresteerd heeft? Wie faalt er hier?

Dan komt Denzel en de zon kan weer schijnen. Denzel mocht de Citotoets niet maken. Hij heeft het toch gedaan en kijk nu eens, een score van 518, kader!
Nee, Prem, cito 518 samen met 15 maanden “leerachterstand” en een laag uitvallende NIO-score geeft aan dat de school voor voortgezet onderwijs via een beschikking voor leerwegondersteuning extra geld kan krijgen om Denzel de hulp te geven die hij nodig heeft, waar hij recht op heeft. Samen met misschien Lisa naar een kleine lwoo-klas en omringen met de nodige zorg zou ik zeggen. Daar is meer kans op succes en vertrouwen in de toekomst.

Tot slot
Negen van de tien beter is wat overdreven Prem. Klop niet te hard op de borst. Je hebt laten zien hoe je een groep kinderen alert kan krijgen, enthousiast, betrokken en je hebt vast de best mogelijk prestaties te voorschijn getoverd. Je hebt in tien programma’s laten zien hoe lastig en intensief het is om een groepje kinderen “bij de les” te houden en prima televisie gemaakt. Maar voor navolging komen we in Nederland wat wereldkampioenen te kort en deze kinderen staan er straks weer gewoon alleen voor.

En je hebt gezorgd voor gespreksstof op de scholen. Bravo dus Prem, want daar is niets mis mee en ja, het kan altijd wel beter. Volgend jaar gewoon weer, maar dan liever wat genuanceerder.

Ton Kapinga

zaterdag 23 mei 2009

De verontwaardiging over de COTAN verklaard ...



In de bijdrage 'De COTAN ziet DLE's het liefst geheel verdwijnen ...' wordt sterk verontwaardigd gereageerd op deze opvatting/uitspraak van de COTAN, omdat de vele gebruikers worden gebruuskeerd: ze zijn kennelijk heel dom bezig ...In de (vorige) bijdrage werden de bezwaren tegen de COTANargumentatie al aangestipt, maar laten we die eens onder de loep nemen.
Dan blijkt dat de COTAN het afwijzen van de DLE’s volstrekt niet kan waarmaken.

De afwijzing van de DLE's door de COTAN is namelijk gebaseerd op anekdotische argumentatie, vooringenomenheid en een valse conclusie. In 2007 hebben twee leden van de COTAN in De Psycholoog het standpunt van de COTAN over de DLE’s uiteengezet. Ze komen tot de conclusie dat, gezien de vele bezwaren die tegen DLE’s opgeworpen kunnen worden, normering op basis van standaard- of rangordescores te prefereren is (Evers en Resing. 2007).
De anekdotische argumentatie bestaat er uit dat er mogelijke problemen met DLE schalen worden opgeworpen (bijv. bodem- en plafondeffecten), er een voorbeeld wordt gegeven van een DLE schaal waarbij dat optreedt en vervolgens geconcludeerd wordt dat DLE schalen dus niet deugen. Waarbij niet met zoveel woorden gezegd wordt, maar wel geimpliceerd, niet kunnen deugen!
De vooringenomenheid bestaat er onder andere uit dat er selectief gebruik gemaakt wordt van de literatuur. Veel van de argumenten van Evers en Resing tegen de DLE's komen uit het artikel van Oud en Mommers uit 1990. In 1991 heeft Gerard Melis - de auteur van het DLE boek - een verweer geschreven waarin hij uiteenzet dat volgens hem een aantal argumenten van Oud en Mommers ondeugdelijk is. Evers en Resing noemen Melis’ artikel en zijn argumenten niet. Zij geven dus alleen de argumenten die tegen DLE's zijn opgeworpen en andere standpunten negeren ze. Hiermee doen ze de door hen van belang geachte 'ontwikkelingen op het gebied van de testtheorie en testconstructie' geen recht. Want ontwikkeling is gebaat bij debat en argumentatie. Het kan natuurlijk zijn dat de COTAN de tegenargumenten van Melis ondeugdelijk vindt, maar laten ze dat dan beargumenteren. Dan kan je de argumenten (zowel voor als tegen) naar een hoger plan brengen.
De valse conclusie bestaat er uit dat Evers en Resing stellen dat, gezien de door hen gepresenteerde bezwaren, DLE’s moeten worden afgewezen en deviatienormen geprefereerd. In hun artikel laten ze echter na aan te tonen dat de door hen opgevoerde mogelijke problemen (laten we er nog eens eentje noemen: ondeugdelijke normgroepen) niet of in ieder geval in mindere mate voor de deviatienormen gelden. De conclusie van Evers en Resing volgt dus niet uit de door hen gepresenteerde argumenten. Analoog aan de manier van redeneren van Evers en Resing zou je kunnen stellen dat de kleur rood voor auto’s moet worden verboden: rode auto’s dragen immers bij aan de luchtvervuiling, aan het verkeersinfarct en verkeersslachtoffers. Om met Evers en Resing te spreken: het ziet er prachtig uit, maar het liefst zien we die kleur geheel verdwijnen ...

Zie ook: Kritiek op DLE's weerlegd

vrijdag 22 mei 2009

De COTAN ziet DLE’s het liefst geheel verdwijnen …


Op de website van de COTAN valt het volgende te lezen: 'Momenteel wordt gewerkt aan een herziening van het beoordelingssysteem. Deze
herziening betreft een ingrijpende aanpassing van het beoordelingssysteem in het licht van de ontwikkelingen die zich in de loop der jaren op het gebied van testtheorie en testconstructie hebben voorgedaan. De verwachting is dat deze herziene versie in het voorjaar van 2009 gereed zal zijn.'

Ik kreeg enkele fragmenten van deze herziene versie onder ogen en las
daar o.m. ‘- maar de COTAN ziet rapportage in termen van DLE’s het liefst
geheel verdwijnen -‘.

Ik moest meteen denken aan al die scholen voor (speciaal) basisonderwijs in Nederland en aan de leden van de verschillende plaatsings- en verwijzingscommissies, maar ook aan de orthopedagogen/psychologen, interne begeleiders, remedial teachers en logopedisten. Zij maken namelijk allemaal al jaren (dankbaar en tevreden) gebruik van DLE’s.
Zij hebben de DLE-systematiek verankerd in hun registratie- en rapportagemodellen en in hun (dikwijls online) administratieprogramma’s. Wat moeten zij, maar ook al die bedrijven die de online applicaties exploiteren, hier wel niet van vinden? En wat te denken van onze Minister van Onderwijs Cultuur en Wetenschappen, die het gebruik van DLE’s nota bene verplicht stelt!?!

De herziening van het beoordelingssysteem vindt plaats ‘… in het licht van de ontwikkelingen die zich in de loop der jaren op het gebied van testtheorie en testconstructie hebben voorgedaan.’ Dat mag zo zijn, maar ik krijg de indruk dat de COTAN volledig voorbij is gegaan aan de ontwikkelingen in de praktijk (zoals hierboven geschetst). Realiseert de COTAN zich wel voldoende wat haar opvattingen/uitlatingen betekenen voor de honderdduizenden gebruikers (direct en indirect)?

Dat de COTAN vraagtekens zet bij het gebruik van DLE’s is prima; dat hoort zij –gelet op haar opdracht (zie verder)- te doen bij alle normeringswijzen. Er is namelijk géén schaal die vlekkeloos is: ze hebben alle hun voor- en nadelen. Maar om dan alléén de DLE’s volledig uit te willen sluiten?!? En dat dan ook nog voor een schaal die naast de Cito-schaal het meest gebruikt wordt voor didactische toetsen? Je mag vrezen dat een dergelijke uitspraak voor de COTAN onaardige reacties oproept: ‘Wie is die COTAN eigenlijk wel, dat zij meent onze praktijk zo ongegeneerd te moeten diskwalificeren? Moeten wij haar nog serieus nemen?’

Wie is de COTAN eigenlijk?
Van de website: 'De Commissie Testaangelegenheden Nederland (COTAN) van het NIP (het Nederlands Instituut van Psychologen is de landelijke beroepsvereniging van psychologen) heeft als opdracht ‘het bevorderen van de kwaliteit van tests en testgebruik in Nederland’. Door de COTAN worden psychodiagnostische instrumenten beoordeeld aan de hand van criteria als testconstructie, uitvoering van de handleiding en testmateriaal, betrouwbaarheid en validiteit.Verder informeert de COTAN testgebruikers over de stand van zaken op testgebied.'

De COTAN is dus een commissie van de beroepsvereniging van psychologen, die -voor eigen gebruik mag je aannemen- instrumenten van anderen beoordeelt. Die beoordeling vindt plaats op basis van criteria die in een beoordelingssysteem staan beschreven. Dat systeem heeft een inventariserend/beschrijvend karakter: zit dit erin, heeft de auteur dat gedaan, is beschreven hoe … enz. De COTAN gaat de test dus niet testen; zij probeert hem niet uit en controleert evenmin of alles wat er in de handleiding/verantwoording staat geschreven klopt …
Ze gaat dus ook niet na of de test werkt … Een test die goed beschreven is, kan voldoende beoordeeld worden, maar toch slecht werken. Andersom kan ook: een als onvoldoende beoordeelde test kan in de praktijk goed werken (!). De beoordeling moet dus niet worden verward met die van bijvoorbeeld de Consumentenbond, die proeven met de artikelen doet en vervolgens kan aangeven welk artikel het beste is. Bovendien hebben auteurs wel eens moeite met de werkwijze van de COTAN: de beoordelaars werken anoniem en er is onvoldoende duidelijk wat de (beroeps)rechten van de auteurs zijn als ze het met de beoordeling niet eens zijn. M.a.w. ze hebben wel eens het gevoel dat er vrij moeilijk over te praten is.

Veel gezag ...
Toch heeft het oordeel van de COTAN grote invloed. Met name sinds het moment waarop de Inspectie van het Onderwijs meedeelde dat testen een voldoende beoordeling van de COTAN moesten hebben, kreeg het oordeel veel gezag. Ook de Regionale Verwijzing Commissie wil dat er uitsluitend door de COTAN ‘goedgekeurde’ testen worden gebruikt.
Begrijpelijk, want het is in ons land het enige houvast m.b.t. de kwaliteit van een test. De COTAN kreeg hierdoor veel gezag.
Gelet op bovenstaande (Wie is de COTAN eigenlijk?) mag men zich afvragen of dat gezag niet ietwat te veel van het goede is. De COTAN is geen KEMA-keur ... Trouwens zij keurt niet, zij beoordeelt. De COTAN is evenmin een overheidsorgaan of een instantie aangewezen door de Minister. De COTAN is bovendien niet erg democratisch: we weten niet precies hoe de leden erin komen, we kunnen niet gemakkelijk iets aan de werkwijze doen; zij maken zelf hun eigen dienst uit …

Dus …
Als dan die COTAN ‘De DLE’s het liefst ziet verdwijnen …’, wat moet je daar dan bij denken?
Als de COTAN ‘het bevorderen van de kwaliteit van tests en testgebruik in Nederland’ als opdracht ziet, zou zij niet bepaalde praktijken –en zeker niet de inmiddels volledig geïmplementeerde- moeten uitsluiten, maar juist moeten verbeteren. De COTAN ziet de nadelen van DLE’s maar heeft –zo lijkt het- geen oog/oor voor de voordelen. Zij lijkt evenmin rekening te houden met het gepleegde verweer tegen de door haar opgesomde nadelen, die overigens voor een groot deel óók voor andere normeringswijzen gelden.

Ik zou wensen dat de COTAN aangeeft waar en hoe de toepassing van DLE’s te verbeteren is. De COTAN zou een betere zaak dienen als zij zou aangeven hoe zij de toepassing van DLE’s wèl acceptabel vindt. Kun je beter niet extrapoleren? Of misschien een beetje? En zo ja hoe ver dan? En hoe zit het met het interpoleren bij cumulatieftesten (hetzelfde werk wordt in opeenvolgende leerjaren gemaakt en genormeerd), kan dat dan wel door de beugel? En zo ja onder welke voorwaarden? En mag één scorepunt leiden tot meerdere maanden vooruitgang? Misschien kan de COTAN een voorstel doen: de schaal wordt ongeldig wanneer één scorepunt leidt tot meer dan één maand vooruitgang. Steek de energie derhalve in het verbeteren van een bestaand fenomeen en niet in het verwijderen ervan. M.a.w. de huidige opvatting/uitspraak ‘- maar de COTAN ziet rapportage in termen van DLE’s het liefst geheel verdwijnen -‘ valt beslist niet lekker, zeker als je bedenkt wie de COTAN eigenlijk is …

Lees ook: 
De verontwaardiging verklaard

Lees ook: De geschiedenis van de DLE's

Lees ook: Kritiek op DLE's weerlegd

donderdag 9 april 2009

Moet je bij een zittenblijver de Didactische Leeftijd doortellen?






Op de website van Boom test uitgevers vinden we bij de presentatie van het DLE BOEK* een heel goed antwoord op deze vraag ...



Wat dit betreft moet niks. Of je doortelt of de DL terugzet is een keuze en wat je kiest is afhankelijk van het gebruik van de DL. In het perspectief van leerlingzorg ligt terugzetten voor de hand. Als je toetst op schoolvorderingen ga je na of een leerling presteert op het niveau dat je mag verwachten. Een leerling halverwege groep vijf (DL=25) heeft een adequate prestatie als die een DLE haalt van 25. Een dergelijke leerling heeft op dit aspect dus geen extra aandacht nodig. Het maakt daarbij niet uit of deze leerling is blijven zitten of niet. De leerling presteert op het niveau van het onderwijs dat het op dat moment krijgt. Natuurlijk heeft de leerling die is blijven zitten een achterstand ten opzichte van de ex-klasgenoten die een groep hoger zitten, maar het zou unfair zijn om met de ex-klasgenoten te blijven vergelijken (er is toch niet voor niks besloten om de leerling niet te laten overgaan?). Doubleren kan je beschouwen als een herkansing. De leerling maakt een nieuwe start en je begint opnieuw te tellen.
Met andere woorden, wij beschouwen het DL in het kader van leerlingzorg niet als het aantal maanden genoten onderwijs, maar als een indicatie van het niveau van het onderwijs dat het kind krijgt. Voor leerlingen die een klas overslaan is dan de consequentie dat de DL vooruit wordt gezet. Bij het bepalen van een eventueel ontwikkelingsperspectief is het belangrijk rekening te houden met de effecten van deze maatregelen.

In het kader van bijvoorbeeld een economische analyse van het onderwijs (hoeveel onderwijs is er gegeven en wat heeft het opgeleverd?) zou je DL's moeten doortellen. Dan is de didactische leeftijd niet meer het niveau van onderwijs van een leerling, maar het aantal maanden onderwijs dat de leerling in totaal heeft gehad.

De RVC's denken hier overigens anders over: '... de didactische leeftijd (DL) is het aantal maanden dat een leerling onderwijs heeft gehad. Elk schooljaar heeft 10 onderwijsmaanden te beginnen vanaf september groep 3. De DL wordt berekend op basis van de huidige groep van de leerling, het moment van toetsafname en het aantal doublures vanaf begin groep 3'. Volgens de richtlijn moet echter bij 60 gestopt worden, in groep 8 heeft een zittenblijver dus het hele jaar DL 60.

*) Het wettelijk verplichte naslagwerk voor het vaststellen van leerachterstand bij indicatiestelling.

woensdag 4 maart 2009

Betrouwbaarheid en validiteit

Onder gebruikers van testen en toetsen leven dikwijls vragen rond bepaalde ‘testtermen’, zoals betrouwbaarheid en validiteit.

Bij Boom test uitgevers kwam onlangs de ‘Testwijzer voor professionals’ uit.

Daarin staat op zeer heldere én kort-en-bondige wijze beschreven hoe het zit met al die dingen rond testen en toetsen. Bovendien worden hier en daar in een kadertje heel aardige ‘anekdotes’ verteld, die de spijker op z'n kop slaan en zeer verhelderend zijn.

In deze bijdrage hebben we er twee voor u geplaatst.




























(Klik op de afbeelding voor een vergroting)

dinsdag 20 januari 2009

Alle kinderen aan de toets?


Met een toets kun je in het onderwijs twee* dingen
doen:

1) meten hoe ver de leerling is (wat is zijn vaardigheidsniveau?; hoe goed kan hij rekenen?);

2) meten wat de aanleg/potentie van de leerling is (wat zijn de mogelijkheden?; wat mag je van hem verwachten?).







Met deze twee gegevens kun je de belangrijkste vraag die de school zich in het kader van toetsing te stellen heeft, beantwoorden: komt eruit wat erin zit? Dat geldt voor de leerling, maar ook voor de school als geheel. Als de school eruit haalt wat erin zit, doet de school het goed en verdient een compliment (ook al ligt die uitkomst onder het gemiddelde).

Waar niet veel in zit, komt niet veel uit.
Een school kan dus nooit alléén beoordeeld worden op wat eruit komt. De onderwijsinspectie probeert, bij gebrek aan betere middelen, dat wèl te doen aan de hand van de uitslagen van de Eindtoets Cito en/of aan de hand van de stand van zaken in het leerlingvolgsysteem. Zij probeert daarbij rekening te houden met verschillen tussen de schoolpopulaties. Echter, omdat de zoon van de dominee niet slimmer hoeft te zijn dan de dochter van de stratenmaker, voelen scholen zich dikwijls oneerlijk behandeld en zoeken uitvluchten of alternatieven.

Laten zien wat je kunt (en niet wat je niet kunt).
Zo bezien is het verstandig álle kinderen te toetsen op twee inhouden:

- wat zit erin en
- wat komt eruit.

Omdat kinderen enorm verschillen, is het niet verstandig daarbij domeintoetsen (meten een bepaald niveau uit een leerstofgebied/de leerlijn), maar cumulatietoetsen (meten de leerstof van makkelijk naar moeilijk over de hele leerlijn) te gebruiken. In het laatste geval kunnen leerlingen namelijk maken wat ze kunnen en hoeven ze niet te maken wat ze niet kunnen (ze stoppen als ze het niet meer weten). Dat voorkomt frustraties èn de leerling laat zien wat hij kán (en niet wat hij niet kan). Bij domeintoetsen kan het namelijk voorkomen dat de leerling geen enkele opgave kan maken; hij heeft alles fout. Toch moet hij alle opgaven doen. Dáár wordt een kind niet beter van … (en de school ook niet). Bovendien wordt de onderwijsinspectie er niet wijzer van: ze weet alleen wat de leerling niet kan, maar niet wat de leerling wèl kan.

*) Naast het meten van de aanleg/persoonlijkheidsaspecten en het vaardigheidsniveau kun je een test ook nog inzetten als diagnostisch instrument (waar wringt de schoen?) als blijkt dat het niveau te laag is. Een voorbeeld is de nieuwe Tempo Test Automatiseren (opvolger van de Tempo Test Rekenen).

Hoe maak je een DLE-schaal? (verbeterd)



Op deze plek willen we kort aangeven
hoe een DLE-schaal tot stand komt.

En ... hoe dat beter kan.
(Klik op de afbeelding voor een vergroting)


Voor het maken van een DLE-schaal moet de maker beschikken over tenminste twee gemeten/berekende gemiddelden (eerder en later in de schoolloopbaan) op hetzelfde werk. De DLE-TESTen werken met minimaal drie gemiddelden: hetzelfde werk wordt tevens gemaakt door de ‘belendende groepen’. Zo kan het voorkomen dat de gemiddelde scores op een spellingtest voor groep 5, afgenomen in bijvoorbeeld april, op dat moment de volgende zijn: groep 4: 20, groep 5: 30 en groep 6: 40. De tussenliggende scores kunnen dan door middel van interpolatie gemakkelijk worden geschat: het loopt namelijk in dit uitzonderlijke (!) geval keurig met 1 punt per onderwijsmaand (DL) op.
Door middel van extrapolatie mogen we op basis van onze regels de schaal ook nog naar buiten (naar voren en naar achteren) toe verlengen.
REGEL: Dat mag echter niet verder dan met de helft van de geschatte trend tussen de twee berekende voorgaande gemiddelden.
In dit geval krijgen we dan de schaal zoals hierboven. In dit voorbeeld hebben we te maken met een gefractioneerde test (per leerjaar een stukje). Mooier is het, wanneer we cumulatieftesten kunnen maken, zoals de SchoolVaardigheidsToets Technisch Lezen. Daarbij lezen alle groepen dezelfde kaart, alleen elke volgende groep leest méér. We krijgen dan één lange DLE-schaal.
Het is niet verstandig zelf de schalen nóg verder te verlengen of anderszins aan de schalen te gaan ‘rommelen’.


Beter ...
Tot zo ver de tekst die tot voor kort werd gehanteerd. Onlangs heb ik enige nuancering aangebracht, die er toe moet leiden dat veel van de gesignaleerde 'problemen' zich niet meer voordoen.
Van een aantal testen en toetsen moet het gebruik namelijk worden ontraden, omdat ze verouderd zijn of omdat ze minder geschikt zijn voor 'DLE-gebruik'.
Afgezien van de leeftijd van de test (de test moet niet te oud zijn, niet ouder dan ca. tien jaar) zijn er twee soorten waarbij het maken van een DLE-schaal afgeraden moet worden:

1) Zoals bekend valt bij een test met één normeringspunt geen DLE-schaal te maken, maar een test met slechts twee normeringspunten, die in de tijd vrij dicht bij elkaar liggen (minder dan ca. vijf maanden), is niet goed bruikbaar. Wanneer er tussen die twee normeringspunten tenminste één leerjaar (tien maanden) zit, ontstaan er mogelijkheden, maar de inzet is dan wel beperkt. Eigenlijk zou een test minimaal drie meetpunten moeten hebben: in het leerjaar waarvoor de test bedoeld is en in het leerjaar ervóór en erna.
Zo is bij de SchoolVaardigheidsToets Begrijpend Lezen het werk voor groep 6 óók gemaakt door groep 5 en groep 7. Men kan dan –als de schaal niet naar onderen en naar boven wordt verlengd - tenminste twee leerjaren overzien. Het mooiste is natuurlijk bijvoorbeeld de SchoolVaardigheidsToets Technisch Lezen met normeringspunten in de groepen 3 t/m 8, maar in dat geval gaat het dan ook over één en dezelfde leeskaart, die opklimt in moeilijkheid.

2) Wanneer de test niet met tenminste één scorepunt per onderwijsmaand omhoog gaat, wordt de DLE-schaal wel erg glibberig: een punt meer of minder gescoord, scheelt meteen meerdere onderwijsmaanden in niveau. Eén scorepunt per maand is dus het absolute minimum, mooier is wanneer dat er een stuk of drie of meer zijn.

Verder valt er te discussiëren over het verlengen van de schalen (extrapoleren) met de heersende trend. Mag dat en zo ja tot hoever? Indertijd werd daarvoor de volgende regel gehanteerd: dat mag met niet meer dan de helft van de afstand tussen de uiterste twee normeringspunten. Men begeeft zich dan echter al op zeer glad ijs, omdat ook de DLE’s tussen de normeringspunten geschat zijn. Met de nieuwe regressietechnieken* is dat wel zo dicht mogelijk bij ‘de werkelijkheid’ gebeurd, maar toch, gemeten is het niet! Het is daarom beter het niet te doen. Toch zijn er gevallen waarbij het voor indicatief gebruik zou kunnen, maar men moet dan heel goed weten wat men doet! Bovendien moet de schaal die men met (maximaal) een maand of drie verlengd, wel heel stevig en robuust zijn. Dus een schaal met minimaal drie meetpunten en een ‘scoreklim’ van minimaal één à twee punten per onderwijsmaand. In dat geval lijkt mij het verlengen van de schaal met maximaal drie maanden verantwoord, zeker wanneer de test/toets voor diagnostisch gebruik wordt ingezet (en niet voor verwijzing o.i.d.).

*) Bij de nieuwe Schoolvaardigheidstoetsen worden thans nieuwe (geautomatiseerde) regressietechnieken gebruikt, waardoor de toetsen (ook die van het Cito) in nagenoeg elke onderwijsmaand kunnen worden afgenomen.
Met die nieuwe regressietechnieken komen we er dankzij de vele meetpunten héél dichtbij. Bij de SkoalFeardigensToets Technysk Lêzen (Fries), doen we dat nòg beter: we hebben daar meetpunten om de vijf onderwijsmaanden i.p.v. om de tien. Bovendien verschijnen er thans toetsen met drie of meer meetpunten per leerjaar ... Elke maand meten zou natuurlijk ideaal zijn, maar dat is praktisch niet te doen. Bovendien zou het heel weinig meer toevoegen: veel minder onzeker wordt het niet.

Afwijking op de DL


Leerlingen verschillen niet alleen qua aanleg van elkaar, maar ook qua leeftijd: ze beginnen niet op dezelfde leeftijd aan het onderwijs in groep 3. M.a.w. de leerlingen zijn op de didactische leeftijd niet even oud (!).
(Klik op de afbeelding voor een vergroting)

Met behulp van de tabel 'Afwijking' kunnen we daar bij het bepalen van een ontwikkelingsperspectief rekening mee houden.

Stel dat van een leerling op een moment voor een gemiddeld resultaat een niveau van DLE 30 wordt verwacht, terwijl die leerling zes maanden jonger is dan de gemiddelde leerling. Bij een tegenvallend resultaat (bijvoorbeeld drie maanden 'achter') kunnen we dan zeggen: ‘Maar…, hij is zes maanden jonger dan gemiddeld.’ Andersom geldt ook: van een zes maanden oudere leerling zouden we iets meer mogen verwachten.

maandag 19 januari 2009

Over testen voor het LVS


Voor groepsonderzoek in het kader van een LVS vindt de Cotan dat er per groep ten minste 100 leerlingen in de steekproef moeten zitten.
Voor beslissingen op individueel niveau (bijvoorbeeld verwijzing naar het SBO) moeten dat tenminste 300 zijn. In de Schoolvaardigheidstoetsen van Boom test uitgevers is de kleinste groepsgrootte 423 (bij zinnen lezen A en B) en de grootste 948 (bij hoofdrekenen), gemiddeld zitten er circa 650 leerlingen per groep in de steekproef. Dat is in vergelijking met andere testen erg veel…


Ondanks dat kunnen er zeker op individueel, maar ook op groepsniveau ‘gekke dingen’ gebeuren. De gebruiker moet daar rekening mee houden. Een test is geen meetlat! Het is altijd een schatting en dan ook nog op een bepaald moment. In de handleiding bij de testen wordt daarvoor uitvoerig gewaarschuwd. En let op: de omstandigheden per school kunnen erg verschillen. Een praktijkvoorbeeld van de NTS (woorden): in de steekproef zaten twee scholen (openbaar en protestants-christelijk) in dezelfde wijk (zelfde ouderpopulatie). Het gemiddelde groepsniveau (dus de hele groep!) van groep 6 op de ene school lag een vol leerjaar boven de achteraf berekende norm, op de andere school lag dat gemiddelde groepsniveau van groep 6 een leerjaar lager dan de achteraf berekende norm. Dus, het verschil in niveau op de beide scholen bedroeg in groep 6 maar liefst twee leerjaren! Toch waren de omstandigheden ongeveer gelijk. Er was één verschil: de spellingmethode en de tijd die werd besteed aan het spellingonderwijs.
Toch mooi dat je dan tenminste nog íets (min of meer objectiefs) hebt, om je mee te vergelijken.
Let wel, we praten hier over signaleringstoetsen.

‘Vreemde voorvallen’ en ‘gekke afwijkingen’ horen er gewoon bij.
Zeker als het individuele gevallen betreft. Dat geldt ook voor de vergelijking van een resultaat op een eerder afgenomen versie van de test met de huidige. Met name wanneer je een leerling test met een spellingtest (waarbij dit verschijnsel in het bijzonder voorkomt) van systeem A en vervolgens met een spellingtest van systeem B, kan het voorkomen dat er grote verschillen ontstaan. In sommige gevallen gaat een leerling (ogenschijnlijk) ‘achteruit’. Dat is natuurlijk zelden of nooit het geval. Het ligt in die gevallen dan ook niet aan de leerling, maar aan de test. Bij het IPMON (de voorganger van DLE-LVS) hebben we dan ook afgesproken dat een eens behaalde DLE blijft staan. Dat geldt nog steeds!

Hoe kan zoiets nu worden voorkomen?
Het maken van een test is altijd een compromis. Om ‘uitschieters’ te voorkomen, zouden de leerlingen bij een te testen onderdeel ruim tweehonderd antwoorden moeten geven. Voor een dictee zou dat dus betekenen dat er ruim tweehonderd woorden in zouden moeten zitten. En dan ook nog woorden die er toe doen! Dus ‘de’, ‘het, en ‘een’ zouden we buiten beschouwing moeten laten. Dat is voor de praktijk niet haalbaar: het moet ook nog eens een keer worden nagekeken! Bovendien zou de testlast voor de leerling veel te groot worden. De dictees van de DLE-TEST spellen zinnen A en B zijn dan ook beperkt tot circa 60 woorden, waarvan circa 30 er toe doen. Bovendien is de test gefractioneerd: voor elke groep een stukje, hetgeen wil zeggen dat in het dictee maar een deel van de (in het algemeen in die groep aangeboden/behandelde) spellingproblemen aan de orde komt. Dan drukken we de scores ook nog eens uit in DLE’s, hetgeen veel ‘griezeliger’ is dan bijvoorbeeld de Cito-indeling (A = de 25% beste leerlingen). In het eerste geval zit je er sneller naast… Bij een indeling in de groep van de 25% beste leerlingen schiet je vaak raak. De 99-ste en de 76-ste van de honderd zijn beide A. Een afwijking valt daar dus minder snel op (lekker veilig voor de maker van de test…). Ook de Cotan vindt dat trouwens beter. Je uitspraak is meer ‘waar’ als je zegt dat de leerling tot het beste kwart van de groep behoort. De praktijk vraagt echter om meer. Dat een leerling tot het beste kwart behoort, hebben ze zelf meestal al vastgesteld… Natuurlijk is het belangrijk te weten of de leerling ‘bij’ is, maar men wil met name weten: ‘Hoeveel is de leerling vooruitgegaan sinds de vorige keer?’

Boom test uitgevers streeft daarom naar het maken van cumulatietesten (zoals hoofdrekenen en lezen zinnen A en B). Die hebben het voordeel dat ze


  • van gemakkelijk naar moeilijk zijn opgebouwd
  • de (zwakke) leerling daarom niet frustreren (scoren kan altijd)
  • de betere leerling de kans geven méér te laten zien
  • laten zien wat de leerling wél kan en niet wat de leerling niet kan
  • in één testbeurt meteen het eindniveau in beeld brengen
  • bij een volgende afname een vooruitgang (kunnen) laten zien
  • de leerling dus (ook) met zichzelf kunnen vergelijken
  • herhaald afneembaar zijn in meerdere groepen
  • daardoor weinig organisatie/administratie met zich mee brengen

Cito maakt domeintoetsen (een stukje uit de leerlijn dat aan de orde hoort te zijn in bijvoorbeeld de tweede helft van groep 6 [E6] wordt getoetst). Wanneer je daar als leerling nét niet aan toe bent, maak je heel veel fout. De volgende keer weet je de inhoud van E6 wel, maar helaas… M7 is aan de beurt en maak je weer heel veel fout… Bovendien, als de leerling ‘een E-tje’ blijkt te zijn (behoort tot de zwakste 10%), wat zegt dat dan nog? De vraag zou dan nog moeten zijn ’Hoe erg E ?’ De beste E-leerling kan in DLE’s wel drie jaar vóór liggen op de zwakste E-leerling. Anderzijds, ook tussen A-leerlingen kan er wel twee jaar niveauverschil bestaan … (!).

Boom test uitgevers wil de leerling ook en vooral vergelijken met zichzelf en minder met de groep.

Om praktische redenen kunnen er helaas niet voor alle onderdelen cumulatietesten worden gemaakt. Een tussenoplossing is de gefractioneerde cumulatietest (bijvoorbeeld rekenen/wiskunde). Ze hebben wel één lange DLE-schaal, maar kunnen in delen worden afgenomen.

Voor spellen en begrijpend lezen is het heel moeilijk om onze wensen te realiseren. We moeten daar helaas voor elke groep een apart (genormeerd) onderdeel maken. Je kunt kinderen uit groep 3 toch niet confronteren met woorden als accountant? Juist bij die testen zien we veel ‘afwijkingen’ en ‘merkwaardige verschijnselen’. Zo kan een leerling op een dictee voor groep 5 ‘alles’ fout maken en op het dictee voor groep 4 (omdat 5 te moeilijk was) ‘alles’ goed. Dat heeft wellicht te maken met het wél volledig begrijpen van de stof voor groep 4 en het nog niet begrijpen van de stof voor groep 5. Met een DLE-schaal kom je dan in de problemen: waar zit de leerling nu? Met een deviatieschaal was je in een keer uit de brand geweest: E (de zwakste 10%).
Een uitzondering wordt overigens het 150-woorden dictee (onveranderlijke woorden), dat qua constructie op reken/wiskunde lijkt en één lange DLE-schaal krijgt.

Inspectie gebruikt DLE - LVS


In het in september 2006 gepubliceerde Analyse en waardering van opbrengsten primair onderwijs van de Inspectie van het Onderwijs lezen wij het volgende:


‘De hoofdinspecteur heeft bevestigd dat de inspectie de toetsen van het DLE-LVS van Boom test uitgevers kan gebruiken om de tussentijdse en eindopbrengsten vast te stellen.’

Daar zijn we blij mee! Omdat de toetsen van Boom test uitgevers puur voor de praktijk zijn ontwikkeld, werd er in de verantwoording minder uitvoerig stilgestaan bij de wijze waarop de toetsen zijn ontstaan. Hoewel aan de kwaliteit niet werd getwijfeld, voldeden ze daardoor niet aan de beschrijvingseisen van de COTAN. De Inspectie van het Onderwijs vindt echter dat toetsen daar in principe wél aan moeten voldoen. Boom test uitgevers ging de toetsen daarop herschrijven, zonder dat er aan de constructie, de inhoud, de wijze van afnemen en de normen iets veranderde. Nu op dit moment eerste toetsen door de COTAN als voldoende tot goed zijn beoordeeld (en dus tóch goed blijken te zijn), acht de Inspectie van het Onderwijs de tijd rijp om de rest het voordeel van de twijfel te geven. Het laten beoordelen van toetsen door de COTAN is een langdurig en moeizaam proces. De verwachting is dat de resterende toetsen in de loop van 2009 door de procedure zijn en eveneens als voldoende tot goed worden beoordeeld.

‘De inspectie acht het van belang dat scholen betrouwbare, valide en genormeerde toetsen gebruiken. Of dit toetsen zijn die het resultaat uitdrukken in deviatiescores of in didactische leeftijdsequivalenten is op zichzelf niet relevant.’

Daar zijn we blij mee! Lange tijd is de toetswereld gedomineerd door de ‘deviatiedenkers’. We bedoelen dat niet hatelijk, maar er werd vanuit die optiek niet al te positief geoordeeld over de alternatieve benadering van de DLE’s. Natuurlijk zijn er kanttekeningen te plaatsen bij DLE’s; men moet er verstandig mee omgaan. Aan de andere kant zijn ook de deviatieschalen niet vlekkeloos. Zo kan er in groep 8 tussen de zwakste én de beste E-leerling wel DRIE leerjaren niveauverschil bestaan (!). Wat zegt zo’n E dan nog? Dan komen de DLE's dichter bij 'de waarheid' ...

‘Nadrukkelijk moet worden vermeld dat de Drempeltest van Boom test uitgevers niet geschikt is om te oordelen over de eindopbrengsten, omdat de toets de schoolvorderingen onvoldoende in beeld brengt. Als de school naast de Drempeltest beschikt over DLE-toetsen voor rekenen/wiskunde en begrijpend lezen, kunnen de eindopbrengsten daarmee worden beoordeeld.’

Klopt! De Drempeltest zegt (nagenoeg) niets over het schoolvaardigheidniveau. De Drempeltest meet wat erin zit en niet wat eruit komt, zoals de Cito Eindtoets doet. Vaak zien we de Drempeltest dan ook gebruikt náást de Cito Eindtoets (of naast de toetsen van het LVS) om na te gaan of eruit gekomen is wat erin zit. Dan kun je pas écht iets zeggen over de opbrengst van het onderwijs. Alleen de school die eruit haalt wat erin zit, verdient een voldoende oordeel.

Zie ook: Kritiek op DLE's weerlegd

Scholen stellen zèlf hun LVS samen


Steeds meer scholen stellen zèlf een pakket aan toetsen samen waarmee zij hun leerlingen volgen. Sinds de toetsen van het Cito LVS over DLE-schalen be-schikken en de toetsen van het DLE-LVS over Cito-schalen, vormt de verwerking van de ruwe scores geen probleem meer: de school kan er voor kiezen vast te houden aan de Cito-registratie, maar kan ook álle scores middels DLE’s verwerken. De laatste mogelijkheid wordt overigens meer en meer toegepast.

Scholen hebben het gevoel met behulp van de DLE’s ‘dichter bij het kind’ te kunnen rapporteren over de vorderingen. Ook ouders blijken die manier van rapporteren op prijs te stellen. Hoewel met behulp van het Cito-LVS ook heel goed een rapportage ‘dichtbij het kind’ mogelijk is, beperkt de communicatie zich in de praktijk toch vaak tot het spreken over A-tjes en E-tjes.


Wat daarbij overigens opvalt is het feit dat er een merkwaardig misverstand is ontstaan over de C-leerling: die zou ‘normaal’/voldoende presteren, omdat de C in het midden staat van de rij A, B, C, D en E. Echter, de Cito-verdeling van zeer zwak (E) naar goed (A) loopt over 10, 15, 25, 25 en 25 procent van de populatie, waardoor de C-leerling behoort tot het twééde kwart, dus onder het gemiddelde … (!). Dat scholen voor het verwijzen van leerlingen naar het PrO en LWOO (wettelijk verplicht) DLE’s moeten aanleveren, heeft de toepassing van DLE’s natuurlijk ook bevorderd.


Nu bovenstaande ontwikkeling stevig doorzet, kiezen ook ander toetsenmakers ervoor DLE- en/of Cito-schalen toe te voegen aan hun testen. Een goed voorbeeld hiervan is de Dyslexie OpsporingTest, de DOT van uitgeverij Libbe Mulder. Waar de test aanvankelijk uitsluitend stanine-scores bevatte, werken de auteurs nu met grote haast aan het maken van DLE-schalen (en voor het gemak ook Cito-schalen) bij de test. Hierdoor wordt het toepassingsgebied van de test aanmerkelijk vergroot: hij kan dan niet alleen ingezet worden voor het opsporen van dyslectische leerlingen, maar tevens dienst doen als spellingtoets in het kader van een LVS. De auteurs schrijven daarvoor zelfs een aparte B-versie. Voor de scholen is deze ontwikkeling gunstig: met de DOT slaan ze dan twee vliegen in één klap …


Voor wat betreft de ‘gewone’ leerlingvolgsysteemtoetsen hebben de scholen ook een voordeel: ze kunnen een toets kiezen die het beste bij hun populatie of werkwijze past. Een voorbeeld zien we in de toetsen voor begrijpend lezen van Cito en Boom test uitgevers. De laatste zijn ‘lichter verteerbaar’, zodat meer aan de zwakke leerling wordt tegemoet gekomen. Afhankelijk van de schoolpopulatie kan de school dan een keuze maken. Tot slot is er nog de keuze tussen domeintoetsen (Cito) en cumulatietoetsen (Boom test uitgevers). Domeintoetsen gaan over een deel uit de leerlijn en cumulatietoetsen gaan van gemakkelijk naar moeilijk. Ook hier kan in het laatste geval weer tegemoet worden gekomen aan de zwakkere leerling: hij kan maken wat hij kan en loopt niet het risico alles fout te maken.


Zo kunnen scholen dus een keuze maken uit verschillende (soorten) toetsen afhankelijk van hun eigen schoolsituatie. Ze hoeven zich daarbij niet meer zorgen te maken over het feit of de toets wel in hun systeem past. Nagenoeg alle administratiepakketten kunnen de ingebrachte ruwe scores namelijk verwerken op een wijze die hen past (DLE’s of Cito).

Ontwikkelingperspectief VO op basis van DLE








Op verzoek projecteren we hiernaast
de werkwijze waarmee op basis van
de behaalde DLE een ontwikkelingsperspectief VO
kan worden geformuleerd.


(Klik op de afbeelding voor een vergroting)






Leerlingen verschillen. De een is slimmer dan de ander. De een leert sneller dan de ander. Daarom komen ze aan het eind van de rit (in groep 8) verschillend uit: van Praktijkonderwijs tot VWO.

Het heeft geen zin aan leerlingen te blijven dokteren, wanneer is komen vast te staan ‘dat er niet meer in zit’. De energie kan dan beter worden besteed aan aspecten waarmee de leerling wèl geholpen is (bijvoorbeeld sociale redzaamheid). Anderzijds kunnen leerlingen die over meer potentie beschikken, wellicht aanvullende aandacht krijgen.

Op basis van de geregistreerde resultaten rekent DLE-LVS het ontwikkelingsperspectief van de leerling uit: waar komt de leerling aan het einde van de rit uit, als het zo doorgaat? De gegevens daarvoor zijn ontleend aan het IPMON-Leerlingvolgsysteem (en het SAVU-Leerlingvolgsysteem).

De kernvraag in het kader van dit LVS is steeds: komt het gesignaleerde ontwikkelingsperspectief overeen met onze verwachtingen van de leerling? Stel dat een leerling een ontwikkelingsperspectief PR (Praktijkonderwijs) heeft en in de omgang met de leerling krijgt u de indruk dat er meer in zit. Dan is nader onderzoek gewenst. Blijkt na onderzoek echter dat het ontwikkelingsperspectief past bij de leerling, dan moet het doel zijn dat perspectief te realiseren. In het LVS zal namelijk blijken dat alle pogingen om de leerling ‘er-weer-bij’ te krijgen, doorgaans weinig resultaten opleveren.

De testen van Teije de Vos

Regelmatig bereiken ons vragen omtrent de testen en toetsen van Teije de Vos.
'Is er al een opvolger van ... , wat is de meest actuele versie, is de vorige versie nog te koop en bij wie, welke nieuwe staan er op stapel, zijn die al Cotan-goedgekeurd?', dat zijn dan zoal de vragen.  
In onderstaand overzicht proberen we antwoord te geven op die vragen.



(klik op de afbeelding voor een vergroting)

Lees ook:

Een sober leerling- en onderwijsvolgesysteem, dan kan en mag!



Beschrijvingen van de testen/toetsen die op dit moment te koop zijn:


Begrippen en Regels - DL - DLE





Dikwijls wordt gevraagd naar een kort-en-bondig overzicht van de begrippen en regels rond het gebruik van de didactische leeftijd en het didactisch leeftijdsequivalent.

(Klik op de afbeelding voor een vergroting)

Meten is niet àlles weten ...


Er worden in ons land bij het interpreteren van toetsuitslagen door mensen die beter zouden moeten weten helaas nog steeds een aantal fouten gemaakt, die vèrstrekkende gevolgen hebben.
Een lage of hoge score alléén is niet voldoende voor een oordeel, je moet ook weten waar en hoe je die score moet plaatsen.


Hieronder een drietal van die misverstanden.


‘Als je Cito C hebt, zit je goed,
want die C valt mooi in het midden’.

Mis! De schaal van het Cito-Leerlingvolgsysteem kent de volgende verdeling: E = de laagste 10% van de scores, D = de daarop volgende 15% van de scores (samen 25%), C = de daaropvolgende 25% van de scores (we zitten nu op de helft van de scores, dus de onderste/laagste 50%), B= is de daarop volgende 25% van de scores en A = de laatste/hoogste 25% van de scores (B en A zijn samen alle scores boven het midden). M.a.w. alle C-scores zitten onder (aan de lage kant) van het midden, dus niks voldoende. Overigens kàn een C-score wel een goed resultaat zijn en een B-score daarentegen een zwak resultaat; zie daarvoor het derde probleem.

‘U hebt te veel E- leerlingen;
de volgende keer moeten de E’s veranderd zijn in D’s …’

Onzin! We hebben het hier niet over bijvoorbeeld DLE's, die een vaardigheidsniveau (op de leerlijn) aangeven, maar over deviatiescores die een positie op de frequentieschaal van zwak naar goed aangeeft. Een zwakke leerling kan op een DLE-schaal de volgende keer verder zijn, maar op een frequentieschaal wordt dat heel moeilijk. Als je een E-leerling bent, behoor je tot de 10% zwaksten en 10% zwaksten zullen/moeten er op een frequentieschaal altijd zijn, ook al worden alle E’s veranderd in D’s (er komen dan weer 10% àndere E-leerlingen voor in de plaats). We geven een voorbeeld van een zwakke lezer.
Marietje leest op de SchoolVaardigheidsToets Technisch Lezen in april groep 4 helaas slechts 30 woordjes in de minuut. Dat is DLE 3 (15 maanden ‘achter’); op de frequentietabel van Cito is dat E. De school maakt zich zorgen en gaat keihard met Marietje aan de slag. Een jaar later is de score 95 woordjes in de minuut, 65 woordjes méér! Dat is DLE 15, een vooruitgang van maar liefst 12 maanden, waar 10 gemiddeld is! Een prestatie van formaat, die je van zo’n zwakke lezer eigenlijk niet mag verwachten. Even kijken waar die 95 woordjes op de Cito-schaal staan … een E ?!?!?! Ja helaas, zij hoort met deze score op dat moment nog steeds tot de 10% zwakst scorende leerlingen ... Wat vraag je wel niet van deze zwakke, doorgaans minder begunstigde, leerlingen als je ze van E naar D wilt brengen?!? Het onmogelijke, zouden we zeggen. Toch lopen er in ons land projecten die dit als doelstelling hebben … (!).

‘Een zeer zwakke school is een school die onvoldoende onderwijsresultaten (eindopbrengsten) realiseert …’
Dat valt nog te bezien! Een school die (ruim) onder het landelijk gemiddelde scoort, kan een meer dan voldoende opbrengst hebben. Scholen die daar boven zitten en veel leerlingen verwijzen naar HAVO en VWO kunnen een onvoldoende (eind)opbrengst hebben. Hoe zit dat? Nou, wanneer je alléén meet wat eruit komt (bijvoorbeeld m.b.v. de Eindtoets Basisonderwijs van het Cito), heb je slechts de helft gedaan van wat je zou moeten doen. Het uitgangspunt is immers, dat scholen eruit moeten halen wat erin zit. Prima!
Maar dan moet je ook méten wat erin zit. Waar niet veel inzit, kan namelijk niet veel uitkomen … En stel dat je onder het landelijk gemiddelde scoort (dat zal in één van de twee gevallen voorkomen: de ene helft zit eronder, de andere erboven) en je kunt aantonen dat je eruit gehaald hebt wat erin zit, dan ben je toch niet een zwakke school?!? Ja, op school zitten wellicht kinderen die iets minder dan gemiddeld in hun mars hebben, maar daarom kun je de school –als onderwijsinstituut- toch niet bestempelen als ‘zwak’?

De Master Frankeskoalle in Earnewâld hakt al een aantal jaren met dit bijltje en heeft daarbij de Inspectie van het Onderwijs weten te overtuigen: van leerlingen met meer mogelijkheden mag je meer verwachten (en andersom). Aan het woord is directeur Harm de Vlas:
“Wij werken al jaren met dle-schalen tot grote tevredenheid van school, ouders en voortgezet onderwijs.
Om te weten of we met de leerlingen ook hebben bereikt wat we kunnen bereiken, gebruiken we naast de dle-toetsen halverwege groep 8 de Drempeltest. Deze combinatie maakt het mogelijk om de eindopbrengsten goed te beoordelen, zowel van de individuele leerling als van de groep/school. We kunnen prima vaststellen of ‘we er hebben uitgehaald wat er in zit’.
Bovendien blijken deze gegevens betrouwbaar te zijn in het kader van advisering naar het voortgezet onderwijs.
Met de Inspectie van het Onderwijs is op onze school vastgesteld dat de advisering van onze school naar het voortgezet onderwijs en de praktijk in de eerstvolgende drie jaren v.o. nauwelijks van elkaar verschillen”.

Hoe werkt dat, aantonen dat je eruit gehaald hebt wat erin zit?
In het Toezichtkader Primair Onderwijs 2005 spreekt de Inspectie van het Onderwijs bij het onderwerp ‘Opbrengsten’ van resultaten van de leerlingen die ten minste liggen op het niveau dat op grond van de kenmerken van de leerlingenpopulatie mag worden verwacht.

In afwachting van het nieuwe (software)pakket adviseren wij op dit moment de volgende werkwijze.

De kenmerken van de leerlingenpopulatie worden bepaald met de Begin-, de Vervolg- (in de maak), de Tussen- en de Drempeltest. Dat gebeurt eens in de twee jaar in groep 2, 4, 6 en 7/8 omdat de kenmerken van de leerlingenpopulatie (het gaat hier om de potentie/de aanleg/de mogelijkheden van de leerlingen) een betrekkelijk stabiele factor is. De kenmerken worden onder meer uitgedrukt in Cito A t/m E (kan desgewenst ook in Cito I t/m V, een IQ of iets dergelijks).
De resultaten van de leerlingen worden in het kader van het leerlingvolgsysteem doorgaans twee maal per leerjaar gemeten (voor het laatst halverwege groep 8) met methode-onafhankelijke en landelijk genormeerde toetsen voor technisch lezen, hoofdrekenen, spellen, rekenen/wiskunde en begrijpend lezen.
De toetsen van het Cito en Eduforce (thans Boom) worden hiervoor het meest gebruikt en voor dit doel worden de resultaten uitgedrukt in Cito A t/m E.
Sinds de DLE-TESTen als SchoolVaardigheidsToetsen verschenen, kunnen de gebruikers op de normensite van Boom dankzij de nieuwste regressietechnieken op basis van de ingevoerde DL (didactische leeftijd) en de ruwe score àlle gewenste schalen (DLE, Cito A t/m E of I t/m V, AVI, T-scores, Decielen enz.) oproepen. Die schalen (ook die van het Cito) gelden, dankzij die nieuwe technieken, bij een afname in nagenoeg èlke onderwijsmaand.

Met bovenstaande gegevens valt vervolgens na te gaan of eruit gekomen is wat erin zit. Dat kan per vak op leerling-, groeps- en schoolniveau. Eenvoudig gezegd, moet een leerling met ‘kenmerk’ B ook een ‘resultaat’ B halen. De Begin-, de Vervolg-, de Tussen- en de Drempeltest geven een keurig overzicht van deze A t/m E-kenmerken.
U kunt aan de hand van deze gegevens (op uw eigen manier) nagaan in hoeverre er sprake is van een ‘match’. De eenvoudigste manier is, nagaan hoeveel procent van de leerlingen een resultaat heeft dat overeenkomt met of hoger is dan hetgeen verwacht mag worden. Je hebt dan het percentage leerlingen waar (op z’n minst) uit gehaald is wat erin zit. Voor een genuanceerder beeld moet je eigenlijk de leerlingen die niet lieten zien wat ze kunnen, ‘wegstrepen’ tegen de leerlingen die méér lieten zien dan ze kunnen. Bijvoorbeeld: van de 100 leerlingen halen 50 wat ze moeten halen, 25 halen minder, maar 25 halen méér. De conclusie mag dan zijn dat de school 100% opbrengst heeft. Veel scholen gebruiken op dit moment voor hun DLE-TESTen nog de Combischalen en voeren de berekeningen uit met behulp van het experimentele computerprogramma NIBOP. Dat kan beter. We werken aan een handiger oplossing, die binnenkort beschikbaar komt.
We willen die werkwijze uniform maken (iedereen moet het op dezelfde wijze doen) en bovendien proberen we tot een zekere norm te komen: het is aannemelijk dat scholen er –landelijk gezien - niet in alle gevallen in slagen eruit te halen wat erin zit. Misschien ligt het percentage landelijk op 92% … Wanneer uw school dan op 96% zit, mag u niet ontevreden zijn.

Artikel verschenen in Zorg Primair No. 5/2007

zondag 18 januari 2009

DLE - LVS


Het DLE-LVS is een leerling- en onderwijsvolgsysteem voor het primair onderwijs, o.m. uitgebracht op cd-rom, die eigenlijk bedoeld is als ‘tool’ voor de IB’er (zie noot 1). Het werd rond 2000 op de markt gebracht door uitgeverij Eduforce.  Het systeem kan heel goed als pen-en-papier-versie worden toegepast met behulp van de leerling- en groepsprofielen. En … het kan net zo gemakkelijk, in z’n geheel of gedeeltelijk, in de vele registratie- en volgprogramma’s worden ondergebracht. Te denken valt aan Esis, Tangram, LVS2000, Eduscope, Magister, Schoolfit, SOM, Winsas en dergelijke, maar ook aan bijvoorbeeld ParnasSys en Dotcomschool. De toepassing van het systeem kan worden aangepast aan de wensen van de school en/of het bestuur. Het kan worden ingezet op leerkracht-/groepsniveau, maar ook als 'tool' voor de IB’er (zorgcoördinator).
Bovendien biedt het systeem mogelijkheden voor kwaliteitsbewaking en opbrengstmeting op het niveau van de leerling, de groep en de school.

Functies

Het systeem maakt leerling-, groeps- en schooloverzichten. Met de overzichten kan niet alleen de voortgang van de leerling, maar ook de kwaliteit van het onderwijs in de groep en op school worden bewaakt. De schooloverzichten kunnen bovendien door het bovenschools management en/of het bestuur worden verzameld om ook op dat niveau te kunnen sturen op kwaliteit.

Het systeem kent de volgende functies:

brengt het vaardigheidsniveau van de leerling in beeld en vergelijkt dit
- met de resultaten van de vorige metingen bij de leerling
- met de resultaten van de groepsgenoten
- met de resultaten van de leerlingen in de vorige en de volgende groepen
- met de landelijke norm
- met de resultaten bij andere (instrumentele) vaardigheden

brengt het vaardigheidsniveau van de groep in beeld en vergelijkt dit
- met de resultaten van de vorige metingen bij de groep
- met de resultaten van de voorgaande en volgende groepen
- met de landelijke norm
- met de resultaten bij andere (instrumentele) vaardigheden

brengt het vaardigheidsniveau van de school in beeld en vergelijkt dit
- met de resultaten van de vorige metingen op de school
- met de landelijke norm
- met de resultaten bij andere (instrumentele) vaardigheden

brengt het leerrendement van de leerling in beeld en vergelijkt dit*
brengt het leerrendement van de groep in beeld en vergelijkt dit**
brengt het leerrendement van de school in beeld en vergelijkt dit***

brengt de leersnelheid van de leerling in beeld en vergelijkt dit*
brengt de leersnelheid van de groep in beeld en vergelijkt dit**
brengt de leersnelheid van de school in beeld en vergelijkt dit***

berekent de opbrengst van het onderwijs bij de leerling en vergelijkt dit*
berekent de opbrengst van het onderwijs bij de groep en vergelijkt dit**
berekent de opbrengst van het onderwijs bij de school en vergelijkt dit***

geeft voor de leerling een ontwikkelingsperspectief in termen van een haalbare vorm van VO
houdt rekening met de afwijking van de leeftijd van de leerling t.o.v. de gemiddelde kalenderleeftijd

*) vergelijken kan met vorige metingen, groepsgenoten, leerlingen in de vorige en de volgende groepen, de landelijke norm en met de resultaten bij andere (instrumentele) vaardigheden

**) vergelijken kan met vorige metingen, de vorige en de volgende groepen, de landelijke norm en met de resultaten bij andere (instrumentele) vaardigheden

***) vergelijken kan met vorige metingen, de landelijke norm (eventueel andere scholen) en met de resultaten bij andere (instrumentele) vaardigheden

Middelen


Bij het systeem werden aanvankelijk de onderstaande (methode-onafhankelijke) onderdelen/testen/instrumenten ontwikkeld (zie noot 2), die op basis van grote landelijke steekproeven zijn genormeerd (de meeste onderdelen kunnen als pen-en-papierversie worden toegepast, een enkel onderdeel heeft ook een ‘eigen’ computerprogramma voor de verwerking):

1. Houding/Gedrag (sociaal-emotionele ontwikkeling)
voor groep 1 t/m 8

2. OPSEO, ObservatiePakket voor de Sociaal-Emotionele Ontwikkeling
voor groep 1 t/m 8

3. Woordenschattest (taalontwikkeling)
voor groep1 [werd vervolgens Woordenschattest voor peuters en kleuters]

4. LVS 1-2, (functie-ontwikkeling)
voor groep 1 en 2

5. OPFO, ObservatiePakket voor de FunctieOntwikkeling
voor groep 1, 2 en 3

6. Voorwaarden- en kennistoets (taal/lezen en rekenen)
voor groep 2 en 3

7. DLE-TEST lezen klassikaal (technisch lezen)
voor groep 3 t/m 8

8. DLE-TEST lezen zinnen A en B (technisch lezen)
voor groep 3 t/m 8

9. DLE-TEST spellen zinnen A en B (zinnen met werkwoordsvormen)
voor groep 3 t/m 8

10. DLE-TEST hoofdrekenen (technisch rekenen)
voor groep 3 t/m 8

11. DLE-TEST rekenen/wiskunde (inzichtelijk rekenen)
voor groep 3 t/m 8

12. DLE-TEST begrijpend lezen A
voor groep 4 t/m 8

13. DLE-TEST begrijpend lezen B
voor groep 4 t/m 8

14. DLE BOEK, met daarin de DLE-schalen van alle in Nederland verkrijgbare testen

15. Combischalen, DLE- èn Citoschalen van testen uit beide systemen (op cd-rom)

16. NIBOP (zie noot 3), programma voor NIveauBewaking en OPbrengstmeting met DLE èn Cito (zie noot 4)
Al deze onderdelen zijn -naast enkele onderdelen die een relatie hebben met het systeem, zoals het PDO Rekenen- in 2006 overgenomen door Boom test uitgevers te Amsterdam en worden daar onder (meestal) een andere naam doorontwikkeld (zie noot 2). Kijk voor meer informatie bij Boom test uitgevers.

Voor een actueel overzicht van de stand van zaken kunt u ook in dit blog kijken op De testen van Teije de Vos. U vindt daar tevens aangegeven welke testen/toetsen inmiddels door de Cotan zijn goedgekeurd.
Zodra de nieuwe wetgeving van kracht is, volgt er in dit blog een beschrijving van hoe een leerling- en onderwijsvolgsysteem kan worden ingericht dat voldoet aan die nieuwe wettelijke eisen (en aan de wensen van de onderwijsinspectie). 
Er zal blijken dat het met véél minder kan en dat het bijgevolg stukken eenvoudiger wordt! 

Noten 
1) Het computerprogramma op cd-rom werd ontwikkeld door QPeer en is als zodanig niet meer te koop, omdat de content inmiddels nagenoeg volledig is ondergebracht in bijna alle op de markt zijnde administratieprogramma’s.
De profielen op A3-formaat, waarmee een registratie te realiseren was, die thans door nog geen enkel computerprogramma is geëvenaard, waren nog lange tijd te koop bij uitgeverij Eduforce, maar ook die verkoop is inmiddels gestaakt. Wel worden bij Pearson nog DLE-LVS profielen verkocht bij de T.T.R., de N.T.R. (technisch) en de N.T.R. (toepassend).

2) De meeste uitgaven zijn niet meer te koop. De nummers 7 t/m 13 verschenen/verschijnen in de verbeterde reeks SchoolVaardigheidsToetsen bij Boom test uitgevers te Amsterdam en zijn allemaal goedgekeurd door de Cotan en toegelaten door de inspectie. Nummer 14 (het DLE BOEK) is nog steeds een 'bestseller'. 


3) Nummer 16 is vervangen door RIO ('Komt eruit wat erin zit?') en werd uitgegeven door Eduforce, thans verkrijgbaar bij meesterharrie.nl

4) Voor de opbrengstmeting (en het bepalen van het ontwikkelingsperspectief) maakt het systeem gebruik van een reeks aanlegtesten: Begintest, Vervolgtest (i.o.), Tussentest en Drempeltest, die respectievelijk worden afgenomen in de tweede helft van groep 2, in groep 4, in groep 6 en in groep 7/8.


Links


Afbeeldingen
(klik op de afbeelding voor een vergroting)






Schermafdrukken van het computerprogramma DLE-LVS





Voor de liefhebbers drukken we hieronder vier pagina's af uit de reeks 'SWP op maat' waarin een directeur (zou nu ook de IB-er kunnen zijn) z'n gedachten laat gaan over het ingevulde groepsprofiel van groep 6 (hierboven). Het moet opvallen dat slechts één enkel A3-formulier, dat door de school heen met de groep mee gaat, zo ontzettend veel informatie in één oogopslag kan bevatten. Daar kan nog steeds geen computerprogramma tegenop! Let ook eens op het minimum aan administratie dat het bijhouden van dit formulier vraagt. En bovendien: het kost geen stroom, doet het altijd en je hebt het altijd bij de hand ...
Voor IPMON moet u lezen DLE-LVS (zie 'De geschiedenis van de DLE's')

      

Met de zoekfunctie (bovenaan) in dit blog 
kunt u alle hier gebruikte termen verder verkennen.
In 'Begrippen en Regels' worden ze verklaard.