dinsdag 20 januari 2009

Hoe maak je een DLE-schaal? (verbeterd)



Op deze plek willen we kort aangeven
hoe een DLE-schaal tot stand komt.

En ... hoe dat beter kan.
(Klik op de afbeelding voor een vergroting)


Voor het maken van een DLE-schaal moet de maker beschikken over tenminste twee gemeten/berekende gemiddelden (eerder en later in de schoolloopbaan) op hetzelfde werk. De DLE-TESTen werken met minimaal drie gemiddelden: hetzelfde werk wordt tevens gemaakt door de ‘belendende groepen’. Zo kan het voorkomen dat de gemiddelde scores op een spellingtest voor groep 5, afgenomen in bijvoorbeeld april, op dat moment de volgende zijn: groep 4: 20, groep 5: 30 en groep 6: 40. De tussenliggende scores kunnen dan door middel van interpolatie gemakkelijk worden geschat: het loopt namelijk in dit uitzonderlijke (!) geval keurig met 1 punt per onderwijsmaand (DL) op.
Door middel van extrapolatie mogen we op basis van onze regels de schaal ook nog naar buiten (naar voren en naar achteren) toe verlengen.
REGEL: Dat mag echter niet verder dan met de helft van de geschatte trend tussen de twee berekende voorgaande gemiddelden.
In dit geval krijgen we dan de schaal zoals hierboven. In dit voorbeeld hebben we te maken met een gefractioneerde test (per leerjaar een stukje). Mooier is het, wanneer we cumulatieftesten kunnen maken, zoals de SchoolVaardigheidsToets Technisch Lezen. Daarbij lezen alle groepen dezelfde kaart, alleen elke volgende groep leest méér. We krijgen dan één lange DLE-schaal.
Het is niet verstandig zelf de schalen nóg verder te verlengen of anderszins aan de schalen te gaan ‘rommelen’.


Beter ...
Tot zo ver de tekst die tot voor kort werd gehanteerd. Onlangs heb ik enige nuancering aangebracht, die er toe moet leiden dat veel van de gesignaleerde 'problemen' zich niet meer voordoen.
Van een aantal testen en toetsen moet het gebruik namelijk worden ontraden, omdat ze verouderd zijn of omdat ze minder geschikt zijn voor 'DLE-gebruik'.
Afgezien van de leeftijd van de test (de test moet niet te oud zijn, niet ouder dan ca. tien jaar) zijn er twee soorten waarbij het maken van een DLE-schaal afgeraden moet worden:

1) Zoals bekend valt bij een test met één normeringspunt geen DLE-schaal te maken, maar een test met slechts twee normeringspunten, die in de tijd vrij dicht bij elkaar liggen (minder dan ca. vijf maanden), is niet goed bruikbaar. Wanneer er tussen die twee normeringspunten tenminste één leerjaar (tien maanden) zit, ontstaan er mogelijkheden, maar de inzet is dan wel beperkt. Eigenlijk zou een test minimaal drie meetpunten moeten hebben: in het leerjaar waarvoor de test bedoeld is en in het leerjaar ervóór en erna.
Zo is bij de SchoolVaardigheidsToets Begrijpend Lezen het werk voor groep 6 óók gemaakt door groep 5 en groep 7. Men kan dan –als de schaal niet naar onderen en naar boven wordt verlengd - tenminste twee leerjaren overzien. Het mooiste is natuurlijk bijvoorbeeld de SchoolVaardigheidsToets Technisch Lezen met normeringspunten in de groepen 3 t/m 8, maar in dat geval gaat het dan ook over één en dezelfde leeskaart, die opklimt in moeilijkheid.

2) Wanneer de test niet met tenminste één scorepunt per onderwijsmaand omhoog gaat, wordt de DLE-schaal wel erg glibberig: een punt meer of minder gescoord, scheelt meteen meerdere onderwijsmaanden in niveau. Eén scorepunt per maand is dus het absolute minimum, mooier is wanneer dat er een stuk of drie of meer zijn.

Verder valt er te discussiëren over het verlengen van de schalen (extrapoleren) met de heersende trend. Mag dat en zo ja tot hoever? Indertijd werd daarvoor de volgende regel gehanteerd: dat mag met niet meer dan de helft van de afstand tussen de uiterste twee normeringspunten. Men begeeft zich dan echter al op zeer glad ijs, omdat ook de DLE’s tussen de normeringspunten geschat zijn. Met de nieuwe regressietechnieken* is dat wel zo dicht mogelijk bij ‘de werkelijkheid’ gebeurd, maar toch, gemeten is het niet! Het is daarom beter het niet te doen. Toch zijn er gevallen waarbij het voor indicatief gebruik zou kunnen, maar men moet dan heel goed weten wat men doet! Bovendien moet de schaal die men met (maximaal) een maand of drie verlengd, wel heel stevig en robuust zijn. Dus een schaal met minimaal drie meetpunten en een ‘scoreklim’ van minimaal één à twee punten per onderwijsmaand. In dat geval lijkt mij het verlengen van de schaal met maximaal drie maanden verantwoord, zeker wanneer de test/toets voor diagnostisch gebruik wordt ingezet (en niet voor verwijzing o.i.d.).

*) Bij de nieuwe Schoolvaardigheidstoetsen worden thans nieuwe (geautomatiseerde) regressietechnieken gebruikt, waardoor de toetsen (ook die van het Cito) in nagenoeg elke onderwijsmaand kunnen worden afgenomen.
Met die nieuwe regressietechnieken komen we er dankzij de vele meetpunten héél dichtbij. Bij de SkoalFeardigensToets Technysk Lêzen (Fries), doen we dat nòg beter: we hebben daar meetpunten om de vijf onderwijsmaanden i.p.v. om de tien. Bovendien verschijnen er thans toetsen met drie of meer meetpunten per leerjaar ... Elke maand meten zou natuurlijk ideaal zijn, maar dat is praktisch niet te doen. Bovendien zou het heel weinig meer toevoegen: veel minder onzeker wordt het niet.