Nasjonale prøver: Nye analyser er viktige

Det de nye analysene fra Frischsenteret viser, til forskjell fra de offisielle tallene, er at elevenes ferdigheter har vært i endring: De er blitt mye bedre i engelsk og litt svakere i regning og lesing, skriver innleggsforfatterne.

Utdanningsdirektoratet og Frischsenteret jobber begge for å finne de beste analysemetodene for nasjonale prøver. Forskjellene skyldes på ingen måte kun en simpel «regnefeil».

Publisert: 11.09.2023 20:00

I forrige uke omtalte Aftenposten hvordan forskere som analyserte tidsutviklingen i nasjonale prøver, kom til en annen konklusjon enn Utdanningsdirektoratets (Udir) offisielle tall.

Vi vil sammen forklare hva forskjellene består i.

Forskjellen gjelder først og fremst sammenligninger mellom elever som tok prøven i ulike år.

Også med dagens offisielle tall får altså elever, skoler og kommuner et godt bilde av hvordan de gjør det, sammenlignet med andre dette året.

Misvisende å omtale som simpel «regnefeil»

Det de nye analysene fra Frischsenteret viser, til forskjell fra de offisielle tallene, er at elevenes ferdigheter har vært i endring: De er blitt mye bedre i engelsk og litt svakere i regning og lesing.

En slik sammenkobling av prøver på tvers av år bruker statistiske modeller og et omfattende datamateriale. Når resultatene er ulike, er det derfor misvisende å omtale dette som en simpel «regnefeil».

Trolig – vi er nemlig ikke helt sikre ennå – skyldes forskjellene ulike valg av «innstillinger» i statistiske analyseverktøy.

Vi jobber for å få klarhet i årsaken til de ulike resultatene.

Ingen feil eller mangler å påpeke

Underveis i dette arbeidet har Frischsenteret delt analyser og midlertidige konklusjoner. Udir har delt data, resultater og estimeringer fra tidligere år.

Dette har vært en konstruktiv, men naturlig nok også krevende dialog.

Udir har ingen feil eller mangler å påpeke til analysene som nå er lagt frem av forskerne, men har også behov for å sette seg ytterligere inn i dette i samarbeid med egne kompetansemiljøer.

Fra Udirs side har dette vært en nyttig og verdifull hjelp i en prosess vi påbegynte våren 2022 med å revidere analysearbeidet som gjøres på nasjonale prøver.

Dette betyr også at problemene som nå er avdekket, ikke berører årets elever, siden analysemetodene uansett er endret.

Udir ønsker å berømme Frischsenterets forskere og alle som fatter interesse for analyser av disse prøvene. I den sammenhengen er det verdt å påpeke at Udirs debattinnlegg med tittelen «Spekulativt om nasjonale prøver» (Aftenposten 7. september) ikke var ment som en kritikk av forskerne. Den ble sendt inn med tittelen «Spekulativt fra Aftenposten om nasjonale prøver», med henvisning til Aftenpostens fremstilling av saken.

Statistikk på en annen måte

De siste ti årene har det skjedd en gradvis dreining i retning av mer åpenhet både i forskning og statistikkproduksjon.

Det er nok mange årsaker til dette: Ny programvare med åpen kildekode, høyere kompetanse rundt koding og økte krav til gjennomsiktighet og reproduserbarhet både fra forskningstidsskrifter og i en mer kritisk offentlighet.

I praksis gjør dette at nye analyser, som den forskerne her har gjort av nasjonale prøver, lar seg dele, dokumentere og etterprøve. Slik er det ofte ikke med analyser fra fortiden, som beregningene av skalapoeng i nasjonale prøver fra 2014 til 2021.

I fremtiden vil Udir lage statistikk for skalapoeng på en annen måte, med bruk av et åpent tilgjengelig analyseprogram og kode som fritt kan deles. Det metodiske rammeverket her vil være det samme som forskerne ved Frischsenteret og CEMO (Senter for pedagogiske målinger) har brukt.