Analysstöd för ombedömningen av nationella prov
Transcription
Analysstöd för ombedömningen av nationella prov
2015-02-06 1 (12) Analysstöd för Skolinspektionens ombedömning av nationella prov Inledning Uppdraget Prov och delprov som ingått i omrättningen av prov skrivna VT 2014 2 2 2 Genomförandet av ombedömningen Urval av skolor Urval av elevlösningar Urval av delprov för ombedömning Genomförandet av ombedömningen 4 4 5 5 6 Att tolka Prickning Tolka resultaten med försiktighet Teknisk not: Beräkning av avvikelsegrad mellan skolans bedömning och ombedömningen 6 6 6 9 Insamling av uppgifter 10 Rapporter och utredningar 11 Styrdokument 11 Skolinspektionen, Box 23069, 104 35 Stockholm, Besök: Sveavägen 159 Telefon: 08-586 080 00, Fax: 08-586 080 10 www.skolinspektionen.se 2015-02-06 2 (12) Inledning Skolinspektionen samlar varje år in ett stort antal bedömda elevlösningar på utvalda delprov från de nationella proven. Proven avidentifieras och bedöms sedan på nytt av erfarna lärare som rekryterats av Skolinspektionen. Syftet med ombedömningen är att främja en likvärdig bedömning av proven, och resultaten är ett av underlagen som Skolinspektionen granskar inför tillsyn av skolor och huvudmän. Urvalet av skolor för ombedömning sker därför bland de huvudmän som det följande året ingår i Skolinspektionens regelbundna tillsyn. Syftet med ombedömningen är inte att uttala sig om enskilda provbetyg. Ombedömningen kan aldrig leda till att ett provbetyg som satts av skolan ändras. Att en skolas bedömning av proven skiljer sig från genomsnittet betyder heller inte att skolans bedömningar är felaktiga. Olika bedömare tolkar provens bedömningsanvisningar olika, och de delprov som väljs ut för ombedömning är till stor del sådana där det inte finns tydliga ”rätt och fel svar” på frågorna. En hög avvikelsegrad i förhållande till andra skolor kan dock vara en indikation på att skolan behöver utveckla sina processer för bedömning och betygssättning. Det är alltid processen som leder fram till resultatet som granskas i Skolinspektionens tillsyn, inte resultaten/provbetygen i sig. Resultaten bör även ligga till grund för en diskussion hos skolor och huvudmän där processerna för bedömning och betygssättning diskuteras, till exempel inom ramen för det systematiska kvalitetsabetet. Frågor som kan diskuteras i ett sådant arbete är till exempel om resultaten känns väntade eller oväntade, vad som kan tänkas ligga bakom dem, och om det finns några lärdomar att dra utifrån resultaten i utvecklingen av skolans processer för bedömning och betygssättning. Diskussionen kring resultaten blir ofta som mest värdefull om flera olika skolor, gärna med olika huvudmän, arbetar tillsammans. Uppdraget Uppdraget att samla in och ombedöma nationella prov anges i Skolinspektionens regleringsbrev. Där anges också att syftet är att stödja en likvärdig bedömning och betygssättning av proven över landet, samt att insamling och åtgärder ska kopplas till myndighetens tillsynsverksamhet. Myndighetens regleringsbrev i sin helhet återfinns på adressen nedan: http://www.esv.se/Verktyg--stod/Statsliggaren/Regleringsbrev/?RBID=16043 Prov och delprov som ingått i omrättningen av prov skrivna VT 2014 SKOLINSPEKTIONEN 2015-02-06 3 (12) För mer information om utformningen av respektive delprov, se analysstödet för resultaten på nationella kursprov. Årskurs/Skolform Ämne/Kurs Delprov Version Grundskolans Årskurs 6 Svenska/Svenska som andraspråk C1 och C2 (samredovisas) 2014 Engelska C 2014 Matematik D 2014 Biologi A 2014 Kemi A 2014 Fysik A 2014 Samhällskunskap A1 och A2 (samredovisas) 2014 Religionskunskap B1 och B2 (samredovisas) 2014 Historia B 2014 Geografi B 2014 Svenska/Svenska som andraspråk B och C (endast C redovisas) 2014 Engelska C 2014 Matematik D 2014 Biologi A2 2014 Kemi A2 2014 Fysik A2 2014 Samhällskunskap B 2014 Religionskunskap B 2014 Historia A 2014 Grundskolans Årskurs 9 2015-02-06 4 (12) Gymnasieskolan Geografi A 2014 Svenska 1/Svenska som andraspråk 1 B och C (endast C redovisas) VT 2014 Engelska 5 C VT 2014 Matematik 1a D VT 2014 Matematik 1b D VT 2014 Matematik 1c D VT 2014 Under 2015 har dessutom en pilotstudie avseende ombedömning av nationella prov inom den kommunala vuxenutbildningen på gymnasienivå genomförts. De ombedömda proven genomfördes vid skolorna under höstterminen 2013. Årskurs/Skolform Ämne/Kurs Delprov Version Kommunal vuxenutbildning på gymnasienivå Svenska 1/Svenska som andraspråk 1 B och C (endast C redovisas) HT 2013 Engelska 5 C HT 2013 Matematik 1a D HT 2013 Matematik 1b D HT 2013 Matematik 1c D HT 2013 Genomförandet av ombedömningen Urval av skolor Ombedömningen genomförs i dagsläget för de nationella prov som skrivs i årskurs 6 och årskurs 9, gymnasiets inledande kurser samt motsvarande kurser inom kommunal vuxenytbildning på gymnasial nivå. Alla skolor ingår inte i ombedömningen ett givet år, utan det görs ett slumpvis urval av skolor bland de huvudmän som det följande året ingår i Skolinspektionens regelbundna tillsyn. SKOLINSPEKTIONEN 2015-02-06 5 (12) Urval av elevlösningar För att kunna genomföra ombedömningen vid så många skolor som möjligt ombedöms endast ett eller två ämnen per skola, oftast ett språkämne och ett NO/SO-ämne eller matematik. När en skola valts ut till ombedömningen görs en slumpvis tilldelning av ämnen för ombedömning. Därefter görs ett slumpvis urval av elever bland dem som skrivit provet den aktuella terminen. Urvalet görs tillräckligt stort för att resultaten ska vara representativa på skolnivå. Max antal prov att skicka in har dock satts till 100 för grundskolor och 200 för gymnasieskolor. Om fler prov krävs för representativitet för två ämnen dras istället bara ett ämne för den aktuella skolan. Liksom vad gäller tillsynen i stort är urvalet liksom maxgränsen för antal prov baserat på skolenheter, så skolor som är uppdelade på flera enheter kan få en eller flera skolenheter utvalda för ombedömning. Urvalets representativitet avser det aktuella delprovet vid den aktuella provterminen, och kan inte generaliseras till att gälla andra versioner av provet (till exempel tidigare års prov), prov i andra ämnen, eller andra prov i samma ämne (till exempel skolans egna prov). Av olika skäl kan det också hända att alla prov som begärts in från en skola inte kan ombedömas. Särskilt om antalet ombedömda prov vid skolan är litet (under ca 30) kan även ett begränsat bortfall ha betydelse för urvalets representativitet, och det är därför viktigt att alltid tolka resultaten försiktigt. Urval av delprov för ombedömning Alla nationella prov är uppdelade i flera delprov. Vissa av delproven innehåller laborativa eller muntliga delar, eller uppgifter som ska genomföras i grupp. Denna typ av delprov är inte möjliga att ombedöma. Det är heller inte särskilt intressant att ombedöma delprov som mestadels består av frågor där eleven ska välja mellan ett antal fasta svarsalternativ, eftersom utrymmet för subjektivitet i bedömningen här är mycket litet och tidigare erfarenhet har visat att stora avvikelser är mycket sällsynta. Av dessa skäl ombedöms inte hela proven, utan endast ett eller två delprov per prov. De delprov som väljs ut för ombedömning är sådana som kan ombedömas (dvs som inte har laborativa eller muntliga inslag etc), men där det inte finns tydliga ”rätt och fel svar” på uppgifterna. I praktiken betyder det att prov som till stor del består av uppsatsfrågor där eleven ska formulera sig fritt i skrift utifrån en öppen frågeställning är de som väljs ut för ombedömning. För vissa ämnen, till exempel matematik, finns inga sådana delprov. Då väljs istället det delprov som för det givna ämnet kan antas ha störst utrymme för subjektivitet i bedömningen. 2015-02-06 6 (12) Genomförandet av ombedömningen De skolor som väljs ut att delta i ombedömningen skickar in kopior av bedömda prov till Skolinspektionen. Lärarens betyg och anteckningar samt uppgifter om elevens identitet tas bort. Därefter bedöms proven på nytt av erfarna lärare som rekryterats av Skolinspektionen. Ursprungsbedömningen jämförs sedan med ombedömarens bedömning, och resultaten sammanställs per skola och ämne. Ombedömarna bedömer sina prov enskilt, det vill säga sambedömning tillämpas inte. Däremot sprids varje enskilds skolas elevlösningar över flera ombedömare, för att minimera risken att en enskild ombedömares bedömningar får stort genomslag i de sammantagna resultaten, så att jämförelsen av resultat mellan skolor blir så rättvis som möjligt. Beroende på ämne och årskurs fördelas proven mellan ca 3 till 30 olika ombedömare. Undantag är Svenska som andraspråk samt prov skrivna inom vuxenutbildningen, som endast har 1-3 ombedömare per delprov (gäller 2014 års ombedömning). För svenska och engelska finns en särskild kontroll som innebär att om det skiljer mer än två betygssteg mellan bedömning och ombedömning, alternativt om ursprungsbedömaren ger godkänt betyg (A-E) men inte ombedömaren eller vice versa, så går provet vidare till en andra ombedömare. Slutbetyget från ombedömningen blir då den av de två ombedömarnas bedömningar som ligger närmast ursprungsbedömningen. Att tolka Skillnaden mellan skolans och ombedömarnas bedömning av elevlösningarna rapporteras som skolrapporter per skolenhet (en rapport per ombedömt delprov), samt som sammanställning på huvudmannanivå. För de prov som genomfördes vid skolorna under vårterminen 2014 redovisas resultaten under 2015 i två separata omgångar. I början av året publiceras resultaten för de skolor som ingår i Skolinspektionens tillsynsplan för vårterminen 2015, och i mitten av året publiceras resultaten för de skolor som ingår i tillsynsplanen för höstterminen 2015. Prickning Inga resultat för en skolenhet rapporteras om antalet ombedömda elevlösningar för aktuellt delprov understiger 10 stycken vid skolenheten, eller om färre än hälften av de prov som skrevs vid skolenheten för det aktuella delprovet och terminen har ombedömts. Tolka resultaten med försiktighet SKOLINSPEKTIONEN 2015-02-06 7 (12) Att en skolas bedömning av proven skiljer sig från genomsnittet betyder inte att skolans bedömningar är felaktiga. Olika bedömare tolkar provens bedömningsanvisningar olika, och de delprov som väljs ut för ombedömning är till stor del sådana där det inte finns tydliga ”rätt och fel svar” på uppgifterna. Antalet prov och skolor som ombedömts för ett enskilt ämne varierar också, och är ibland lågt. Därför är det alltid viktigt att tolka resultaten försiktigt, som utgångspunkt för en diskussion. En hög avvikelsegrad kan dock vara en indikation på att skolan behöver utveckla sina processer för bedömning och betygssättning. Det är alltid processen som leder fram till resultatet som granskas i Skolinspektionens tillsyn, inte resultaten/provbetygen i sig. Skolrapport Tabell 1: Andel stora avvikelser mellan skolans bedömning och ombedömningen I Tabell 1 redovisas antalet och andelen stora avvikelser mellan skolans och ombedömarnas bedömning av de insamlade elevlösningarna. En stor skillnad definieras som att det skiljer två betygssteg eller mer mellan de två bedömningarna, alternativt ett betydande antal belägg (poäng) för de delprov där delprovsbetyg inte sätts 1. Exempelvis gav skolan A där ombedömaren gav C, eller B där ombedömaren gav E osv. Skolans avvikelsegrad jämförs med den genomsnittliga avvikelsegraden för alla ombedömda skolor för det aktuella delprovet och terminen. Det är just jämförelsen med genomsnittet som är intressant ur likvärdighetssynpunkt, inte andelen avvikelser mellan skolans bedömning och ombedömningen som sådan. Observera att avvikelsegraden inte är jämförbar mellan olika ämnen och delprov, eftersom proven är konstruerade på olika sätt. Observera också att ombedömningen avser ett av provets delprov, inte hela provet. Om skolans andel stora avvikelser i någon riktning skiljer sig markant från genomsnittet (+/- 10 procentenheter skillnad eller mer) markeras detta med en stjärna (*) efter skolans andel. Markeringen är ett stöd för att göra det lättare att se större skillnader. Jämförelsen med genomsnittet är det viktiga Det är viktigt att fokusera på jämförelsen med genomsnittet när resultaten tolkas. Det är denna skillnad som är intressant, inte andelen avvikelser i sig. Om- Se ”Teknisk not: Beräkning av avvikelsegrad mellan skolans bedömning och ombedömningen” nedan. 1 2015-02-06 8 (12) bedömningens syfte är att stödja likvärdighet i bedömningen. Det betyder att målsättningen är att olika skolor i så hög utsträckning som möjligt ska lägga ribban på samma nivå när proven bedöms. De delprov som väljs ut för ombedömning är sådana där det alltid kommer att förekomma ett mått av subjektivitet i bedömningen (oftast består de av långa fritextsvar). Skolinspektionens ombedömare har stor erfarenhet av att bedöma prov inom sitt ämne, men det går inte att säga att det är just de som gör ”rätt bedömning” av proven. Därför använder inte Skolinspektionen resultaten för att jämföra skolans bedömningar med ombedömarnas bedömning som sådan, utan för att jämföra skolorna med varandra. En likvärdig bedömning av proven innebär ju att alla skolor bör tolka och tillämpa bedömningsanvisningarna på ett likvärdigt sätt. Till exempel: om en skola i 20 % fallen sätter högre delprovsbetyg än ombedömarna, och den genomsnittliga andelen avvikelser i denna riktning också är 20 %, så finns det ingen indikation på att skolan ifråga sätter högre provbetyg än genomsnittskolan. Att denna genomsnittsnivå är innebär högre provbetyg i snitt än vad som är fallet i ombedömningen är ur likvärdighetssynpunkt mindre intressant. Om det däremot är så att en skola i 20 % fallen sätter högre delprovsbetyg än ombedömarna, och den genomsnittliga andelen avvikelser i denna riktning bara är 5 %, så är det en indikation på att skolan ifråga tenderar att sätta högre delprovsbetyg än genomsnittsskolan för en given nivå på elevens prestation. Hur många skolor som ombedömts varierar per ämne och årskurs. För delprov där färre än 10 skolor ombedömts bör resultaten tolkas med extra försiktighet, eftersom genomsnittsvärdet då bygger på ett litet antal skolor som kanske inte är representativt för skolor i allmänhet. Tabell 2: Medelavvikelse från ombedömningen i förhållande till andra skolor Medan tabell 1 endast redovisar större avvikelser mellan skolans och ombedömarnas bedömning, tar tabell 2 hänsyn till alla avvikelser och räknar ut ett medelvärde av dessa. Skolorna rangordnas sedan efter denna genomsnittsavvikelse. Om en skola hamnar på plats 1 av 20 betyder det att skolan bland de 20 skolor som fått det aktuella delprovet ombedömt är den som i genomsnitt sätter de högsta delprovsbetygen/ger flest belägg (poäng) i förhållande till ombedömarna. På motsvarande sätt betyder plats 20 av 20 att skolan sätter de lägsta delprovsbetygen i förhållande till ombedömarna, av de skolor som ombedömts. SKOLINSPEKTIONEN 2015-02-06 9 (12) En hög eller låg rangordning i tabell 2 motsvaras ofta, men inte alltid, av en hög andel stora avvikelser i tabell 1. Vissa delprov är dock sådana att stora avvikelser är mycket ovanligt. I dessa fall kan en skola hamna högt eller lågt i rankingen i tabell 2 även utan att ha en hög andel stora avvikelser. I det fall en skola har en hög eller låg rank enligt tabell 2, men inte en ovanligt hög andel stora avvikelser enligt tabell 1, betyder det att det aktuella delprovet är sådant att stora avvikelser mellan två bedömare är ovanliga. Det kan till exempel röra sig om delprov som inte är renodlade uppsatsprov utan innehåller en blandning av kortare fritextsvar och frågor med fasta svarsalternativ. Resultatet i tabell 2 kan då fortfarande utgöra värdefull information till den enskilda skolan/bedömaren, till exempel som analysunderlag i det systematiska kvalitetsarbetet. När Skolinspektionen analyserar resultaten inför tillsyn av skolor och huvudmän ligger dock fokus på andelen stora avvikelser enligt tabell 1. Tabell 3: Frågor om bedömningen I samband med att skolan sänder in prov för ombedömning besvaras även ett antal frågor om hur bedömningsprocessen sett ut för dessa prov. Svaren redovisas i tabell 3. Frågorna om bedömningsprocessen är frivilliga för skolorna att besvara, och samtycke måste ges för att de ska inkluderas i redovisningen. Därför kan antalet prov i tabell 3 skilja sig från det antal som redovisas i tabell 1. Skolenhetens svar jämförs med ett genomsnitt för aktuellt delprov och termin, men det finns inga markeringar för stora skillnader. Svaren ger information om skolans process för bedömning av de nationella proven som kan vara intressant när resultaten analyseras. Rapport för huvudman Huvudmannarapporterna redovisar vilka av huvudmannens skolor som ingått i ombedömningen för den aktuella redovisningsterminen, vilka delprov som ombedömts per skola och hur många. Utöver det framgår om någon av skolorna har resultat som skiljer sig från genomsnittet i någon riktning, baserat på andelen avvikelser enligt tabell 1. Huvudmannarapporten ger alltså endast en översiktlig sammanställning. De detaljerade resultaten återfinns i skolrapporterna för respektive enskild skola. Teknisk not: Beräkning av avvikelsegrad mellan skolans bedömning och ombedömningen För de delprov där ett delprovsbetyg A-F sätts definieras en ”betydande avvikelse” enligt skolrapporternas tabell 1 som att det skiljer två betygssteg eller mer mellan skolans bedömning och ombedömningen. 2015-02-06 10 (12) När den genomsnittliga avvikelsegraden som ligger till grund för tabell 2 räknas ut för dessa prov omvandlas först delprovsbetygen till en numerisk skala 020 med samma antal steg mellan boksavsbetygen: F=0, E=4, D=8, C=12, B=16, A=20. Sedan subtraheras värdet från skolans bedömning med värdet från ombedömningen för att uttrycka avvikelsegraden. Ett fall där skolan satt A och ombedömaren C redovisas alltså som ”8”. Om ombedömaren satt A och skolan B blir skillnaden ”-4”. Negativa värden indikerar alltså att skolan satt ett lägre delprovsbetyg än ombedömaren. Genomsnittsavvikelsen för en skola är medelvärdet av dessa differenser för alla elevlösningar som ombedömts. För de delprov där delprovsbetyg inte sätts omvandlas i stället antalet belägg (poäng) på E- C- respektive A-nivå till skalan 0-20 enligt följande modell: ((E*10 + C*15 + A*20) / (max(E)*10 + max(C)*15 + max(A)*20)) * 20 Där E, C respektive A står för det antal belägg som skolan respektive ombedömaren angivit för delprovet, och max(E), max (C) respektive max(A) står för det maximala antal belägg som kan uppnås för det aktuella delprovet. Resultatet av denna beräkning är att även de bedömningar som yttrycks i belägg kan standardiseras till ett enskilt indexvärde på skalan 0-20. På samma sätt som för delproven med bokstavbetyg uttrycks därefter avvikelsegraden som ”skolans bedömning minus ombedömingen”. En avvikelse på 6 eller mer mellan de båda standardiserade bedömningarna definieras som en ”betydande avvikelse” enligt vad som redovisas i skolrapportens tabell 1. Eftersom ett enskilt belägg får olika stor vikt i beräkningen dels beroende på det totala antalet belägg som kan uppnås, dels beroende på om det är ett E-, Celler A-belägg, så går det inte att ge en enskild siffra för hur många belägg som krävs för att skillnaden mellan bedömningarna ska räknas som betydande, det varierar från prov till prov. För ett hypotetiskt delprov med 3 möjliga belägg på respektive nivå är till exempel en skillnad på 1 C-belägg och 2 A-belägg i bedömning (3,3,3 vs 3,2,1) tillräckligt för att skillnaden ska räknas som betydande. För ett delprov med 10 möjliga belägg på respektive nivå krävs fler beläggs skillnad mellan de två bedömningarna, till exempel 2 belägg på E-nivå, 3 på C-nivå och 4 på A-nivå, för att skillnaden ska räknas som betydande. Insamling av uppgifter Papperskopior av bedömda elevlösningar samt kompletterande information om bedömning och bedömningsprocess samlas in från skolorna på begäran av Skolinspektionen. Urval av elevlösningar och begäran om prov hanteras av SKOLINSPEKTIONEN 2015-02-06 11 (12) Statistiska Centralbyrån (SCB), på uppdrag av Skolinspektionen. Uppgiftslämnare är rektor vid de skolor som ingått i urvalet. För uppdraget samlas uppgifter även in från registret över provebetyg på nationella kursprov som sammanställs av Statistiska Centralbyrån (SCB) på uppdrag av Skolverket. Inga resultat för en skolenhet rapporteras om antalet ombedömda elevlösningar för aktuellt delprov understiger 10 stycken vid skolenheten, eller om färre än hälften av de prov som skrevs vid skolenheten för det aktuella delprovet och terminen har ombedömts. Anledningen till att ombedömningsresultat saknas kan vara att vissa elever inte genomfört provet, att bristfällig kopiering eller scanning av prov gjort att delprovet inte kunnat omrättas i sin helhet, att skolan inkommit för sent med de begärda elevlösningarna, att resultatet från skolans bedömning inte angetts på giltigt format, att elevlösningar inte kunnat återfinnas av skolan mm. På grund av betydande bortfall i vissa fall bör uppgifterna tolkas med försiktighet. Om elevlösningarna i bortfallet har andra egenskaper än elevlösningarna i svarspopulationen, till exempel en högre eller lägre bedömaröverensstämmelse än vad som är fallet för de elevlösningar som kunnat omrättas, har bortfallet en snedvridande effekt på resultaten. Rapporter och utredningar Rapporter och utredningar kring tidigare års ombedömningar (”omrättning”) av nationella prov återfinns genom sökning på publikationstypen ”Ombedömning av nationella prov” i Skolinspektionens sökfunktion för publikationer: http://www.Skolinspektionen.se/sv/Beslut-och-rapporter/Publikationer/# Mer information finns även på Skolinspektionens webplats om ombedömningen: http://www.Skolinspektionen.se/ombedomning Styrdokument Uppdraget att ombedöma nationella prov anges i Skolinspektionens regleringsbrev. 2014 års ombedömning regleras av regleringsbrevet för 2014, som återfinns via nedanstående länk. http://www.esv.se/Verktyg--stod/Statsliggaren/Regleringsbrev/?RBID=16043 2015-02-06 12 (12) Skolinspektionen har rätt att begära in prov från skolorna enligt förordning (1992:1083) om viss uppgiftsskyldighet för huvudmännen inom skolväsendet med mera.