Generell testkunskap Reliabilitet

Transcription

Generell testkunskap
Reliabilitet
• Vad innebär reliabiliteten för ett test? Ange några olika mått.
Realibiliteten på ett test står för precision i mätinstrumenten - mätsäkerhet. Man eftersträvar hög
reliabilitet. Men denna bör inte bero på att man frågat samma saker om och om igen att man testat ett
ett mkt avgränsat område.
Hur mäter man reliabiliteten:
1. Test-retest. Samma personer med samma test vid två tillfällen. Korrelationen mellan resultaten
ger ett mått på reliabiliteten.
2. Parallellformer. Ett test konstrueras samtidigt som en parallell variant med samma
svårighetsgrad, eller innebörd, och samma personer testas med dessa tester varefter korrelationen
beräknas. Ovanlig metod.
3. Intern konsistens (Consistency borde översättas konsekvens). Denna form har att göra med i
vilken utsträckning alla uppgifter mäter samma egenskap. Split half – delar testet i två likvärdiga
halvor och korrelerar resultatet. Vid denna metod minskar reliabiliteten hos kortare test varför man
måste förlänga med 2 för att uppskatta hela testets reliabilitet. Alphakoefficienten är ett annat sätt att
undersöka reliabiliteten där man kollar sambandet mellan de item som ingår i en skala. I vissa tester
kan det dock vara bra att ha lågt alpha eftersom man har behov att mäta oberoende items för att
fånga en komplex verklighet.
Ju fler metoder som används för reliabilitetsmätning desto bättre.
• Vad innebär test-re-test reliabilitet?
En använd metod heter Test-Retest och innebär att man istället för att göra ett nytt test, gör om
samma test vid två olika tillfällen. Test-Retest mäter reliabiliteten genom att korrelera resultaten från
testet vid tillfälle 1 med resultaten från testet vid tillfälle 2. Detta förutsätter att man under de två
testen gör mätningarna på samma individer. Test-Retest sägs mäta ett tests stabilitet, dvs
reliabiliteten över tid.
Problemet blir, om de två testningarna görs med kort mellanrum, att den testade helt enkelt minns
sina svar från första testomgången. Resultaten från de olika omgångarna blir i detta fall väldigt lika
och man får en hög korrelation mellan testningarna. Reliabiliteten riskerar på detta sätt att
överskattas.
Om däremot lång tid löper mellan testningarna, kan andra faktorer som ålder, utbildning och mognad
påverka att resultaten skiljer sig åt vid testtillfälle 1 & 2. Reliabiliteten kan på detta sätt riskera att
underskattas. En testtagare som gör testet för andra gången kan i vissa fall tendera att få ett sämre
resultat pga lägre motivation att göra om samma test för andra gången.
Att hitta ett lagom långt tidsintervall mellan testtillfällena är önskvärt, men tyvärr lättare sagt än gjort.
• Vad innebär split-half reliabilitet?
Split Half metoden har fördelen att individen endast testas en gång. Här mäter man testets interna
konsistens, som syftar till att undersöka om uppgifterna är homogena eller inte, alltså om alla delar av
testet mäter samma begrepp. För att mäta reliabiliteten i ett test med hjälp av denna metod kommer
man att dela ett test i 2 för att få två delar att korrelera mot varandra. Vanligast är att dela upp testets
items i jämna och udda, men olika uppfattningar om hur indelningen ska ske förekommer. Individens
testpoäng från de två halvorna korreleras med varandra för att få ut reliabiliteten.
Reliabilitetskoefficienten blir en uppskattning av halva testets tillförlitlighet (reliabilitet). Denna
reliabilitet riskerar att underskattas eftersom man bara mäter på hälften av alla items. Ju större ett test
är (ju fler items det innehåller), desto mer växer reliabiliteten och tvärtom. Felen jämnar ut sig vid
många frågor, och tillförlitligheten växer ju fler frågor vi ställer om en viss egenskap. För att få en
realistisk bild av reliabilitet vid split half metoden förlänger man testet med 2, enligt Spearman-Browns
formel och får en uppskattad reliabilitetskoefficient för hela testet.
Fördelarna med split-half metoden är att man undkommer inlärningseffekter och krångel med två
testtillfällen. Nackdelen är att den inte går att användas vid testning där man har hastighet som
dominant faktor eftersom man i regel klarar de flesta frågor man gör ett försök på. Överskattning av
reliabiliteten blir här fallet.
• Vad ger alpha beräkningar för sorts reliabilitet?
Ett annat mått på den interna konsistensen är alpha beräkningar, som liksom KR är ett
sammanfattande korrelationsmått mellan samtliga items. Som andra test som mäter intern
konsistens, mäter även Alpha beräkningar i vilken utsträckning olika items i ett test faktiskt mäter
samma sak. Den ovan beskrivna KR metoden bygger på att testpersonen svarar antingen ”rätt” eller
”fel” på varje item. Men det finns många test som inte består av rätt/fel antingen/eller svar. Många
personlighetstest eller attitydsundersökningar består av flervalssvar som tex: alltid, ofta, ibland, sällan,
eller aldrig. Inget av svaren är rätt eller fel, utan man mäter på ett kontinuum mellan ”alltid” och
”aldrig”. Vid bedömning av intern konsistens hos test med flervalssvar på items, använder man alpha
beräkningar.
Alpha beräkningsformeln liknar KR-formeln till stor del, skillnaden är uppenbarligen just hur man gör
beräkningarna för varje item innan man sätter in dom i formeln. Annars är metoderna lika. Alpha
beräkningarna kan sägas vara lite mer generella då de kan tillämpas på både test med rätt/fel svar
och på test med flervalssvar, till skillnad från KR metoden.
• Vad innebär homogenitetsmetoden? (KR)
(Kuder-Richardsons metod, KR)?
Detta är också ett mått på intern konsistens och fokuserar på till viken grad uppgifterna i ett test
fungerar på likartat sätt och mäter samma egenskapsvariabel = testets homogenitet. Vid KR metoden
för beräkning av reliabilitet testas individerna endast vid ett tillfälle.
KR används vid dikotoma variabler i ett test, dvs. där svarsalternativen endast kan anta två olika
värden, tex. 0 & 1. KR kan tolkas som ett medelvärde av korrelationerna som skulle ha erhållits från
alla möjliga split-half reliabilitetsuppskattningar. Man delar alltså inte upp testet i enbart två delar, utan
gör beräkningar på alla potentiella items-kombinationer. Efter beräkningar får vi fram en KR
koefficient som ligger mellan 0 & 1 och som vanligt är värden närmare 1 mer reliabla. Det speciella
här är att det beräknade KR utgör en nedre gräns för testets reliabilitet, medan den sanna
reliabiliteten åtminstone är = KR, eller högre. Låga resultat på KR kan tyda på ett opålitligt, icke
reliabelt test men även på bristande homogenitet mellan items. Ett lågt KR värde säger alltså inte så
mkt alls eftersom reliabiliteten fortfarande kan vara mkt högre än det vi beräknat. Superhög KR
betyder i alla fall massa reliabilitet och även bra homogenitet. KR-skattningen återspeglar alltså både
pålitlighet och homogenitet, och oftast vill vi ju ha både och.
Korrelationskofficient.
KR metoden förutsätter att samtliga uppgifter i testet mäter samma egenskaper och är känslig för
brister i homogeniteten i ett test. Man bör alltså väga in hur testet är sammansatt innan man ger sig
på att bedöma reliabiliteten med denna metod.
Titta huruvida populationen som använts är representativ för de personer man själv vill testa.
Vid uträkning beräknar man proportionen som hade rätt (p-värde) respektive fel (q-värde) på varje
item och multiplicerar ihop dessa till ett pq för varje item. I nästa steg summerar man alla pq. Dessa
siffror pluttas in i formeln tillsammans m uppgifter om antal items i testet och den totala variansen.
Formeln finns tex. i Fhanér s79 men det blir lite överkurs ju.
Validitet
• Beskriv begrepps- och prediktiv validitet, likheter och skillnader.
• Vad innebär begreppsvaliditet?
Begreppsvaliditet blir aktuellt då det INTE är ett väl avgränsat och tydligt kriterium man vill mäta. Det
är istället ett abstrakt psykologiskt begrepp/en psykologisk egenskap, som man tror finns och kan
mätas, som man vill mäta (t.ex. allmän begåvning, psykisk balans). Ett test har god begreppsvaliditet
om det mäter just det abstrakta begrepp som man har för avsikt att mäta med testet. Eller med andra
ord: När testet lyckas fånga det abstrakta begreppet i hög grad!
• Vilka metoder kan man använda för att uppskatta ett tests
begreppsvaliditet?
Begreppsvaliditeten i ett test kan uppskattas genom korrelationsundersökning mellan t.ex. en persons
testresultat på det aktuella testet och samma persons testresultat på andra redan etablerade test.
Begreppsvaliditeten kan även uppskattas genom korrelation mellan testresultat och arbetsprestation
eller genom att testet korreleras med andra variabler som man redan vet har ett samband med den
abstrakta psykologiska egenskapen som man önskar mäta.
• Vad innebär prediktiv validitet?
Prediktiv validitet är en slags kriterierelaterad validitet (empirisk validitet). Kriterievaliditet är uppdelad i
prediktiv och samtidig validitet och handlar om hur väl ett test predicerar ett visst väl avgränsat och
tydligt kriterium. Vid samtidig validitet kan man göra mätningen av huruvida kriteriet uppfylls samtidigt
som testet utförs, men vid prediktiv validitet kan denna variabel bara mätas vid ett senare tillfälle, och
alltså först senare svara på hur väl testet verkligen förutsade ett visst kriterium. Prediktiv validitet
anses förövrigt vara en av de mest intressanta aspekterna av validitet.
Titta på vad testet är korrelerat mot. Korrelerat mot andra test som visat sig predicera väl?
Om storleken på stickprovet är tillräckligt.
• Ett problem med barntest gäller den s.k. prediktiva validiteten. Ge
exempel på hur det visar sig, och resonera kring varför den
prediktiva validiteten ofta är låg.
Den här frågan var lite lurig tycker jag, för som jag förstår det så likställer Smedler prediktiv validitet
med samtidig. Men ni kanske inte ska lite helt blint på det här svaret, men här kommer ett försök iaf.
Ett problem med att testa barn och tolka dess resultat är att barn påverkas mycket mer än vuxna av
kontexten i testsituationen. Om då resultaten inte blir helt tillförlitliga så är det också svårt att få någon
prediktiv validitet. Smedler skriver också att det inte är bra om den prediktiva validiteten är för hög.
Om man t.ex. använder skolbetyd som ett uttryck för ett intelligenstests prediktiva validitet är en
korrelation på 0.8 för hög, för då kanske det helt enkelt är så att intelligenstestet mäter skolfärdigheter
och inte är ett mått på intelligens. Det är då bättre om korrelationen ligger på runt 0.5, för då förklarar
den uppmätta intelligensen 25 % av variansen, och då finns det andra faktorer som kan ha påverkar
skolprestationen. Men även här kan man inte helt klart veta att testet verkligen mätte intelligens, det
kan mäta andra saker som har ett samband med skolprestationer, som t.ex. uppmärksamhet och
motivation. Jag förstår inte riktigt hur det här skiljer sig från när man testar vuxna, men det kanske ni
gör?
Jag tänkte maila Örjan om den här frågan och fråga honom också, så ni får hålla till godo med det här
svaret så länge så mailar jag mer sen!
Barn påverkas mer än vuxna av kontexten i testsituationen, exempelvis instruktioner och testrum.
Om resultaten inte är tillförlitliga minskar den prediktiva validiteten. Smedler skriver också att det inte
är bra om den prediktiva validiteten är för hög. Om man t.ex. använder skolbetyg som ett uttryck för
ett intelligenstests prediktiva validitet är en korrelation på 0.8 för hög, för då kanske det helt enkelt är
så att intelligenstestet mäter skolfärdigheter och inte är ett mått på intelligens. Det är då bättre om
korrelationen ligger på runt 0.5, då finns det andra faktorer som kan ha påverkar skolprestationen.
Men även här kan man inte helt klart veta att testet verkligen mätte intelligens, det kan mäta andra
saker som har ett samband med skolprestationer, som t.ex. uppmärksamhet och motivation.
Egna tankar om prediktiv validitet: möjligtvis kan också åldern och barns snabba utveckling
påverka. Barnen går snabbt igenom olika utvecklingsfaser vilket gör det svårt att hitta bra
normgrupper som grund för förutsägelsen.
• Vilka metoder kan man använda för att uppskatta ett tests
Ett barn som har svårt med vissa testdelar kan dessutom ha perfekt förståelse ett halvår senare,
vilket också borde påverka predikationen.
När man skapar eller standardiserar ett test:
Om frågor väljs utifrån kronologisk ålder, ex 3 år, kan utvecklingsnivån helt naturligt skilja mycket
mellan två barn, vilket borde vara ett exempel på svårigheten att förutsäga barns utveckling.
prediktiva validitet?
Prognostisk validering: följa upp ex. ett verkligt urvalsförfarande för att se hur det gick.
Samtidig validering: att ex. testa ett antal redan anställda för att få fram kriteriedata och
validitetsmått på studs.
När man ska använda ett test:
Sammanfattningsvis blir det känsligt att utgå från kronologisk ålder när barnen är små och genomgår
snabba förändringar.
• Vad innebär egentligen face-validitet?
Att frågorna i ett test förefaller relevanta för den egenskap som ska mätas. Face-validitet har inget
psykometriskt värde. Graden av face-validitet påverkar motivationen hos den som testas.
• Vilka validitetsuppgifter vill du finna i en manual för ett urvalstest?
• Beskriv kortfattat och i allmänna termer de generella principerna
för användning av faktoranalys vid konstruktion av ett
personlighetstest. Beskriv fördelar och begränsningar.
Face-validitet – är testets innehåll relevant för den typ vi söker.
Vid faktoranalys börjar analytikerna med en stor mängd data där de sedan analyserar korrelationerna
mellan olika items eller test, för att hitta ett mindre antal faktorer som inte är korrelerade och som står
för så stor del av variationen i data som möjligt. Man kan använda sig av faktoranalys för att på detta
vis empiriskt få fram de grundläggande dimensionerna av personligheten.
Diskriminerar testet – får vi värden i resultatet som kan jämföras – alltså hur ser svarsalternativ och
poängsättning ut.
Fördelar med faktoranalys är bland annat att man kan reducera stora mängder data till ett antal,
färre, faktorer som antas beskriva de viktigaste dragen i personligheten.
Population – är den relevant utifrån de personer vi söker.
Den kritik som faktoranalys har fått handlar bland annat om att man anser att faktoranalys fokuserar
på samvariation av variabler på bekostnad av den unika variansen, och att man på detta vis kan
missa viktiga faktorer när man bara klumpar ihop data. Det finns heller inga definitioner eller regler för
hur man ska benämna faktorer som man råkar hitta. Om ett visst antal variabler samvarierar, hur kan
man veta vad de egentligen mäter? Om våghalsig, bestämd och utåtriktad samvarierar starkt, vilket
personlighetsdrag mäter dessa variabler egentligen tillsammans då? (psychological testing s 352 och
371)
Innehållsvaliditet – mäter testet det vi vill mäta.
Empirisk validitet (prediktiv validitet) – hur väl kan vi predicera.
Övergripande
• Vad finns det för samband mellan reliabilitet och validitet?
En god reliabilitet är förutsättningen för en god validitet. En god reliabilitet kan finnas utan en god
validitet. Hög face-validity krävs för reliabilitet.
• Vilken metod använder man om man vill beräkna ett tests stabilitet?
Jag frågade Johan om det här och han sa att det är ett mer övergripande mått som innefattar både
reliabilitet och validitet (så då kan man ju räkna upp massa av de metoderna om man vill). Han
pratade också mycket om huruvida ett test håller sig över tid och om det fungerar i olika
socioekonomiska grupper, yrkesgrupper osv. Alltså väldigt mycket samma som reliabilitet men som
sagt ett mer allmänt begrepp.
• Vad innebär Good report då det gäller att få de som testas att svara
sanningsenligt?
Jag har inte hittat detta begrepp annat än i Örjans handouts och därför blir svaret väldigt kort. Man
uppmanar helt enkelt försökspersonerna att svara sanningsenligt och ökar (förhoppningsvis)
motivationen att göra det genom att dessutom förklara vad resultaten ska användas till.
Faktoranalys
• Vad innebär explorativ faktoranalys?
(Med Örjans ord innebär en explorativ faktoranalys att man kokar en fond på en buljong – ngt litet
expanderar). Mer konkret menas att man söker hitta fler hypoteser/modeller utifrån ett antal faktorer.
Man söker en massa fakta för att skapa hypoteser, exempelvis kan jag tänka mig att Cattells 16faktorteori gjordes med denna metod.
• Vad innebär konfirmatorisk faktoranalys?
Vid denna typ av faktoranalys söker man konfirmera de hypoteser/modeller man redan har. Sker ofta
efter en explorativ faktoranalys, man har ett antal teorier och modeller om exempelvis personlighet
och söker genom faktoranalys hitta bekräftelse på dessa.
Faktoranalys börjar med en empirisk databas som består av interkorrelationer mellan ett stort antal
items eller test. Dessa interkorrelationer faktoranalyseras sedan för att hitta det minimum antal
faktorer som förklarar så mycket varians som möjligt i datan. Dessa etiketteras sedan genom att
fastställa vad de items som är relaterade till en specifik faktor har gemensamt (Kaplan, s. 352). Det
kan sammanfattas som en ”datareduktionsteknik” (Kaplan, sid. 89)
Vid konstruktion av personlighetstest kan man alltså använda sig av faktoranalys för att empiriskt
få fram de grundläggande dimensionerna av personligheten.
Faktoranalysens stora fördel är att den gör ohanterliga datamängder hanterbara.
Kritik: Vid faktoranalys grupperas items om de korrelerar, proceduren är generellt datoriserad
och eftersom fokus ligger på den gemensamma variansen finns det risk för att identifieringen av
källorna till den gemensamma variansen sker på bekostnad av den unika variansen och viktiga
faktorer kan således förbises. Det kan också uppstå problem när de slutgiltiga faktorerna ska
namnges. Det finns inga definitiva regler för hur faktorerna ska namnges. Således blir det en högst
subjektiv bestämning. Om exempelvis våghalsig, lättretad, bestämd och orädd delar gemensam
varians återstår processen att namnge den gemensamma faktorn. Det kan lätt bli godtyckligt (Kaplan,
sid 371).
• Beskriv kortfattat ett test där faktoranalys använts vid konstruktion
av testet.
Ref. Häftet testbeskrivningar, Kaplan s. 20, 367.
Ett bra expempel är Catells 16PF – Sixteen Personality Factor Questionnaire. 16PF utvecklades
genom en lexikalisk metod där engelskans alla adjektiv som kan användas om människor bearbetats
faktoranalytisk för att kategorisera dessa adjektiv. Syftet var att identifiera grundläggande
personlighetsdrag. 16PF var bland de första testen som utvecklades med faktoranalytiska tekniker.
Idag används används faktoranalys i utvecklingen eller valideringen av i stort sett alla större test.
Klassisk teori vs. Item response theory
• Vid innebär administrativ standardisering?
• Vad innebär ” Item response theory”?
För administrativ standardisering behöver man bara ta och se till att ha en uppsätnting anvisningar
avseende den administrativa testproceduren, dvs ha en manual, och se till att individer även vad
gäller andra avseenden testas under så lika förhållanden som möjligt. Detta för att säkerställa
reliabiliteten.
Det är en ny approach till test. Testpersonen definieras inte längre av summan av antal klarade items
utan av svårighetsnivån på de items som den klarar av att besvara korrekt. Testitem väljs baserat på
sannolikheten att varje item besvaras rätt eller fel, genom att matcha itemsvårighet mot
itemdiskriminabilitet. Man kan då urskilja inom vilken nivå som personen börjar få problem. Man utgår
från utförlig item-analys. Varje item får sin egen itemkarakteristik-kurva som beskriver sannolikheten
att få rätt givet kunskap/förmåge-nivån hos varje testtagare. Man kan då identifiera den itemnivå på
vilken personen börjar få problem och det blir möjligt att bedöma förmåga utan att utsätta
testpersonen för hela itemansamlingen. I konstrukktionen av test enl IRT tar man oftast hänsyn till
två dimensioner, svårighet och diskriminabilitet. (Ibland även en tredje för sannolikheten att de med
lägst förmåga kommer att svara rätt.) Itemsvårighet fås genom att beräkna andelen personer som
klarar itemen(84% = .84 i itemsvårighet även fast det egentligen borde heta itemlätthet).
Diskriminabilitet är hur bra personer som klarar itemen klarar sig på hela testet, dvs hur bra itemen är
på att skilja ut de som är bra vs dåliga på testet. Om ett IRT test anpassas till datoranvändning kan
varje testperson få ett individualiserat test där datorn känner av och fokuserar på den nivå där
personen har en 50% sannolikhet att klara frågorna. Förmågan blir då allra noggrannast utvärdera på
den nivå där den behöver bli det. Konventionella test, utformade efter klassisk testteori, har antingen
sitt största fokus(=flest items) på medelnivå, eller lika stort fokus(=lika många items) på alla nivåer.
Precisionen är i båda fallen mindre god för många(de som inte är medel) eller alla av de som testas.
Med IRT utformade datortest blir precisionen god och lika god för alla testade.
• Vid innebär teknisk standardisering?
Innebär att testet är utprövat för en viss population eller vissa populationer och att itemanalyser är
utförda. Testets mätsäkerhet (validitet/reliabilitet) är fastställd och testet är normerat.
• Vad innebär itemanalys?
Är ett generellt samlingsbegrepp för ett antal metoder som används för att utvärdera test-items. Är en
av de viktigaste aspekterna för testkonstruktion. De mest grundläggande metoderna går ut på att
analysera ”item difficulty” (antalet personer som får rätt på en viss item), samt ”item discriminability”
(huruvida en person som presterat väl på en item, även presterat bra på resten av testet).
• Vad innebär normering av ett test?
Normering är de åtgärder som direkt syftar till att möjliggöra för den som använder ett prov att jämföra
det enskilda resultatet med resultaten i en referensgrupp, det vill säga en normgrupp. I normeringen
ingår definition och urval av normgrupper, beräkning av medelvärde och standardavvikelse i
råpoängfördelningarna, överföring av råpoäng till standardskalor samt upprättade normtabeller. Man
ska alltså enkelt kunna relatera individers testresultat relativa värde till normgruppens resultat.
• Vad utmärker den klassiska testteorin?
• Vad är normgrupp/grupper i testsammanhang?
Klassisk testteori står mot IRT(Item Response Theory). Till skillnad från IRT så bedöms prestation
eller det man vill mäta med utgångspunkt från den totala råpoängen som erhålls vid testning.
Är ett representativt stickprov från den population testet är menat att användas till. Syftet med dessa
är att underlätta för testanvändaren att fastställa var individer eller grupper som testats ligger i
förhållande till det stora antalet tidigare testade.
Klassisk testteori bygger på antagandet om att en observerad provpoäng består av ett hypotetiskt
sant värde samt en felkomponent. Den moderna testteorin bygger på uppgifter och hur prestationen
på dessa är relaterad till den förmåga som mäts med hjälp av uppgiften(=IRT).
• Redogör för vilka aspekter av testgivningen som ska beaktas för att
Klassisk testterori antar att beteendedisposition (beteendevariabler som ska mätas) är konstant över
tid. Fluktuationer i mätningarna betraktas därför som fel, mätfel. I och med detta kan man räkna ut
inom vilket spann man troligen kan hitta det sanna värdet eftersom man kan räkna ut hur stort felet är
(med stor sannolikhet).
Två typer av standardisering nämns: teknisk och administrativ.
Standardisering och normering av test
• Vid innebär standardisering av ett test?
Att testet är tekniskt och administrativt standardiserat. Teknisk standardisering innebär att det är
utprovat för en viss population eller vissa populationer, att itemanalyser har gjorts, att mätsäkerheten
är fastställd och att testet är normerat. Utprovningen för en viss population på ett representativt
stickprov därur möjliggör att testresultat sedan kan jämföras mot denna standard. Stickprovets
resultat blir genom att medlevärde, varians(?) och standardavvikelse räknas ut en måttstock som
visar hur de senare testresultaten står sig gentemot den övriga populationen.
Vad allt det här betyder vet ni säkert bättre än jag eftersom det säkert har besvarats av nån av er.
en testning kan anses genomföras under standardiserade
förhållanden.
Administrativ standardisering
Innebär att individer testas under så snarlika förhållanden som möjligt, exempelvis avseende
instruktioner, miljö (lokal), tidpunkt (egna exempel). Denna standardisering av testproceduren samlas
ofta i särskilda anvisningar.
Teknisk standardisering
Fyra grundläggande aspekter bör vara specificerade: utprövat för en viss population, genomförda
itemanalyser, säkerställd mätsäkerhet (reliabilitet och validitet) och
normering av testet.
Källa: Frasses handout 1, s 7. Jag har sökt i övrig litt men har inte hittat något relevant.
Standardskalor och itemkonstruktion
undvika extrema svarskategorier, välja att hålla med påståendena eller vilja framstå som bättre än
dem är.
• Vad är en standardskala?
• Vad innebär normativ itemkonstruktion?
• Vilket medelvärde och standardavvikelse har Z-skalan?
Ref. Örjan Föreläsning 2, Mabon s. 249.
Z- skalan: Medelvärde: 0 Standardavvikelse: 1.
Wechsler skalan: Medelvärde 10 Standardavvikelse 3.
Normativ itemkonstruktion innebär att man skapar items som ger data i en normativ skala. Normativa
poäng från en individ kan jämföras mot en normgrupp för att se hur individen förhåller sig till gruppen.
Normativa items är alltså items som frågar efter något på en skala, i vilken grad eller utsträckning
något är på ett visst sätt. Ett exempel är items i BAI och BDI som undersöker i vilken grad man
upplever symtom på ångest respektive depression. Även enkla ja/nej-frågor ger normativa data.
Normativa items är relativt lätta att genomskåda om man vill förställa sina svar, detta kan kontrolleras
med lögnskalor som mäter i vilken grad man försöker försköna sina svar. Ett annat sätt att komma
ifrån förställningstendenser kan vara ipsativa items som t.ex frågar efter vilken av två olika
egenskaper som stämmer bäst. Nackdelen med ipsativa skalor är att de inte medger jämförelser
mellan individer.
• Vilket medelvärde och standardavvikelse har Stanine-skalan?
• Vad innebär ipsativ itemkonstruktion?
Stanine-skalan: Skalan går från 1 till 9 och är standardiserad så att den har ett medelvärde på 5och
en standardavvikelse på ungefär 2. (s 52 i Kaplan).
På en ipsativ skala kan man uttrycka val mellan alternativ som ligger på två olika skalor. Man väljer
alltså ett alternativ på bekostnad av det andra alternativet. Sedan kan man få fram en relation mellan
de svar som ligger på den ena skalan, och de som ligger på den andra.
• Vilket medelvärde och standardavvikelse har T-skalan?
T- skalan: Medelvärde: 50 Standardavvikelse: 10.
• Vilket medelvärde och standardavvikelse har IK-skalan?
IK- skalan: Medelvärde: 100 Standardavvikelse: 15.
• Vilket medelvärde och standardavvikelse har Wechsler-skalan?
• Vilket medelvärde och standardavvikelse har Sten-skalan?
Sten-skalan: Medelvärde 5,5 Standardavvikelse 2.
• Vad innebär Standard Error of Measurement (SEM)?
Om en student gör samma prov flera gånger (utan att hans kunskapsnivå ändras) så är det möjligt att
resultatet på provet ändå kommer att vara lite lägre eller högre än den poängen som exakt skulle
överensstämma med studentens kunskapsnivå.
Så denna skillnad mellan det aktuella testresultatet och det hypotetiska högsta eller lägsta resultatet
man skulle kunna få på samma test är Standard error of measurement.
Eller också om denna student faktiskt skulle göra flera test så skulle standardavvikelsen av
testresultaten bero på standard error of measurement.
Det går inte att göra interpersonella jämförelser med hjälp av ipsativa test. Med det menas att man
inte kan mäta individernas absoluta värde på någon skala. Varje person blir sin egen referensram.
(Kaplan, s 374)
• Ge ett exempel på ett test med ipsativ itemkonstruktion?
GPI; Gordons personality inventory. Anses vara kvasi-ipsativt, Örjan menar att det är varken
eller. Test makarna själva hävdar att det är både ipsativt och till viss del normativt, då vissa delar är
normerade. Detta trots att grejen med ipsativ konstruktion är att den ej går att normera. Läs gärna
mer om detta då det kan vara oklart. Men så vitt jag kan läsa mig till är detta test egentligen helt
ipsativt, enligt andra test makare.
Det kan även nämnas här att MBTI även det är lite ipsativt, men inte helt och att det inte
• Vad innebär Forced choice?
heller är normerat.
Forced Choice innebär att man skapar alternativ som svar på en fråga och genom detta tvingar
testpersonen att välja ett svar.
Gordons personlighetsinventorium (åtminstone kvasiipsativt)
• Vad innebär svarsskalan Likert?
Likertskalan är den skalan som oftast används i frågeformulär. När testpersonen svarar enligt
Likertskalan så ska han ta ställning till hur mycket han håller med om ett påstående. Till ex:
Strongly disagree, Disagree, Neither agree nor disagree, Agree, Strongly agree .
Denna skala mäter antingen positiva eller negativa svar på ett påstående.
Ibland används en fyrskala, vilket är ett forced choice alternativ eftersom mellan alternativet ”Neither
agree nor disagree” inte är tillgängligt. Det finns problem med Likertskalan, testpersoner kan vilja
Myers Briggs (vissa delar har ipsativ svarsskala).
Allmänna frågor kring test
• En väsentlig del i testkunskapen är att kunna administrera test på
ett professionellt sätt. Vad ska man som testgivare tänka på för att
testningen ska utföras på ett tillförlitligt sätt?
Att testmiljön är samma för alla testdeltagare

Man ska tänka på att vara på samma sätt mot alla testdeltagare, både innan och under
testet. Forskning har visat att testresultaten kan variera om testgivaren är positiv och
uppmuntrande eller om han/hon är negativ eller neutral.

Att verbala test är känsliga för språkkunskaper

Att testgivaren har tillräcklig erfarenhet och utbildning av testet

Man ska vara uppmärksam på förväntanseffekter, att man får de resultat man förväntar sig
att få

Att olika personer reagerar olika på testsituationen, ex tentaångest och andra inte presterar
på bästa sätt under tidspress.
tänkandet, det kan göra att man missar saker i testningen.
C) Ett tredje spår är hur testgivaren kan påverkas.




Örjans föreläsning 2 och Kaplan kap 7
Frågan berör administrativ standardisering, dvs att:

Anvisningarna är lika och tydliga

Individer testas under snarlika förhållanden
A) Kaplan tar upp några "fallgropar" att tänka på:






Relationen mellan examinatorn och den som testas: Vilken typ av feedback man ger
påverkar testresultatet. Uppmuntringar förbättrar poängen. Även rapporten man skriver kan
tolkas, så att resultatet påverkas.
Språkkunskaper: Om fp kan flera språk, bör testet ges på det språk fp kan bäst.
Skicklighet hos testaren: Försök visar att antalet misstag gick ner efter cirka 10
administreringar med WAIS-R. Misstag är ett avsteg från målet med lika förhållanden.
Förväntningseffekter: Kallas också Rosenthal effects. Test har visat att om testaren
förväntar sig bra resultat blir resultatet också bättre, och vise versa. Det verkar också gälla
att fp tycker responser från testare som de tror är intelligenta är bättre och tvärtom.
Kontrollerade förhållanden: Ter sig självklart. Test har visat att om barn får godis eller
pengar ändrar det förutsättningarna, beroende på vilken bakgrund barnen har.
Individuella variabler: Ex testångest, hormoniella effekter, (ex. menstruation), ålder,
medicinering etc. kan påverka resultatet. Detta kan var svårt att göra något åt, men ändå
kanske viktigt att ha i åtanke vid utvärderingen av resultatet.
B) Ett annat spår är datorer som administratörer. Det har visats att:






Datorer ger bra standardisering
Kan skräddarsys gentemot fp
Ger bra precision i tidtagning
"Mänskliga administratören" kan göra andra saker
Fp blir inte stressad (Vår föreläsare gav dock ex. på att vissa blir extra stressade av datorer,
men förblir lugna vid sociala relationer)
Ger kontroll av bias, ex. förväntningar etc.
Det har också visat sig att fp är mer ärliga gentemot datorer i MMPI-test. Problem som tagits upp är
att rapporter från datatest kan vara svårtolkade för oerfaren psykolog, jämfört med kliniska rapporter.
Poängsättningen är också svår att kontrollera. Vidare är validiteten inte alltid kontrollerad, och svår att
bedöma utan tillgång till programvaran. Ett ytterligare problem är att låta datorn göra för mycket av
Om testgivaren får instruktioner att han ska kontrolleras, blir testningen bättre. Ett sätt att
minska problemet är att slumpvis kontrollera testgivarna.
Testgivare tenderar att bli mindre strikta när de lär sig testet.
Ett tredje problem är att man tror att man är bra på att bedöma människor, om de tex.
ljuger. Tester visar dock att det är mycket svårt. Boken kommer inte så långt här, men kan
vara värt att tänka på att egen bedöming av människor är klurigt.
Halo effekten, tendensen att man tillskriver någon positiva attribut bara beroende på de
beteenden man observerat. Ett sätt att komma åt detta har varit att testa specifika attribut
och generella "performances" för sig. Då ökar diskrimitiviteten mellan de delarna.
• Vilka faktorer, förutom personens förmåga att lösa testuppgifterna,
kan påverka ett testresultat?
Enligt klassisk testteori utgår från att det finns ett sant värde, som skulle synas i testet om det inte
fanns några mätfel. Skillnaden mellan det uppmätta värdet och det sanna värdet kallas för mätfel. Ett
annat antagande i klassisk testteori är att mätfelen är slumpmässiga. Det uppmätta resultatet kommer
alltså att se ut som en nomalfördelningskurva med det sanna värdet i mitten.
Förutom de slumpmässiga mätfelen finns det även systematiska mätfel, alltså mätfel som alltid drar åt
samma håll från det sanna värdet, till exempel att en fråga är dåligt eller tvetydig formulerad (eget,
antaget exempel!). (Källa: kaplan, s.101-102)

I vilken utsträckning administreringen är standardiserad.

Förväntningar hos testledaren

Förstärkning, uppmuntran på specifika svar

Testpersonens tillstånd vid testning. Ex. prestationsångest etc.

Språkbakgrund eller språkbegåvningsnivå.

Utbildningsnivå hos testledaren vad gäller det aktuella testet.
Beteendeobservationer

Reactivity – när en person vet att han blir observerad.

Contrast effect – när man bedömmer samma beteende olika vid olika tillfällen.
• Vad menas med testing of limits?
Om barnet har svårt med uppgifterna eller ger avvikande svar, kan det vara bra att få veta hur barnet
tänker och fungerar. Vad som krävs då är att man frångår testramarna och använder materialet friare.
Detta kan man göra genom att: 1) -ge barnet extra hjälp, t.ex. genom att ge första steget i en
problemlösning, ställa följdfrågor och uppmuntra barnet att tänka annorlunda. 2) Fråga barnet hur det
tänkt. Be barnet beskriva hur det tänkt, vilka knep han/hon använt sig av. 3) Ge barnet mer tid.
Har man väl gjort ”testing om limits” på ett deltest kan man inte gå tillbaka till att testa standardiserat
eftersom svårighetsgraden och karaktären på testet påverkas av dess förändringar. Ger en djupare
förståelse för barnet om det utförs på ett bra sätt.
Smedler, sid 70-71.
 Vad menas med problemorienterad utredning?
Meningen är att psykolgen ska utgå från den preliminära bild av problemet man fått i början av
utredningen och formar hypoteser utifrån denna. Utredaren bör försöka göra detta så brett och
förutsättningslöst som möjligt. Frågor som vanligtvis väcks är kring barnets allmänna mognad,
förseningar och funktionsstörningar, relationsstörningar och barnets kommunikativa förmåga såsom
språkutveckling, uppmärksamhets- och koncentrationsförmåga. Påminner om explorativ faktoranalys
fast applicerat på ett barn. Meningen är att man efter att ha täckt av alla dessa områden ska kunna
rekommendera olika sorters behandling. En bred, problemorienterad utredning är meningsfull först
om den motsvaras av en liknande bredd på åtgårdssidan. Smedler sid 26-27.
• Vad menas med profiltolkning?
När man gör utvecklingsbedömningar strävar man efter att få en bild av de svårigheter som barnet
har, man vill se den intraindividuella variationen. Man vill kunna säga någonting om hur barnet
fungerar psykiskt, alltså göra en profiltolkning. För att detta ska kunna ske måste testen man
använder vara teoretiskt välgrundade. Många test man använder (t.ex. Griffiths) utgör sällan mått på
en väldefinierad och avgränsad psykologisk egenskap (de är inte begreppsvaliderade). Ett test som
dock kan användas som grund i profiltolkning är WISC. När man gjort faktoranalyser på WISC
framträder tre huvudsakliga faktorer: verbal förståelse, perceptuell-spatial organisation och en
distraktionsfaktor. Dessa kan sägas vara begreppsvaliderade och således kan man kolla om barnets
profil är begriplig utifrån dessa faktorer.
Stor försiktighet krävs vid profiltolkning. Smedler sida 97-98
• Vad menas med generaliserbarhet?
Cronbachs teori om generaliserbarhet frångår antagandet om att varje testperson har en ”sann”
poäng. Man antar istället att varje individs testpoäng representerar en mängd möjliga observationer
av samma individ. Generaliserbarhet är viktigt då test inkluderar skattningar, observationer, och
bedömningar utförda av testledaren eftersom likvärdigheten mellan mätningarna i dessa fall ofta är
oklar.
För att beräkna generaliserbarheten måste man först specificera vilken typ av generalisering man vill
göra. Exempel på olika beräkningar av generaliserbarhet är: test-retest (tid och mättillfälle),
homogenitet (generalisering till andra uppgifter ur samma domän) och interbedömarreliabilitet
(generaliseringen mellan testledare). Kort sagt, att systematiska pröva generaliserbarheten (slå
samman alla dessa mätningar till en, ett mått på generaliserbarhet) tar en sjujädrans massa energi
och tid och är en högst komplicerad process. Generaliserbarhet äger sin giltighet i att det suddar ut
gränserna mellan reliabiltet och validitet, vilket är bra eftersom validitetsbestämningar ofta är
haltande. Ett annat värde är att klassisk reliabilitetsteori inte är tillfredsställande vad gäller mätningar
av observationer och skattningar, som är vanligt vid barntest. Generaliserbarhet skulle vara ett gott
komplement/ersättningsmått.
Smedler sida 21-22
• Vad menas med projektiv testmetod? (Försök svara kort!)
Bygger på psykodynamisk teori. Utgår från psykisk determinsim, att vi huvudsakligen styrs inifrån, av
våra personligheter och undermedvetna processer. När en person betraktar en bild tolkar han/hon
den från tidigare erfarenheter och ger således utlopp för sina behov och konflikter. De projektiva
metoderna antas synliggöra djupare och omedvetna nivåer av personligheten. Individen är ovetande
om vad han/hon avslöjar när bilden/händelsen/situationen tolkas. Varje svar och uttryck antas vara
meningsbärande och ett testprotokoll från ett projektivt test tillräckligt uttömmande för att kunna göra
en personlighetsdiagnostik. Den som hävdar annorlunda kommer att bli hemsökt i sina drömmar av
självaste Sig(is)mund första söndagen i varje månad!
Machover och CAT är exempel.
Smedler sida 49
• Beskriv de viktigaste skillnaderna mellan maximal prestationstest
och typiskt utförandetest.
Ett maximal prestationstest mäter vad en individ som bäst kan prestera. Till denna kategori hör test
som avser att mäta en individs maximala förmåga. Tex färdighetstest, nivåbestämningstest,
funktionstest.
Typiskt utförandetest avser istället mäta hur en individ vanligtvis reagerar i en given situation.
Exempel på dessa är: personlighetstest, personlighetsstörningstest, attitydformulär och
diagnostiseringshjälpmedel. Även projektiva test hör till kategorin typiskt utförande.
• Ett psykologiskt test konstrueras för att vara ett värdefullt verktyg i
en bedömningsprocess. Vad innebär, i detta sammanhang, att
ett bra test diskriminerar och att resultaten för en stor
population bör följa normalfördelningskurvan?
Mabon (2006, s. 120) skriver i kapitlet om psykometri, att test oftast är ”utformade så att de ger
symmetriska fördelningar för testresultaten, det vill säga varken negativt eller positivt skeva. Vidare
vill man gärna att resultaten grupperar sig på så sätt att stora flertalet testade befinner sig relativt nära
medelvärdet, medan endast ett fåtal i vardera riktningen presterar långt från detta medelvärde. En
fördelning med sådana egenskaper kallas för en normalfördelning, och en betydande del av våra
psykometriska resonemang är uppbyggda kring antagandet att våra testresultat (ungefär) följer en
sådan fördelning, åtminstone för en större och representativ grupp testade.”
Detta att ett bra test diskriminerar innebär, som jag förstått saken, att testet går att använda för att
särskilja individer utifrån deras värden på testet, dvs att med hjälp av testet går det att differentiera
mellan individer.
Att ett bra test diskriminerar innebär att testet särskiljer - på ett (förhoppningsvis) inte otillbörligt sätt.
Ett test bör t.ex. inte diskriminera med avseende på kön, etniskt ursprung och ålder. Däremot är det
bra om ett test särskiljer på så vis att en testpersons (tp) resultat på testet kan jämföras med
populationens resultat på testet, så att man t.ex. kan se om en tp presterar bättre eller sämre än
medel samt hur många andra i populationen (hur många procent av dem) som har högre eller lägre
resultat, eller som ligger inom samma intervall. En populations resultat följer ofta
normalfördelningskurvan, om populationen är tillräckligt stor, där de flesta av individernas (individerna
i populationen) resultat hamnar nära medelvärdet för hela populationen. Ju längre ett resultat är ifrån
medelvärdet, antingen lägre och högre, desto färre individer återfinns. Denna symmetriska fördelning
(som jag knappast tror att jag behöver rita ut hur den ser ut) på en populations resultat ger stora
möjligheter till jämförelser. Individers resultat kan med hjälp av en normalfördelning jämföras med
varandra och man kan även undersöka om skillnaden mellan deras resultat beror på verkliga
skillnader mellan individerna eller på slumpen. En normalfördelning ger information bl.a. om hur
många procent av populationen som befinner sig inom ett visst intervall (t.ex. en standardavvikelse).
Vet man således att populationens resultat är normalfördelad, samt känner till normalfördelningens
medelvärde och standardavvikelse (dvs testet är normerat), så kan jämförelser och särskiljanden
mellan olika testpersoners resultat enkelt göras. (från fhanér sid 51ff + örjans föreläsning nr 3)
Format, papper eller data
• Du har fått i uppdrag av ett känt svenskt testförlag att komma med
synpunkter på ett engelskt test som man funderar på att ge ut i
Sverige och som du har fått till påseende. Testet rubriceras som ett
personlighetstest. Nu när du skall lusläsa manualen och ev. övrig
information du har. Vilka uppgifter är du främst intresserad av och
vilka krav ställer du på testet?
Beskrivning, allmän ex. vad avses mätas, historisk bakgrund. Värderingsfri faktabeskrivning
Stiftelsen för Tillämpad Psykologi (STP) har tidigare gjort och gör fortlöpande granskningar av både
begåvningstest och personlighetstest. STP arbetade efter ett bedömningssystem som i stora drag
undersökte följande för respektive test:
Förutsättningar, vad krävs utöver de normala förutsättningarna? (tystnad, god belysning och
ventilation, bordsyta och sittplats).
Priser, för start och varje bjudning
Service, finns det möjlighet till rättning, tolkning via leverantören
2. Historik och beskrivning
Typ av skala, pers.test (fördelas grovt i två skalor: ipsativa eller normativa även projektiva test
förekommer).
Typ av poäng, vilka värden får man ut, råvärden och andra skalor som kan tas fram via manualen.
3. Administrering
Bakgrundsdata: Namn, typ, tillbehör, användarvillkor, format, priser och service.
Tid, Bedömningen utgår från att testningen görs av en person med erfarenhet av testet. Tiden delas
in i förberedelsetid, bjudningstid, poängberäkning, analys, presentation.
Historik och beskrivning: Faktabeskrivning, typ av skala, typ av poäng
4. Användardokumentation
Administrering: Förutsättningar, utrustning, tid
Material som medföljer, exempelvis hur är trycket, strukturen och organisationen. Bedöms från 0-5.
Läsbarheten i materialet, är det lätt att sätta sig in i utifrån språk, termer, översikt,. Mäts också på en
skala från 0-5.
Användardokumentation: Materialets tryckkvalitet, läsbarhet, användarvänlighet
Vetenskaplig dokumentation: Allmän teknisk dokumentation, validitet (kriterierelaterad,
begreppsvaliditet), reliabilitet (homogentitet, stabiliti´tet), normer (ändamålsenlighet, allmängiltighet,
stickprovsstorlek); omfattning och tydlighet i dokumentationen.
Denna granskning mynnar ut i ett sammanfattande utlåtande som omfattar:
Utvärdering av den tekniska dokumentationen
Utvärdering av omfattning och tydlighet
Design: lätt att läsa, fylla i, tolka
Allmänt omdöme: användningsområden samt begränsningar, utbildningsbehov
Slutsats
5. Vetenskaplig dokumentation
Kvalitén i den tekniska dokumentationen samt omfattning och tydlighet i innehållet, bedöms 0-5 där
två eller högre är acceptabelt.
6 Validitet
Kriterie- samt begreppsvaliditet. När och var är studierna gjorda, har prediktiva studier gjorts, hur har
kriterier valts ut. Helheten bedöms på 0-5 gradig skala. Vilken mängd data redovisas?
7. Reliabilitet
Bedöms som validiteten. Homogenitet, mängd o median. Stabilitet, mängd o median.
(Mabon, s. 190-193).
8. Normer, bedöms likt validitet o reliabilitet. Ändamålsenlighet samt allmängiltighet bedöms liksom
stickprovsstorlek
(Källa: Artikeln om kvalitetskriterier vid personlighetsbedömningar)
9. Sammanfattande utlåtande.
Enligt STPs kvalitetskriterier bör följande undersökas i ett test för personlighetsbedömning:
Allmän beskrivning av granskning samt kommentarer till de betyg som satts. Huvudfrågan är: lever
testet upp till sina anspråk?
1. Testinformation
Typ av instrument (ex. typiskt utförande, attitydformulär)
Fråga 7 En väsentlig del I testkunskapen är att kunna administrera test på ett professionellt sätt. Vad
ska man som testgivare tänka på för att testningen ska utföras på ett tillförlitligt sätt? Svar:
(Psychological testing, kap 7, s184).
Tillbehör, vad behövs för att bjuda testet
Att testmiljön är samma för alla testdeltagare
Namn, förläggare, distributör
Användarvillkor, vilka krav ställs från leverantören i form av utbildning av testledaren
Formulär, vilka finns, beskrivning av dessa

Man ska tänka på att vara på samma sätt mot alla testdeltagare, både innan och under
testet. Forskning har visat att testresultaten kan variera om testgivaren är positiv och
uppmuntrande eller om han/hon är negativ eller neutral.

Att verbala test är känsliga för språkkunskaper

Att testgivaren har tillräcklig erfarenhet och utbildning av testet

Man ska vara uppmärksam på förväntanseffekter, att man får de resultat man förväntar sig
att få

Att olika personer reagerar olika på testsituationen, ex tentaångest och andra inte presterar
på bästa sätt under tidspress.
• Som ortens mest berömde psykolog har du blivit inbjuden av Rotary
att hålla en föreläsning om psykologiska test. Man har sagt till dig att
man främst vill veta vad som skiljer ett bra ”intelligenstest” från ett
dåligt sådant. Vilka punkter tycker du är viktigast i ditt föredrag och
vilka viktiga krav på tester vill du förmedla till dina åhörare? Och hur
är det med intelligensbegreppet?
Ref. Kaplan s. 231. Fahner s. 70, 93. Mabon s. 57, 116.
För att kunna säga huruvida en person är intelligentare än en annan måste man först definiera
begreppet intelligens. Det finns många försök till att göra detta. Ett par exempel är Binets definition
som lyder ”the tendency to take and maintain a definite direction; the capacity to make adaptations for
the purpose of attending a desired end, and the power of autocritisism”, och Spearman som definierar
intelligens som förmågan att härleda antingen relationer eller korrelationer. Oavsett hur man väljer att
definiera intelligens så förblir begreppet abstrakt. Hur väl ett test mäter intelligens kan undersökas
genom att se hur testet korrelerar med sådant beteende som man kopplar samman med intelligens.
En eventuell korrelation visar att testet mäter någonting som hänger samman med
intelligensbegreppet, man säger att testet har begreppsvaliditet. En förutsättning för god validitet i ett
test är reliabilitet, testet ska vara ett pålitligt mätinstrument. Reliabiliteten är ett mått på mätsäkerheten
i testet, hur stor del av variansen i testresultaten som beror på reella skillnader.
För att man ska ha någon nytta av resultaten från ett intelligenstest måste man ha något att jämföra
med, testet måste vara normerat. Ett normerat test har normtabeller där man kan läsa ut hur ett
testresultat förhåller sig till den population som tabellen gäller. Det är mycket viktigt att den normgrupp
som man jämför mot är relevant för personen vars resultat man analyserar.
De krav jag tycker man ska ha på ett intelligenstest är först och främst att det ska finnas en manual.
Manualen ska definiera vad det är testet avser mäta och presentera reliabilitet- och
validitetsundersökningar för detta. Testet ska också vara normerat för den population man avser
använda det på, detta för att få en rättvisande referens.
Det är såklart viktigt att testet är ordentligt utvärderat, normerat och reliabilitets och validitetstestat och
att dessa uppgifter finns redovisade.... Men att få det formulerat på det sättet är kanske inte rotary så
intresserade av.
Med begreppet intelligens kan man mena lite olika saker. En tidig teori som med viss modifikation står
sig än idag är Spearmans g-faktorteori. Han menade att det finns en generell intelligens som kunde
manifesteras lite olika hos olika människor men att det ändå rörde sig om en övergripande begåvning
och inte en begåvning för ett visst område, som t.ex. språklig eller numerisk begåvning. IQ är också
ett mått på allmän begåvning som används än idag iform av IQ-skalan för att beskriva hur olika
resultat förhåller sig till popuationen i stort. Ett test som används i Sverige som anses mäta g-faktor är
Ravens matriser.
En teori som istället hävdar att intelligens består olika av varandra oberoende faktorer är Thurstones
7-faktor modell. De 7 sk primärfaktorerna är verbal försåelse, verbal rörlighet logiskt tänkande,
numerisk förmåga, minne, spatial förmåga och varseblivningshastighet. Denna modell är speciellt
användbar när man i reryteringssammanhang söker efter en viss sorts begåvningsprofil. I Sverige har
testföretaget SHL Sverige AB utvecklat test med specifika yrkesrelaterade begåvningsprofiler, t.ex. ett
testbatteri för tillämpad teknologi ATS.(Mabon s. 244)
Senare forskning har genererat en ytterligare modell som i viss mån integrerar de båda tidigare.I
denna hierarkiska modell tänker man sig att g-faktorn är den viktigaste och övergripande
begåvningsfaktorn som framför allt består av logisk förmåga och att det under den finns 3 specifika
begåvningar; spatial, språklig och numerisk förmåga. Detta säger inte på lång väg allt om begreppet
begåvning men de är de tre mest efterforskade modellerna utifrån vilka man också har kunnat
utveckla tillförlitliga mätmetoder för att uppskatta individers begåvning. Utifrån den hierarkiska
modellen har man i sverige utvecklat testet basIQ
För att ett intelligenstest ska kunna utvärderas som bra eller dåligt krävs det alltså att man har
definierat (operationaliserat) begreppet intelligens eller begåvning. Det krävs också att man har
utvecklat metoder(test) som med godtagbar säkerhet faktiskt kan ge ett mått på detta. Ett bra test ska
alltså ange hur det definierar begåvning och ange på vilket sätt man har kunnat visa att det är just det
som testet också mäter.
Källa: H Mabon, s. 57-61, s- 239-244.
• I ditt kliniska arbete har du bestämt dig för att bland annat använda
psykologiska test när du gör utredningar av individers problem.
Motivera varför och beskriv inför vilka frågeställningar du använder
test i stället för (eller tillsammans med) andra alternativa metoder.
Jag har försökt samla ett antal argument till varför psykologiska test är lämpligt att använda vid
utredningar av individers problem. Test kan anses vara mer objektiva än andra metoder, d v s mer
befriade från slumppåverkan (Frasses handout 1 s 5). Test är relativt sätt enkla och snabba att
använda (Frasses handout 1 s 5), vilket ger tids- och kostnadsmässigt positiva effekter. Smedler (s
11-12) beskriver att den vanligast tillämpade undersökningsmetoden, intervju, kan i arbete med barn
vara begränsad p g a deras begränsade förmåga att uttrycka sig i tal. Smedler konstaterar därmed
värdet med test som metod. Det finns för test genomarbetade och beprövade metoder för att
utvärdera kvalité (Jämför standardisering och reliabilitets- och validitetsmått).
Psykologiska test är tillämpbara i samband med flertalet frågeställningar. Jag har här valt ut tre
områden, personlighets-, neuropsykologisk-, och begåvningsproblematik, som jag uppfattar som
centrala inom klinisk tillämpning. I dessa sammanhang kan det vara lämpligt att endast använda
psykologiska test eller att kombinera test med andra metoder.
Vid personlighetsproblematik, kan test ex vis SSP tillsammans med SQID-2 vara lämpligt som
underlag i en utredning.
Vid neuropsykologiskproblematik kan test vara ett effektivt verktyg för att förstå
funktionsnedsättningen och utgöra underlag för diagnostisering och åtgärdsprogram.
Vid begåvningsproblematik kan test som WAIS, WISC vara effektivt för att kartlägga brister och
resurser.
Källa: Frasses handout 1 s5, Smedler s 11-12 och egna resonemang.
• Testanvändaren har ofta att ta ställning till etiska frågor, varav två
av de viktigaste berör skydd mot intrång i privatlivet samt sekretess.
Diskutera vad dessa termer innebär, i vilka situationer de är särskilt
relevanta, samt hur man värnar testtagarnas integritet.
Resultaten från en testning är en integritetsmässigt känslig handling som ska hanteras därefter. För
datalagrat material styr personuppgiftslagen hanteringen och för vissa yrkesgrupper gäller
journalföringslagen. I organisationer där testresultat betraktas som offentlig handling ska rutiner finnas
som värnar om de testades integritet.
Sorry men här kunde jag inte hitta något bra svar. Tror att man kan babbla en hel del om självklara
saker om hur testreusultat skall behandlas.
Test för att mäta maximal prestation
• Hur översätter du ”achievement” och ”aptitude” till
vardagssvenska?
Achievement kan översättas till förmåga eller kunskap som bygger på tidigare inlärning, dvs redan
formad begåvning. Aptitude kan översättas till fallenhet eller anlag, dvs formbar begåvning. Aptitude
syftar på ens potential att lära in en specifik färdighet
Både achievement och aptitude är ex på begåvningtermer
1.
Achievement: typ; ”crystalized intelligence”, kunskap, förmåga, erfarenhet, inlärd kunskap.
(Anses redan formad).
2.
Aptitude: typ; ”fluid intelligence”, fallenhet, anlag, logisk förmåga, problemlösnings
förmåga, det som vanligtvis kallas för generell G faktor.
Olika begåvningsmodeller: Spearman,
Thurstone, Gustafsson och G-faktorn
• Vad kännetecknar Charles Spearmans begåvningsteori?
Enligt Spearmans begåvningsteori finns det en generell mental begåvning som ligger till grund för allt
intelligent beteende. Spearman kallade denna generella mentala begåvningen för g-faktorn (Mabon,
s. 58). Intellektuell prestation beror alltså dels på g-faktorn och dels på den speciella förmåga som
krävs vid den specifika uppgiften. Graden av g-faktorns betydelse varierar förvisso från uppgift till
uppgift men eftersom g-faktorn ändå är inblandad i i stort sätt alla uppgifter anses det av många vara
grunden för intelligens. Spearman undersökte skolbetyg och uppmärksammade att betygen i olika
ämnen ofta korrelerade positivt. Spearman upptäckte också att individers resultat på en mängd olika
begåvningstest korrelerade och definierade alltså g-faktorn som den gemensamma nämnaren
(Passer & Smith, s. 308).
Spearman uppfann år 1907 faktoranalytiska metoder för att studera intelligensens faktorstruktur. Han
myntade begreppet G-faktor som avsågs förklara allmänbegåvningen. Enligt Spearmans s.k.
tvåfaktorteori beror varje intellektuell prestation dels på en allmän faktor (g), som i större eller mindre
grad har betydelse för alla uppgifter, dels på en specifik faktor (s), som har betydelse för en viss typ
av uppgift.
Spearmans teori utgår alltså ifrån att det finns en generell begåvning som kommer att ligga till grund
för hur man presterar på olika områden. Begåvningen kan enligt S. manifesteras på olika sätt, men
specifikt för Spearmans teori är ändå att det finns en G-faktor som är ett övergripande mått på
”flytande intelligens”. (Mabon, 58), (NE sökord ”Spearman”)
• Vad innebär G-faktorn?
Ref. Mabon s. 58, 163.
G-faktorn, den generella faktorn, är enligt Spearman det övergripande måttet på begåvning, även om
begåvningen kan manifesteras på många olika sätt så har g-faktorn påverkan på alla
begåvningstyper. Thurstones sjufaktormodell talar emot g-faktorn, Thurstone ansåg att den var en
produkt av de relativt primitiva statisktiska metoder (faktoranalys) som Spearman använde. Thurstone
använde multipel faktoranalys vilket resulterade i att g-faktorn ersattes av sju olika begåvningsfaktorer
som inte verkade ha någon gemensam nämnare. Den hierarkiska modellen slår samman dessa
motstående teorier, g-faktorn är den övergripande, dominerande och främst logiska begåvningen, på
en lägre nivå finns spatial, språklig och numerisk begåvning.
G-faktorn anses tillförlitlig gällande prognoser för framtida prestation och framgång på
arbetsmarknaden.
Ref. Kaplan s. 234.
En underliggande faktor till allt intelligent beteende. Intelligens består av en generell faktor (g) plus ett
stort antal specifika faktorer. Modellen grundad i fenomenet att när man ger olika begåvningstester till
en generell population så korrelerar dessa test positivt, oavsett vilka olika förmågor testen mäter, alla
test mäter i någon grad g-faktorn. Enligt Spearman så kan man generellt säga att uppskattningsvis
hälften av variansen i olika intelligenstest beror på g-faktorn.
Det var Spearman som myntade begreppet g-faktorn och begreppet är fortfarande av stor betydelse.
Intelligens ses här som en generell underliggande faktor, och en rad andra specifika faktorer. Man
menar att det är g-faktorn som är den underliggande orsaken till att en persons resultat på flera olika
typer av test samvarierar. Resultatet på varje enskilt test beror dels på g-faktorn och dels på den
specifika förmågan när det gäller just av vilken typ det enskilda testet är. (tex om det mäter verbal
förmåga) Om man testar en person med flera olika test som fokuserar på olika saker så tar dock de
specifika förmågorna ut varandra och man kommer allt närmare att bara mäta själva g-faktorn.
(psychological testing s 235-236)
• Inom begåvningsteori och konstruktion av vissa
begåvningstest så talar man om en generell G-faktor.
Vad innebär denna? Beskriv kortfattat ett test som mäter
G-faktorn.
”Spearman myntade begreppet g-faktorn, den generella faktorn, som fortfarande är av stor betydelse i
intelligensdebatten. Enligt Spearmans synsätt var g-faktorn det övergripande måttet på begåvning…”
(Mabon, 2006, s. 58)
Ett test som avser att mäta (bland annat) g-faktorn är BasIQ. Se testbeskrivning.


G-faktorn myntat av Charles Spearman, står för en generell begåvning och motsvarar förmågan att
lösa problem och dra slutsatser ur komplex information. Inom begåvnings mätning så pratar man om
en formbar begåvning dvs. G-faktorn där specifika fallenheter, logisk problemlösningsförmåga och en
underliggande slutledningsbegåvning lyfts fram. Den g-faktor man har genereras till personens alla
andra förmågor. Detta kan vara ett antal breda faktorer (språklig, spatial och numerisksnabbhet) som i
sig inte är observerbar utan endast kommer till uttryck i olika aktiviteter.
Tester som är avsett att mäta g-faktorn är bl.a. BasIQ (g-fakotor samt spatial, verbal och numerisk
förmåga) samt Ravens matriser som skapades på 50-talet för just Spearmans forskning om den
eduktiva förmågan.
Källa: Kaplan s. 234-236 och Testbeskrivningar
• Vad kännetecknar Louis Thurstones begåvningsteori?
Modellen är en flerfaktorteori. Intelligens enligt Thurstone består av 7 olika faktorer (dessa heter olika
på svenska beroende på källa, men jag använder mig av Örjans handouts från föreläsn 2). Faktorerna
är:
Verbal förståelse, perceptuell snabbhet, logik, numerisk förmåga, spatial förmåga, verbalt flöde,
minne.
• Vad innebär Flerfaktorteorin?
Flerfaktorteorin utvecklades av Louis Thurstone som reaktion mot Spearmans g-faktormodell.
Flerfaktorteorin går ut på att det finns sju begåvningsfaktorer som är relativt oberoende av
varandra. De kallas primära faktorer och utgörs av: V (verbal förståelse), W (verbal rörlighet), R
(logiskt tänkande), N (numerisk förmåga), M (minne), S (rumsuppfattning) och P
(varseblivningssnabbhet). Indelningen tyder på att vi kan vara begåvade inom vissa områden och
sämre inom andra, vilket kommer till användning t.ex. inom rekrytering. Man kan alltså sammanställa
ett begåvningstest som passar för en viss profil.
Läs mer i Mabon s. 58 och Kaplan s. 246. Flerfaktorterorin nämns också på den handout som heter
Psykologiska testmetoder, föreläsning 2.
Flerfaktorteorin utvecklades av Louis Thurstone som reaktion mot Spearmans g-faktormodell.
Flerfaktormodellen kom att ersätta g-faktormodellen eftersom den bygger på mer raffinerade
statistiska metoder, s.k. multipel faktoranalys.
Flerfaktorteorin går ut på att det finns sju begåvningsfaktorer som är relativt oberoende av
varandra. De kallas primära faktorer och utgörs av: V (verbal förståelse), W (verbal rörlighet), R
(logiskt tänkande), N (numerisk förmåga), M (minne), S (rumsuppfattning) och P
(varseblivningssnabbhet). Denna indelning tyder på att vi kan vara begåvade inom vissa områden och
sämre inom andra, vilket kommer till användning t.ex. inom rekrytering. För att bli pilot kanske höga
resultat på vissa av dessa förmågor är idealiskt, medan andra förmågor passar för en säljare. Man
kan alltså sammanställa ett begåvningstest som passar för en viss profil.
Läs mer i Mabon s. 58 och Kaplan s. 246. Flerfaktorterorin nämns också på den handout som heter
Psykologiska testmetoder, föreläsning 2.
• Beskriv sammanfattande den begåvningsmodell som
brukar kallas flerfaktormodellen. Beskriv kortfattat ett
test som bygger på denna modell.
Thurstone kan sägas vara fadern till flerfaktormodellen. Han reagerade mot G-faktorn vilken han
ansåg vara ett resultat av primitiva statistiska metoder. Thurstone använde sig av multipel
faktoranalys, en mer gedigen statistisk metod och efter denna utformade han sju, ganska fristående
begåvningsfaktorer. Dessa är i sin korthet: 1) verbal förståelse 2) verbal rörlighet 3) ogiskt tänkande
4) numerisk förmåga 5) minne 6) rumsuppfattningförmåga 7) varseblivningssnabbhet.
Testet har väldigt stor giltighet vad gäller arbetspsykologisk testning. Varför? Jo, eftersom
begåvningarna skiljer sig så pass mycket åt (man kan vara begåvad inom vissa områden och sämre
inom andra) kan man försöka fastställa den ”bästa” begåvningsprofilen för en viss befattning.
Thurstones dimensioner och måtten har visat sig ha god prediktiv förmåga avseende framgång inom
olika arbeten.
APU är som ni kanske förstått ett av de test som bygger på denna teori. Om ni vill läsa mer om detta
test hänvisar jag eder till den s.k. testluntan. Mabon, sida 58-59
För beskrivning av Thurstone’s flerfaktormodell, se fråga 14 där jag redan försökt svara på den saken.
APU (Arbetspsykologiskt Utredningstest) är ett test som bygger på denna teori. Testet är avsett att
användas vid rådgivning, rekrytering, vägledning, urval och rehabilitering. De olika deltesten mäter
Thurstone’s sju primära faktorer på olika sätt, exempelvis finns test som formlogik, ordförståelse,
associationsflöde, simultankapacitet, stresstolerans, matematik i praktiken och perceptuell snabbhet.
Hela testet tar ca 2,5 h.
En kritik mot APU är att validiteten är dåligt testad. Reliabiliteten har däremot testats och det visade
sig att homogeniteten är tillräcklig (0,7 – 0,8) och att stabiliteten är mycket bra (r > 0,85). Den höga
reliabiliteten kan bero på att testet har tydliga instruktioner och därmed är lätt att administrera.
Man kan läsa mer i häftet Testbeskrivningar.
• Vad kännetecknar en hierarkisk modell begåvningsteori?
Forskning har visat att begåvning förmodligen bäst kan förklaras av en hierarkisk modell. Denna
kännetecknas av att det finns en övergripande nivå bestående av en dominerande g-faktor (g-faktor,
ursprungligen Spearmans teori, se s 58), vilken främst består av logisk förmåga. Under denna nivå
finns en nivå bestående av tre förgreningar – spatial, språklig och numerisk begåvning (jämför
Thurstones sju primära faktorer, se s 58).
Källa: Mabon, s 58-60
• Ge exempel på en hierarkisk modell begåvningsteori.
Spearmans begåvningsmodell utgår från att det finns en underliggande faktor, g-faktorn och under
denna finns ett helt gäng med specifika faktorer. Dessa är t.ex. numeriskt resonerande, vokabulär och
mekanisk förmåga. Man kan alltså se intelligens som både generell förmåga och specifik. Enligt
Spearman influeras alla givna test -hur olika de än är- av g-faktorn. Många psykologiska test idag
använder sig av liknande hierarkiska begåvningsmodeller, t.ex. McCarthys skalor och Leiter-R för
barn och WAIS för vuxna. Kaplan, sida 235
• Beskriv sammanfattande den hierarkiska
begåvningsmodellen och ett test som bygger på denna
modell.
Den hierarkiska begåvningsmodellen kan sammanfattat beskrivas bestå av en övergripande nivå
bestående av en dominerande g-faktor, vilken främst består av logisk förmåga. Under denna nivå
finns en nivå bestående av tre förgreningar – spatial, språklig och numerisk begåvning.
uttryck vid muntlig eller skriftlig framställning), logiskt tänkande, numerisk förmåga, minne, spatial
förmåga och varseblivningssnabbhet (förmåga att kunna korrekt uppfatta detaljer likheter och
skillnader i former av olika slag).
Ett test som baseras på denna modell är det svenskutvecklade BasIQ. För beskrivning av BasIQ, se
kompendium ”testbeskrivningar”.
Indelningen tyder på att människor kan vara begåvade inom vissa områden och sämre inom andra.
Denna modell kom efter Spearman’s och Thurnstones modeller. Man kom fram till denna modell med
hjälp av konfirmatorisk faktoranalys (och det lärde vi ju oss vad det är inför duggan). I den
konfirmatoriska faktoranalysen ingår bl.a. ett datorprogram, LISREL, och man kan då med denna
revolutionerande metod signifikanstesta hypoteser. Man kom då alltså fram till den hierarkiska
modellen genom sådan signifikanstestning. Och vad innebär modellen? Jo, att begåvningen bäst kan
förklaras av en hierarkisk modell där g-faktorn är den dominerade faktorn (främst logisk begåvning),
och under den finns tre olika områden; spatial, språklig och numerisk begåvning. (Mabon s. 59-60)
Ett test som bygger på modellen är BasIQ. Beskriver det inte så ingående eftersom det finns ju en hel
fråga för det. Testet lanserades 2000, det har nio deltest och tar en timme att genomföra. BasIQ har
god reliabilitet och god begrepps- och innehållsvaliditet. Det som fattas är olika typer av
kriterievalideringar (Mabon s. 242)
• Beskriv sammanfattande två olika begåvningsmodeller som olika
test baseras på. Exemplifiera med några olika test.
Flerfaktormodellen:
Thurstone använde multipel faktoranalys och kom fram till att det fanns sju oberoende
begåvningsfaktorer, som han kallade primära faktorer. Dessa sju faktorer var: verbal förståelse,
verbal rörlighet (förmåga att snabbt finna rätta ord och uttryck vid muntlig eller skriftlig framställning),
logiskt tänkande, numerisk förmåga, minne, spatial förmåga och varseblivningssnabbhet (förmåga att
kunna korrekt uppfatta detaljer likheter och skillnader i former av olika slag).
Indelningen tyder på att människor kan vara begåvade inom vissa områden och sämre inom andra.
Exempel på test som bygger på Thurstones sju primära faktorer är APU (arbetspsykolgiskt
utredningstest),
(Arbetspsykologisk testning sidan 58)
Gustafssons hierarkiska modell:
Denna modell kom till efter att forskare hade intresserat sig för motsättningen mellan Spearmans Gfaktor och Thurstones primära metoder. Man använde sig av konfirmatorisk faktoranalys och kom
fram till att g-faktorteorin stämde, och att begåvning nog bäst förklaras av en hierarkisk modell. På
den övergripande nivån finns g-faktorn som främst består av logisk begåvning, och på nästa nivå tre
förgreningar, spatial, språklig och numerisk begåvning.
Exempel på test som bygger på denna modell är BasIQ
(arbetspsykologisk testning s 59-60)
Thurstones sju primära faktorer:
Thurstone använde multipel faktoranalys och kom fram till att det fanns sju oberoende
begåvningsfaktorer, som han kallade primära faktorer.(Han var kritisk till spearmans g-faktormodell)
Dessa sju faktorer var: verbal förståelse, verbal rörlighet (förmåga att snabbt finna rätta ord och
Exempel på test som bygger på Thurstones sju primära faktorer är APU (arbetspsykolgiskt
utredningstest),
(arbetspsykologisk testning sidan 58)
Gustafssons hierarkiska modell:
Denna modell kom till efter att forskare hade intresserat sig för motsättningen mellan Spearmans Gfaktor och Thurstones primära metoder. Man använde sig av konfirmatorisk faktoranalys och kom
fram till att g-faktorteorin stämde, och att begåvning nog bäst förklaras av en hierarkisk modell. På
den övergripande nivån finns g-faktorn som främst består av logisk begåvning, och på nästa nivå
finns tre förgreningar, spatial, språklig och numerisk begåvning.
Exempel på test som bygger på denna modell är BasIQ
(arbetspsykologisk testning s 59-60)
Kulturella skillnader och problem
• Resonera kring vilka svårigheter som kan uppstå när man använder
"svenska" begåvningstest på människor som kommer från andra
kulturer än den svenska.
Det finns då en överhängande risk för att testledaren får missvisande resultat. Först och främst har
många begåvningstest språkliga inslag och således presterar ofta nya svenskar sämre än etniskt
svenskar (Mabon, s. 215). Jag kan tänka mig att en del av problemet kvarstår även om de verbala
delarna översätts. Exempelvis kan ordspråk vara knepiga att översätta.
I olika kulturer värderas dessutom olika sorters kunskap olika. Vad som värderas i respektive
kultur och i förlängningen vilka uppgifter som bjuds i ett test bestäms av den politiskt dominerande
gruppen. Risken är således stor att människor från olika kulturer som arbetar utifrån olika ”baser”
missgynnas eftersom andra kunskaper än de som de själva besitter värderas högst.
Ett annat problem är att det sällan finns passande normgrupper för människor som kommer från
andra kulturer (Kaplan s. 556-559).
Vidare har amerikanska studier visat att afroamerikaner presterar sämre än vita amerikaner när
testet föregås med instruktionen att det är ett intelligenstest som bjuds. Dock presterade afroa- och
vita amerikaner ungefär lika när testet föregicks med instruktionen att testet inte var relaterat till
begåvning (Kaplan, s. 542). Möjligen kan resultaten generaliseras till svenska förhållanden, negativt
stereotypiserade utländska grupper kanske presterar sämre än etniskt svenska på grund av
förväntanseffekter hos testtagaren.
Det finns många problem kring detta. Dels för att språket kan ha en stor betydelse, men om man
översätter testet till deltagarens hemspråk kvarstår problem. Ett exempel är ordspråk. ”Man skall inte
kasta sten i ett glashus” och ”Man skall inte sätta räven till att vakta gäss” kanske ska bedömas ha
”liknande betydelse”, ”motsatt betydelse” eller ”varken liknande eller motsatt betydelse”.
Det som vi menar med intelligens i västvärlden skiljer sig från andra delar av världen. I t.ex. Afrika har
intelligensbegreppet handlat om färdigheter som skapar harmoniska relationer inom och mellan
grupper, medan kineser menar att begåvning är ödmjukhet och förmåga att agera utifrån rättvisa
principer. Många asiatiska länder ser intelligens som en social färdighet, medan vi i västvärlden
kanske främst syftar på IQ som är logisk förmåga, abstrakt tänkande med mera.
APU är ett begåvningstest för att mäta maximal prestation inom sju olika områden. Det är ett
arbetspsykologiskt utredningstest som alltså är grundat på Thurstones sju intelligensfaktorer (se
annan fråga för beskrivning av dem). APU används främst av Arbetsmarknadsinstitutet i samband
med deras utredningar, det kan handla om rådgivning, rekrytering, vägledning, urval samt
rehabilitering. Testbatteriet består av följande deltest:
I Sverige värderas den generella intelligensen högre än t.ex. emotionell och social intelligens och det
är främst denna typ av tänkande vi lär oss i skolan. En person från en annan kultur kan ha blivit
tränad i ett annat tänkande, vilket gör att han/hon missgynnas i det svenska testet.
Logisk förmåga: Formlogik är ett test där en red med sex figurer bildar en serie, man ska komma på
regeln och markera de som följer. Sifferlogik och bokstavslogik är samma sak fast med siffror och
bokstäver.
Det kan även vara svårt att göra en rättvis bedömning av nya svenskar då de jämförs med svenska
normgrupper ex i anställningshänseende.
Verbal förståelse: Ordförståelse 1-2-3, tre delprov med vanliga ord, främmande ord och sällan
använda ord. Ordförståelse 4-5 där både nyckelord och svarsmöjligheter är främmande respektive
sällan använda ord.
• Du skall utföra en begåvningsutredning av en vuxen person med en
icke svensk kulturell och språklig bakgrund. Beskriv vilket/vilka test
du kan tänka dig att använda för detta ändamål och diskutera dess
styrkor och svagheter samt varför du väljer just detta/dessa test.
Jag skulle använda mig av Ravens Progressiva Matriser efterson det är ett icke-verbalt
begåvningstest. Testet består av olika designade geometriska figurer som grupperats i kolumner där
den sista figuren saknas. Testpersonen ska utifrån givna alternativ avgöra vilken den saknade figuren
är (jag skriver inte mer om Ravens eftersom det är någon annans fråga). Fördelarna med att välja
Ravens är att det anses vara oberoende av kultur, kön och ålder samt just att det är icke-verbalt.
Testet är i princip självinstruerande vilket underlättar administrationen till alla grupper och det går
snabbt att rätta. Testet är väl underbyggt genom en mängd studier som redovisas i manualerna. En
nackdel är att det egentligen bör kompletteras med andra verbala test för att ge en bild av personens
totala kapacitet. Det kan kanske vara bra att göra exempelvis WAIS eller BasIQ så länge man är
medveten om att språkliga svårigheter kan göra att testresultatet blir missvisande lågt. En annan
eventuell nackdel med Ravens är att många hävdar att det ska betraktas enbart som ett mått på
problemlösningsförmåga i mer eller mindre rätlinjiga system, om så är fallet bör ju resultatet bara
ställas i relation till andra som har gjort testet och vilken percentil testpersonen hamnar på.
Verbal rörlighet: Associationer 1 och 2 är parallella test, utifrån en streckteckning komma på
associationer. Ordflöde 1 och 2, utifrån nyckelord bilda så många nya ord som möjligt.
Perceptiv snabbhet: Distraherande perceptuellt fält med bokstäver, siffror och figurer där man ska
stryka över samma kombination som är överstruken till vänster.
Simultankapacitet: Den del vi fick göra på redovisningen om APU, alltså ovanstående fast men frågor
samtidigt.
Numerisk förmåga: Proven alfa & omega, ex 15 och 5 räkna ut med alla räknesätt.
Matematisk förmåga: Vardagliga matematiska problem.
Hela testbatteriet tar ca 2,5 timmar att bjuda, det är en normrelaterad skala som omvandlas till
staninepoäng. När det gäller validitet har inga egentliga valideringsstudier utförts. Reliabiliteten har
beräknats med en rad olika metoder och man har funnit att homogeniteten är tillräcklig till utmärkt,
och stabiliteten är utmärkt. Testbatteriet är lätt att administrera och tydliga instruktioner bidrar till den
höga reliabiliteten. Det kan administreras enskilt eller i grupp, man kan även välja ut vissa av
deltesten vilket ger ett stort användningsområde. Nackdelar är att det inte finns någon enhetlig
manual samt som sagt att det är mycket dålig dokumentation av validiteten.
Ref. Häftet testbeskrivningar.
• Beskriv sammanfattande den begåvningsmodell som
I första hand skulle jag välja Ravens matriser eftersom det är ett helt icke-verbalt begåvningstest.
Styrkan ligger i att testet ges med samma förutsättningar oavsett modersmål hos den man testar,
språkliga svårigheter ska inte ha någon inverkan, däremot kan kulturella skillnader eventuellt påverka
testresultatet. Testet mäter en mycket smal aspekt av begåvning, logisk problemlösning, och behöver
därför kompletteras med andra test.
brukar kallas flerfaktormodellen. Beskriv kortfattat ett
test som bygger på denna modell. (Bläddra till s.22)
• Du har fått i uppdrag att vara behjälplig vid antagning
av sökande till Polishögskolan. Du ansvarar för testdelen
i denna urvalsprocess. Det är ett mycket stor antal
personer som sökt. Vilket/vilka begåvningstest är det
lämpligt att använda? Beskriv för- och nackdelar med
det/de test du väljer.
WAIS skulle kunna användas för att få en bredare bild av personens kapacitet. Eftersom testet är
uppdelat i två skalor kan man lägga mindre vikt vid resultaten på deltesten i den verbala skalan och
koncentrera sig på performanceskalan. Även de icke-verbala deltesten kräver verbala instruktioner så
en person med dåliga kunskaper i svenska kommer förmodligen få sämre resultat också i dessa
delar. Även BasIQ skulle kunna användas med samma för- och nackdelar som med WAIS.
(PM om BasIQ)
Exempel på test för att mäta maximal prestation
Jag gör det lätt för mig och väljer BasIQ som idag används för den typen av antagningar. Generellt är
det lämpligt med test för vuxna som mäter generell begåvning, dvs även Ravens matriser.
• Beskriv APU- testen.
Fördelar med testet:

Det är relativt lättadministrerat och tar kort tid, bra då det är många sökande.

Det är avsett för vuxna med minst genomsnittlig begåvning, vilket passar gruppen.

Det mäter generell begåvning, vilket är lämpligt då det gäller att välja ut de mest allmänt
begåvade ur ett stort urval, utan att kräva speciell begåvningsstruktur. Ett yrke som
polisens kan vidare lätt motiveras kräva begåvning på många områden.

Det är en väl beprövat modell att mäta begåvning på, Den testade får värde på g-faktorn
samt verbal, spatial och numerisk begåvning i en hierarkisk begåvningsmodell, (med
inflytande från g-faktorn exkluderad).

Validiteten är acceptabel. Homogeniteten är god till utmärkt. Stabiliteten tillräcklig.
Nackdelar med testet:
• Beskriv, kortfattat, ett test för att mäta maximal
prestation som är lämpligt att använda i: - studie- eller
yrkesrådgivning. Motivera ditt val och ge en kort och
översiktlig beskrivning av testet. Diskutera kortfattat de
styrkor och ev. brister hos det test du valt.
Jag tror att APU, arbetspsykologiskt utredningstest, är ett vettigt alternativ. Det är ett maxtest som
mäter Thurstones 7 intelligenser, och används till rådgivning, rekrytering, vägledning, urval och
rehabilitering. En svaghet med testet är att inga valideringsstudier har gjorts. (Källa: testhäftet)
Utifrån de test vi gått igenom skulle jag här välja delar av APU. Då finns nämligen möjligheten att välja
ut de deltest som man tycker är relevanta för personen i fråga. Möjligheten att kombinera olika deltest
ger även ett större användningsområde, dvs. testet kan användas för fler yrkesgrupper. Andra styrkor
med APU är att det är lättadministrerat både i grupp och individuellt och att normgrupperna är mycket
stora. Först funderade jag på BasIQ, men i och med att det används främst för urval och rekrytering
valde jag bort det även fast det till skillnad från APU, gjorts validitetsstudier på BasIQ. En annan brist
med APU är att det inte finns en enhetlig manual för hela testet.

Det saknas normgrupper för arbetslivet i allmänhet och polisyrket i synnerhet. Normgrupper
skulle ge en mer precis urvalsprocess. Å andra sidan tappas då viss bredd i gruppen som
väljs ut.

Frågetecken har satts för testets face validity, i detta fallet att rekryterna inte förstår/anser
att det är relevanta mätmetoder för yrket.

Egna reflektioner: Testet visar inte ex.omdöme, känsla för rätt och fel, social förmåga,
förmåga att ta snabba och rätt beslut etc. vilka är nödvändiga egenskaper i polisyrket.

Testet är helt allmänt, dvs ger inte utslag för olika bakgrunder/erfarenheter, vilket också kan
vara önskvärt inom polisyrket.
APU (arbetspsykologisk utredning) grundar sig på Thurstone’s sju intelligensfaktorer: Verbal
förståelse, verbal rörlighet, logiskt tänkande, numerisk förmåga, minne, spatial förmåga och
perception. Testet mäter följande: Logisk förmåga: Formlogik, sifferlogik, bokstavslogik Verbal
förståelse: Ordförståelse 1-2-3, ordförståelse 4-5 Verbal rörlighet: Associationsflöde, ordflöde
Perceptiv snabbhet, Numerisk förmåga, Matematisk förmåga och Simultankapacitet. Testet tar 5-10
min per deltest o 2,5 timme för hela batteriet.

Testet måste alltså kompletteras med ex. lämplighetsintervjuer och test i social förmåga.
• Beskriv testet BasIQ.
Det är lämpligt att använda BasIQ eller APU-testen i denna urvalsprocess. BasIQ består av nio
deltest med sammanlagt 150 uppgifter. Testet mäter framförallt en övergripande g-faktor men även
verbal, spatial och numerisk begåvning (enligt en hierarkisk begåvningsmodell). Det är alltså ett brett
spektrum som mäts, vilket kan vara intressant vid ett urval som detta. Ytterligare fördelar med BasIQ
är att det är lätt att administrera eftersom det kan administreras i grupp, att förberedelsetiden är kort
samt att det går snabbt att beräkna poängen (5 min). Manualen är även bra och tydlig. Nackdelar
med testet är att det inte finns några normgrupper som egentligen har relevans för arbetslivet,
eftersom testet normerats på främst studenter. Populationen är därför kanske inte helt relevant.
Information om prediktiv validitet saknas också. APU-testen är ett annat alternativ att använda i denna
urvalsprocess. APU-testen mäter maximal prestation inom sju olika områden. APU-testen är lätta att
administrera, dvs de kan administreras i grupp, kräver ingen förberedelsetid och poängberäkningen
tar endast 5 minuter, men hela testbatteriet tar 2,5 timmar totalt (jämför BasIQ som tar 1 timma).
Kanske behöver man dock inte utföra alla deltesten ur testbatteriet. Man skulle kunna välja att bara
använda de deltest som verkar mest relevanta för polisyrket, som t.ex. logisk förmåga, perceptiv
snabbhet och simultankapacitet (stresstolerans). Det finns alltså stor flexibilitet i hur man kan använda
testet. Ytterligare fördelar med testet är att det har hög reliabilitet, tack vare tydliga instruktioner till
deltesten. Dock kan det vara en svår uppgift att välja vilka test som är relevanta i olika sammanhang.
Hur pass viktig är t.ex. verbal förståelse i polisyrket? En annan svårighet med att använda APU-testen
är att validiteten är så dåligt dokumenterad. Det kan alltså vara svårt att veta vad man egentligen
mäter och vad resultaten egentligen innebär. (från Mabon sid 242 + Örjans häfte)
Testet ägs och distribueras av Assessio. Det mäter g-faktor, det mäter även verbal, spatial och
numerisk begåvning. Det utgår från en hierarkisk begåvningsmodell. Man får ett värde både på G och
på var och en av de andra underfaktorerna i vilket g-faktor-värdet är borträknat. Man måste inte vara
psykolog för att bjuda testet, men är man inte det måste man ha utbildning i basIQ.
Testet är främst avsett att användas i rekrytering och urval och på minst normalbegåvade vuxna.
BasIQ tar en timme att göra och det består av 9 deltest.
Det utvecklades ur en rad tidigare test från PA-rådet (personaladministrativa rådet, bildat av svenska
arbetsgivarföreningen) som baserades på 6 av Thurstones 7 faktorer och ett test som heter WIT III,
som ungefär täcker samma underfaktorer som basIQ, men är lite väl kort. Testen finns kvar men
deras prognostiska validitet har inte blivit undersökt. Ur dessa kunde man utvinna ett ganska kort test
som mäter begåvning på ett tillfredsställande sätt med är tillräckligt långt för att få tillfredsställande
reliabilitet. Man passade också på att utforma det efter en hierarkisk begåvningsmodell.
Kriterievaliditet för generell begåvning är ok(o.6) men inga andra faktorer fick signifikant korrelation.
Begreppsvaliditet för den hierarkiska modellen har i stort sett stöd, men den spatiala variabeln har
inte förväntad validitet. Både kriterievaliditet och begreppsvaliditet skulle behöva utforskas mer
utförligt.
Vad gäller reliabilitet är homogeniteten god(0.8<r<0.85) till utmärkt(r>0.85). Stabiliteten är tillräcklig(07<r<0.8).
Normeringen har dels gjorts på ekonomer dels sökande till en datautbildning och även på
psykologstudenter, ingenjörer och gymnasiestudenter. Det saknas alltså normering som
representerar ett bredare spektrum av arbetslivet.
Källa: Testhäftet och "Arbetspsykologisk testning" av H Mabon s.242

• Beskriv sammanfattande den hierarkiska
begåvningsmodellen och ett test som bygger på denna
modell. (Bläddra till s.23)
• Beskriv kortfattat ett test som mäter G-faktorn.
föreligger en funktionsasymmetri. SRB ingår i Dureman-Sälde batteriet och består av 15 deltest,
varav tre kärnkombinationer: verbal förståelse, logisk slutledningsförmåga och visuellt konstruktiv
förmåga. Varför detta test? Testkonstruktionen är väl genomtänkt, tydliga instruktioner finns,
manualen redogör för metodologiska problem när man jämför kliniska grupper med normalgrupper.
Många Validitetsstudier har gjorts på test som ingår i dureman-sälde batteriet vilket också bidrog till
att jag valde detta test. En brist är att det är svårt att sammanställa homogena kliniska grupper som är
tillräckligt stora utifrån ett diagnostiskt kriterium, ex vid hjärnskada. (häftet: testbeskrivningar)
Exempelvis BDI, Becks Depression Index. Detta är ett självskattningsinstrument för bedömning av
grad av depression samt förändringar i depressionstillstånd.
Styrka: Bra validitet. Svaghet: Saknar teoretisk grund. (Källa: testhäftet)
(Bläddra till s. 21).
• Beskriv AQT.
• Du har fått i uppdrag att vara behjälplig vid antagning
AQT (Assassment of Parietal Function)
av sökande till Polishögskolan. Du ansvarar för testdelen
i denna urvalsprocess. Det är ett mycket stor antal
personer som sökt. Vilket/vilka begåvningstest är det
lämpligt att använda? Beskriv för- och nackdelar med
det/de test du väljer. (Bläddra till s. 27).
* Bedömning av temporoparietala funktioner.
* Benämna olika stimulus (färg och form).
* 5 deltest.
* Identifiera avvikelser i hjärnans funktion. Vid misstanke om demens.
• Problem med att komma ihåg saker kan man ha lite till
• Förutom att SRB är en ko-ras så är det även ett test. Beskriv testet.
Kolla i testluntan. Roligt att svensk rödbrokig boskap fick plats på tentan. De väger ungefär 500 kilo
och har en relativt hög mjölkavkastning, 7500 kilo per år och har bättre protein- och fetthalter och
högre fertilitet än svensk låglandsboskap. Wikipedia och Jonas galna-ko sida.
SRB – Synonymer, reasoning and blocktest. Detta är ett kliniskt begåvningstest som mäter bade
allmän nivå och även skillnader mella verbal och icke-verbal förmåga. En funktionsassymetri mellan
verbal och icke-verbal förmåga är förknippat med missbruksrelaterade hjärnskador.
Testet består av SRB:1 – mental förståelse. 30 uppgifter som ska lösas på 7 min. Testpersonen får
höra ett ord och får sedan välja en synonym till ordet bland fem alternativ. SRB:2 – logisk
slutledningsförmåga. 30 uppgifter som ska lösas inom 8 min. För varje uppgift presenteras 5
geometriska figurer där fyra har logiskt samband. Testpersonen ska markera den femte, avvikande
figuren. SRB:3, Kohls block test – visuellt konstruktiv förmåga. 7 uppgifter där tiden varierar med
svårighetsgrad. Testledaren visar ett mönster på ett kort som ska återskapas med hjälp av olikfärgade
kuber. Det är på detta del-test som missbruksrelaterade hjärnskador kan upptäckas.
• Beskriv, kortfattat, ett test för att mäta maximal
prestation som är lämpligt att använda i i: - klinisk
verksamhet i samband med en utredning. Motivera ditt
val och ge en kort och översiktlig beskrivning av testet.
Diskutera kortfattat de styrkor och ev. brister hos det
test du valt.
Flera olika test kan användas, helt beroende på vilket funktionsområde man vill undersöka. Ett bra
test som används kliniskt, främst vid misstanke om neurologiska hjärnskador är SRB (synonymer,
reasoning and blocktest). SRB screenar för avvikelse i intellektuell funktionsnivå samt ger info om det
mans men beskriv ett test där man bl.a. mäter
minnesförmågan.
• Beskriv RCTF.
Rey Complex Figure Test and Recognition Trial används främst för bedömning av visuospatial
konstruktionsförmåga och visuospatialt minne samt för att skilja mellan olika typer av störningar som
kan påverka det visuospatiala minnet. Rey Complex Figure and Recognition Test (RCFT) är en
komplex abstrakt figur som ska ritas av, först med förebild och sen ur minnet med olika fördröjningar.
Testet kräver både planering och strategi samt
förmåga att analysera helhet i förhållande till delar. Det är normerat men kan även användas för en
kvalitativ bedömning. Det är särskilt värdefullt för att konstatera de svårigheter en person inom
autismspektrum kan ha att se och minnas helhet och sammanhang.
Syfte: Test för bedömning av visuospatial konstruktionsförmåga och visuospatialt minne
Ålder: 6-89 år
Administrering: Individuell
Används inom kliniska sammanhang för att få en fördjupad bild av störningar i det visuospatial
minnet.
(Källa; häftet från Örjan)
minnesförmågan.
• Beskriv WAIS.
Se testhäfte.
• Beskriv testet Claeson-Dahl.
Test för bedömning av inlärningsförmåga och minne hos vuxna 20-65 år. Designat för att kunna
analyseras efter ”Lurias principer”. Claeson-Dahl ökar möjligheten att differentiera mellan olika typer
av störningar. Testet baseras på en lista med ord som ska läras in och minnas för att på olika sätt
återges. I den svenska versionen mäts fyra olika aspekter av inlärning och minne:
1. Den aktuella listan med 10 vanliga ord läses upp för tp. Listan läses upp högst 10 ggr, och innan
varje gång ska tp uppskatta hur många ord han/hon kommer att komma ihåg. Varje gång listan läses
upp, ska tp först vänta 15 sek och sen säga de ord han/hon minns.
2. Efter 30 minuter ombeds tp att återge listan ur minnet.
3. Orden presenteras nu tillsammans med 2 andra, likvärdiga ord. Tp:s uppgift är att känna igen
orden från listan innan.
4. Avser att pröva minnet för ordningsföljd. Tp ombeds att numrera orden i den ordning de lästes upp.
Bedömningen görs efter: Inlärning, Hur många ord man TROR att man ska minnas (anspråksnivå),
Om 15 sek uppehåll följs, Yttre störning, Upprepningar, Feluttal, Felaktiga ord, sammanhanget
bedöms.
Föreligger det någon/några avvikelser i inlärningsförmåga och minne hos tp? Man kan m.h.a
resultatet påvisa eventuella hjärnskador och differentiera mellan dem. Tex kan anspråksnivån ge
ledtrådar om vissa hjärnskador. Det förekommer att en schizofren person lätt byter ordning på orden
när de ska återges. Analysen av testen kan göras både kvantitativt och kvalitativt. För den kvalitativa
bedömningen är testledarens kompetens av stor vikt.
Testet är extra känsligt för yttre störningar vid administration. Tp:s motivation, uppmärksamhet och
koncentration påverkar resultatet avsevärt.
4 likvärdiga versioner av testet finns för att undvika inlärning.
Reliabilitet: Stabiliteten utmärkt för inlärningsdelen, ej acceptabel för minnesdelen. Ingen information
om homogeniteten.
Validitet: Kriterierelaterade validiteten är god. Ingen data på begreppsvaliditeten.
minnesförmågan.
Ett maximalprestationstest som bl a mäter minnesförmågan är Claeson- Dahl. Se kompendium
”testbeskrivningar” för finfin beskrivning.
Claeson-Dahls test för bedömning av inlärning och minne. Det används vid neuropsykologiska
utredningar. Testet kontrollerar om det finns några avvikelser i inlärningsförmåga och minne hos
testpersonen. Testet kan påvisa eventuella hjärnskador och differentiera mellan dem. Exempelvis kan
en exekutiv störning märkas genom att man byter ordföljd efter varje uppläsning (se nedan) och
depression genom allmänt nedsatt minnesförmåga.
Claeson-Dahls omfattar fyra aspekter av inlärning och minne. Den första är att lära in en lista med 10
vanliga ord. Testanden uppskattar först hur många av de 10 orden han/hon kommer att minnas efter
uppläsningen sedan läser testledaren upp de tio orden en gång. Testanden ska efter viss fördröjning
återge så många av de tio orden från listan som möjligt. Detta upprepas tills dess att testanden minns
alla 10 orden men högst 10 ggr. Efter 30 minuters paus ombeds testanden återge orden listan ur
minnet, detta är testets andra del. Den tredje delen av testet består av rekognition vilket testas genom
att testanden ombeds känna igen de tio orden bland likvärdiga distraktorer. I testets fjärde del
ombeds testanden numrera orden i den ordning de lästes upp.
Claeson-Dahls bedömer följande variabler: inlärning, anspråksnivå, ej uppehåll, yttre störningar,
upprepningar, feluttal, felaktiga ord (enkla ord, kontamination, konfabulationer).
Om testledaren är väl förtrogen med testet behövs ingen förberedelsetid, bjudningstiden är en timme
inklusive 30 minuter för pausen mellan inlärning och retention. Poängberäkningen tar 30 minuter och
om testledaren har rätt kompetens kan testet även analyseras kvalitativt och inte enbart utifrån
uppnådd poäng.
Skalan på testet är normrelaterad, normeringarna är gjorda på universitetsstuderande samt
pensionärer på ett ålderdomshem uppdelade på utbildning, ålder samt kön.
Kritik mot testet är att det är känsligt för yttre störningar vid administration. Testpersonens motivation,
uppmärksamhet samt koncentration påverkar också testresultatet avsevärt. Diagnosen
minnesstörning bör endast ställas i kombination med andra tester. För tolkning o bedömning av
resultat och eventuell skada krävs kunskap i klinisk psykologi och professionell träning. Testet finns i
flera versioner för att inte inlärning ska påverka resultatet. Man bör kontrollera för utbildningsnivå då
den variabel som på verkar inlärning kan vara verbal inlärningsförmåga och inte minneskapaciteten.
• Beskriv Wisconsin Card Sorting testet.
WCST är ett neuropsykologiskt test som har som syfte att mäta individers exekutiva funktioner,
såsom abstrakt analytisk slutledningsförmåga, förmåga att skifta kognitiv strategi, strategisk
planering, målinriktat beteende, organsiserad avsökning, återkoppling från omgivningen och
anpassning till svarsimpulser. (Observera att testet inte mäter alla kognitiva funktioner!) WCST
innehåller 4 nyckelkort med motiven; 1 röd triangel, 2 gröna stjärnor, 3 gula kors, 4 blå cirklar. Dessa
kort representerar 3 stimuluskategorier (färg, symbol och antal). Tp har 64 svarskort som varierar
med avseende på just färg, symbol och antal och ska para ihop dessa svarskort med rätt nyckelkort
(utan att tp får några instruktioner för hur dessa ska paras ihop). Tl växlar sorteringsprincip så fort tp
har fullföljt 10 rätta svar i följd. Varje svar utvärderas i 3 dimensioner: rätt eller fel, oklart eller entydigt
(oklart=om svarskortet matchar stimulit på mer än en egenskap), perseverativt eller icke-perseverativt
(om man håller fast vid en strategi som man fått veta är fel).
Mätinstrumentet kan upptäcka olika typer av svårigheter för individer att lösa uppgifterna, som t.ex.
ineffektiv initial begreppsbildning, oförmåga att bibehålla sorteringsprincip, perseveration (hålla fast
vid dålig strategi) samt otillräcklig inlärning under testets olika faser. WCST används som en del i ett
testbatteri vid misstanke om dysfunktion i frontalloben. Testet ger en generell bild av funktionen och
måste alltid kompletteras med annan info (medicinsk, psykosocial info etc.). Det enda som testet med
god sensitivitet kan urskilja är just dysfunktion i frontalloben. P. med frontala skador får generellt
sämre resultat på WCST än p. med andra typer av hjärnskador. Ursprungligen användes testet på
normalpopulationen, men numera används det bara kliniskt. Validitet och reliabilitet beror till stor del
på testledarens erfarenhet av testet (eftersom poängräkningen är så krånglig!) samt kunskap om
neuropsykologi (för att kunna avgöra om en tp ens kan utföra testningen). (från overheads i
testväskan + örjans häfte)
• Wisconsin Card Sorting Test innehåller något i
testinstruktionen som är unikt för detta test. Vad är det
för något? Beskriv kortfattat idén bakom Wisconsin Card
Sorting Test och vad det avser att mäta.
Första delen av frågan besvaras endast. Andra delen hänvisar jag till testluntan.
Det som är unikt för WCST är att man inte berättar för testpersonen vad testet avser mäta. TP får
relativt förutsättningslöst göra testet. Själva testet skulle förlora sitt syfte om denna överraskning
försvann.
WCST är ett neuropsykologiskt test, det avser mäta analytisk slutledningsförmåga och de högre
verkställande funktioner som krävs för att utveckla och bibheålla en problemlösande strategi då
stimulusförhållandena ändras. Först testar man abstrakt slutledningsförmåga och sen testar man
förmågan att skifta kognitiv strategi när villkoren ändras.
Exekutiva funktioner som mäts är strategisk planering, organiserad avsökning, återkoppling från
omgivningen och apassninga till svarsimpusler. Det utvecklades från början för att testa ovanstående
i normalpopulationen, nu används det mest kliniskt. Testet är känsligt för dysfunktioner i
frontalloberna, men frontalloberna har flera funktioner som inte utvärderas av WCST, det är även så
att skador som påverkar funktioner i frontalloberna men inte är lokaliserade där påverkar resultatet i
WCST. MAn får alltså inte ett fullständigt mått på nedsättningen i frontalloberna och det mått man får
kan bero på en nedsättning av frontallobsfunktionerna orsakade av en skada i något annat område.
Det ska därför användas tillsammans med andra test som kompletterar det.
Det ovanliga i instruktionerna är att man inte talar om vad testet går ut på, man ger testanden
information om att den ska sortera korten som den tycker att dom passar ihop och att man kommer
att tala om ifall det blev rätt eller fel. Man ger alltås feedback och man mäter hur snabbt testanden
greppar den rätta strategin. När testanden kommit upp i tio efter varandra följande rätta svar så byts
strategi, t.ex. från färg till form. Då ser man hur snabbt testanden acepterar att den tidigare strategin
var fel och börjar söka efter den nya strategin, man ser även hur snabbt personen klurar ut den nya
strategin. Strategin är antingen symbol, färg eller antal.
Källa: Testhäftet
• Beskriv testet BKT – Bedömning av kritiskt tänkande.
BKT är en svensk version av ett amerikanskt begåvningstest. Med kritiskt tänkande menas förmågan
att kunna göra en saklig och logisk analys av ex slutsatser eller en argumentering, inte att vara
allmänt negativ. Även viss personlighetsmätning i form av att kunna frigöra sig från förutfattade
meningar. Används ofta för att mäta intellektuell förmåga på hög nivå inom arbetslivet, kvalificerade
befattningar, främst bedömning av ledarskapspotential. Mäter förmågan att objektivt och logiskt kunna
analysera en problemställning utan att låta sig styras av subjektiva föreställningar och förutfattade
meningar. Består av fem delstest.
1.
härledning, att värdera härledningar utifrån givna fakta
2.
identifiera antaganden, att utifrån olika påståenden identifiera vilka antaganden som kan
eller inte kan göras
3.
slutledning, att bedöma vilka slutsatser som kan eller inte kan dras utifrån viss information
4.
tolkning, att bedöma vilka tolkningar som kan eller inte kan dras utifrån viss information
5.
värdera argument, bedöma vilka argument som är starka och relevanta respektive svaga
och icke relevanta för vissa frågeställningar.
Det finns svenska normdata för BKT.
• Beskriv Ravens matriser.
Ett icke-verbalt begåvningstest. Mäter generell begåvning. Den mäter specifikt hur bra man uppfattar
en helhet utan att ha alla delarna.
Standard Progressiva Matriser (SPM):60 uppgifter fördelat på fem set (A-E). Testet består av olika
geometriska figurer som grupperats i rader och kolumner, där den sista figuren saknas. Testpersonen
skall avgöra utifrån ett antal givna alternativ vilken den sista figuren skall vara.
Coloured Progressiva Matriser (CPM): De 24 enklaste uppgifterna från SPM samt 12 till. Skillnad är
att figurerna är färgade för att behålla uppmärksamhet hos testperson.
Advanced Progressiva Matriser (APM): Svårare än SPM. Avsedd för de personer som slår i taket på
SPM. Består av två delar: 48 uppgifter totalt.
Utöver dessa har det även gjorts ett antal parallell- och plus- versioner av Ravens. Detta för att
Ravens är väl använt och om det finns risk för att en person redan gjort testet kan man använda
någon av de här andra versionerna.
Användning
Används vid urval, del av diagnostisering av schizofreni, identifiering av demens och utv.störning,
utredning i skolsammanhang samt forskning.
Poäng
Normrelaterad skala. Råpoäng – antal rätt.
Administrering
Lätt utan förberedelse. Ingen tidsgräns. Ca fem min. för poängräkning.
Homogenitet: bra. Stabilitet: bra.
Testet anses vara oberoende av kultur, kön och ålder.
• Beskriv kortfattat ett test som mäter G-faktorn. (Se s.
21)
• Du skall utföra en begåvningsutredning av en vuxen
person med en icke svensk kulturell och språklig
bakgrund. Beskriv vilket/vilka test du kan tänka dig att
använda för detta ändamål och diskutera dess styrkor
och svagheter samt varför du väljer just detta/dessa test.
(Se s. 25)
Välj lämpliga test
• Du har nyligen använt WAIS i en utredning. Din klient klarar
deltesterna i performanceskalan tillfredsställande men har överlag
låga prestationsnivåer på deltesten i verbala skalan. Du nöjer dig inte
med att enbart konstatera detta utan vill gå vidare med ytterligare
test. Vad vill du, i det här läget, komplettera WAIS med? Vad väljer du
för typ/typer av test och varför? Ge exempel!
Test för att mäta typiskt utförande
Allmänt om test för att mäta typiskt utförande
• Vad finns det för- och nackdelar med personlighetstest? Vilka
användningsområden kan vara lämpliga? Vad kan man generellt
säga om testens validitet resp. reliabilitet t.ex. i jämförelse med ett
begåvningstest?
Ja ni pojkar. Detta är ju en svår fråga. Jag har kikat i alla häften jag har, men inte hittat något bra. Det
står säkert i Kaplan, men jag hittar det inte.
Jag gjorde en liten ovetenskaplig sammanställning utifrån testhäftet, för att undersöka vad man
använder testen till. Såhär såg det ut.
Personlighetstest (TU)
Begåvningstest (MP)
Urval:
4st
5st
Kliniskt:
6st
6st
Teambuilding etc.:
2st
Detta säger ju precis ingenting! de används till i princip samma saker, förutom att vissa av
personlighetstesterna egentligen inte kan användas till någonting, och därför hamnar i kategorin
"teambuilding etc." (ex. Myers-Briggs). Men om jag ska slänga in lite egna antaganden så blir det så
här: Ett personlighetstest kan oftast inte normeras på samma sätt som begåvningstest, eftersom det
(ofta) inte rör sig om jämförelser människor emellan. Därför borde i alla fall validiteten bli lägre en för
ett begåvningstest med fina normeringar. Jag vet inte. Jag får återkomma med ett bättre svar
senare...
Jämfört med annan individbedömning som t.ex. en djupintervju har personlighetstester fördelen att de
är enkla och snabba att använda och att de är mer objektiva. En nackdel med de personlighetstest
som utgörs av självskattningsskalor är att det ofta går att lista ut vad man ”borde” svara, d.v.s. vilket
svar som är socialt önskvärt. Projektiva personlighetstest är svårare att manipulera svaret på, men
dessa test är å andra sidan svårare att tolka.
För att lösa problemet med social önskvärdhet är många personlighetstest som används i Sverige
ipsativa. Detta medför dock andra problem, i och med att ipsativa test inte kan jämföras mot en
normgrupp. Man kan också korrigera för social önskvärdhet genom matematiska metoder och
kontrollskalor.
En annan nackdel när det gäller personlighetstester som bygger på faktoranalys (t.ex. de som
bygger på Big 5) är att de bara visar på samband eller frånvaro av samband, de säger ingenting om
riktning eller underliggande faktorer.
När det gäller urval och rekrytering har begåvningstest visat sig vara bra på att förutsäga
arbetsprestation inom nästan vilket område som helst. Det räcker alltså ofta med ett mått på den
generella g-faktorn. Personlighetstest kan dock vara bra för att sålla ytterligare efter att aspiranterna
gjort begåvningstest. Personlighetstest har fördelen att de kan mäta egenskaper som är viktiga för ett
specifikt arbete, t.ex. kanske ett jobb kräver att man är väldigt utåtriktad medan ett annat jobb passar
bättre för någon som är mer inåtvänd. (Å andra sidan har vissa begåvningstest också sådana
uppdelningar, t.ex. APU).
Metaanalyser har visat att intelligens är den variabel som tydligast är relaterad till yrkesframgång
men att personlighet också är av betydelse och svarar för ca 25% av det prognosvärde som
begåvningstest ger. Eftersom begåvningstest och personlighetstest inte överlappar varandra höjs
validiteten om man gör både sorterna i en testsituation. Enligt studien som tjejen från Assessio
presenterade är den prediktiva validiteten för ett personlighetstest ca 0,41 medan den är 0,51 för
begåvningstest. Allra bäst prediktiv förmåga har arbetsprover. När det gäller reliabiliteten brukar den
ligga på över 0,90 för intelligenstest, 0,65-0,85 för personlighetsformulär och 0,40-0,80 för projektiva
test.
Sammanfattningsvis kan man säga att personlighetstest är ett bra komplement till intelligenstester i
rekryteringssammanhang. Vissa tester, som t.ex. Gordons och MBTI, passar dock inte för urval
eftersom de inte är normativa. Dessa kan exempelvis användas i teambuilding och karriärsrådgivning.
Det finns också personlighetstest som används i kliniska sammanhang, t.ex. Beck Depression
Inventory och KSP. De kan ge värdefull information om en patients personlighetsdrag och vara till
hjälp vid diagnostisering.
Man kan läsa mer i Mabon s. 247-251, häftet som heter Psykologiska testmetoder, handouts
föreläsning 1&2 samt i Assessios handout och i Sjöbergs artikel s. 4-12. Reliabilitetssiffrorna har jag
fått från Fhanér s. 80.
• Vid användning av personlighetstest är det viktigt att ta hänsyn till
hur uppriktiga och ”sanna” svaren är. Detta har man försökt lösa på
olika sätt. Diskuterar hur detta problem kan hanteras med exempel
från några personlighetstest. Ange minst två (2) olika metoder.
Det vill säga social önskvärdhet och annan dissonans i svaren, framförallt vid test som mäter typiskt
utförande. Detta kan mätas enligt Sjöberg genom responstidsmätning i dataprogrammerade test.
Responstid tycks vara användbar som ett sätt att begreppsligt validera traditionella lögnskalor.
I andra test kan man titta på om svarsstilarna inom samma skala korrelerar. Frågor i testet kan
återkomma eller ställas på olika sätt (motsatta, dvs. ”Jag älskar glass” och ”Jag har svårt för glass”).
En tredje metod finns i NEO PI-R som avslutas med en validitetskontroll i form av tre frågor som rör
svarsstil. Det kontrollerar för nejsägare, instämmande svarsstil och slumpmässiga svar.
Källa: Sjöbergs kompendium s. 27, Mabon s. 375, Testbeskrivningar
Här pratar vi social önskvärdhet och annan dissonans i svaren, framförallt vid test som mäter typiskt
utförande. Detta kan man mäta enligt Sjöberg genom responstidsmätning i dataprogrammerade test.
Responstid tycks vara användbar som ett sätt at begreppsligt validera traditionella lögnskalor.
I andra test kan man titta på om svarsstilarna inom samma skala korrelerar. Frågorna i testet kan
komma upp igen eller ställas igen på ett annorlunda sätt(motsatta, dvs ”Jag älskar barn” och ”Jag har
svårt för barn”).
I NEO PI-R avslutas testet med en validitetskontroll i form av tre frågor som rör svarsstil. Här kan man
titta efter nej-sägare, instämmande svarsstil och slumpmässiga svar.
Källa: Sjöbergs kompendium s. 27, Mabon s. 375, Testbeskrivningar
• Det finns några olika typer av personlighetstest som skiljer sig åt
bl.a. avseende dess härledning dvs. vad testen grundas på (teori,
modell etc.). Ge exempel på test med olika typer av grundfundament
dvs. vad de bygger på och beskriv hur de skiljer sig åt.
Personlighetstest kan vara lämpliga att använda i kliniska sammanhang för att exempelvis kartlägga
patientens emotionella status. Personlighetstest kan också bidra till självkännedom och personlig
utveckling. Personlighetstest kan vara projektiva eller bestå av självskattningsskalor. De allra
vanligaste idag består av självskattningsskalor.
Projektiva test
Testledaren ställer inte frågor till testpersonen utan konfronterar denne med mångtydiga stimuli och
ber denne tolka eller reagera på dessa. Ingen standardisering eller instruktion finns att tillgå.
Resultatet bygger på testledarens subjektiva bedömning då testpersonen projicerar tankar och
känslor och föreställningar om livet på det stimuli som visas. Detta är sedan upp till testledaren att
tolka. Exempel på sådana personlighetstest är TAT och Rorschach. Dessa test har ofta sin grund i
personlighetsteorier av klassiskt snitt såsom Jung och Kelly. Används ofta kliniskt, men även i
yrkesmässiga sammanhang. Det finns en risk att man sätter för stor tilltro till testresultaten, speciellt
om man inte är utbildad testledare. Man bör se resultatet som en hypotes som bör testas vidare. Alla
sidor av personligheten, kanske inte kommer fram i testsituationen.
-
Oberoende
-
Självkontroll
16 PF har en god reliabilitet och validitet och sägs användas som riktmärke för andra test. Det är
även lätt att administrera och ger en bra bild av personligheten på två plan genom användandet av
primärfaktorer (16 st) och globalfunktioner (5 st). Testet kontrollerar även för social önskvärdhet.
NEO PI-R
Är ett personlighetstest för normalpersonligheten på vuxna. Det är också urtypen för
femfaktorinventorier.(Big five)
Testet består av 5 bipolära skalor: känslomässig instabilitet, utåtriktning, öppenhet, vänlighet och
målmedvetenhet. Till dessa hör 6 stycken aspektskalor. Inventoriet är främst avsett för tillämpning i
kliniska sammanhang för att få en fördjupad bild av personligheten men kan även användas i
urvalssammanhang.
*HPI – Hogans Personlighetsinventorium
Testet är utvecklat av Robert Hogan och grundar sig på femfaktorsmodellen men med en utvecklad
version med sju primära personlighetsskalor;
-
Anpassning
-
Ambition
-
Sällskaplighet
-
Sympatiskhet
Självskattningstest
-
Ordentlighet
Dessa mäter personlighetsdrag genom att tp får fylla i frågeformulär om hur den är och hur den
reagerar i vissa specifika situationer. Dessa test utgår ofta från modeller som menar att den
grundläggande personligheten är biologiskt betingad eftersom det finns vissa specifika
personlighetsdrag som finns i alla kulturer. Man har kommit fram till dessa personlighetsfaktorer
genom faktoranalys. Dessa test skiljer sig från projektiva eftersom det inte kräver någon tolkning av tl
och eftersom de grundar sig på en modell istället för en teori. Tl räknar ihop svaren enligt ett bestämt
sätt och får på så sätt en uppfattning tp:s personlighet. Används ofta för att mäta normalpersonlighet
och i yrkessammanhang, men ibland även kliniskt. Exempel på självskattningstest är 16 PF, NEO PIR och HOGANS.
-
Intellektans
-
Studiehåg
Nackdelar med självskattningsskalor förutsätter att den som skattar sig själv, tolkar frågan eller
påståendet, som det ursprungligen var menat. De förutsätter också att den svarande är ärlig, samt är
kapabel att skatta sig själv. Resultatet bygger på den svarades subjektiva bedömning.

16 PF – The 16 Personality Factors Questionnaire
Testet bygger på Cattells sextorn personlighetsfaktorer. Cattell menade att man kunde beskriva
personligheten på ett uttömmande sätt via 16 faktorer man har sedan upptäckt att dessa 16 faktorer
kan sammanfattas till fem övergripande sk. globala faktorer nämligen:
-
Extraversion
-
Ångest
-
Hårdförhet
HPI är avsett att användas enbart inom arbetslivet och innefattat då även sex delskalor som visar
lämplighet för olika yrken.
Testet har en bra dokumentation gällande validitet, reliabilitet, användbarhet och normer.
HPI är lätt att administrera.
Testet NEO PI R kategoriseras av Kaplan som ett test framtaget med s k combination strategy (att
jämföra med the logical-content s 353, the criterion-group s 355, the factor analytic s 367 och the
theoretical strategy s 371). Detta innebär att konstruktion av testet, det vill säga konstruktion av items
och skala, baseras på faktoranalys och personlighetsteori (Kaplan s 378-379). Denna strategi kan
jämföras med MBTI (Myers-Briggs TypeIndicator), vilket enligt ovanstående kategorisering skulle
beskrivas som baserat på s k theoretical strategy. Testets teoretiska fundament är dock kritiserat,
exempelvis menar Sjöberg (s 14) att testet ”bygger på Jungs spekulationer” och att ”Jungs egen
empiri var undermålig och delvis bedräglig”.
Källa: Kaplan s 378-379 och Sjöberg, Personlighetstest i arbetslivet: historik och aktuell forskning, s
14.
• Ett s.k. personlighetstest eller personlighetsstörningstest bör aldrig
utgöra det enda underlaget för att avge ett utlåtande om en person
eller ställa en diagnos. Diskutera kortfattat varför detta inte är
lämpligt.
”Agreeableness”: Godmodig – Irritabel; Oavundsjuk – Avundssjuk; Mild – Envis; Samarbetsvillig – Negativ
Man vet utifrån forskningen att personlighetstest inte är så tillförlitliga att man kan basera en
diagnosticering enbart på dem. När det gäller självskattningsskalor sa Örjan på sin föreläsning att det
är vanligt vid kliniska test att patienter överdriver eller underdriver symptom. Han nämnde också att
man aldrig bör dra en s.k. ”trait- slutsats” utifrån att en person skönmålar sig själv vid en
personlighetstestning. Det skulle alltså vara att man antar att personen är en lögnare när det enda
man egentligen vet om honom är hur han hanterar ett testformulär! När det gäller projektiva test som
exempelvis Rorschach har forskningen visat att det inte finns några bevisade samband med psykiska
sjukdomar eller symptom. Personlighetstest/personlighetsstörningstest kan vara bra för screening
men är aldrig tillräckligt tillförlitliga för att användas ensamma som underlag för någon som helst
slutsats.
(Passer & Smith, s. 422)
Personligheten är inte bestående utan beroende av situationen. Det finns t.ex. inte någon
grundläggande egenskap hos en människa som gör henne tillbakadragen, hon väljer utifrån tillfälle
hur hon vill uppfattas. Detta är en kritik mot personlighetstestning som framförts av bl.a. Mischel, se
sida 67 Mabon.
E0 EXTRAVERSION-UTÅTVÄNDHET
Ytterligare kritik är att personlighetstest i hög grad kan besvaras socialt önskvärt, dvs att testpersonen
förställer sig för att verka t.ex. mer/mindre utåtriktad än vad han/hon egentligen är. Denna förställning
gäller förstås inte enbart social önskvärdhet utan testpersoner med önskan om att få en viss profil kan
manipulera sig till ett resultat som inte står i relation till hur dennes personlighet ser ut ”på riktigt”.
Egen slutsats.
O0 ÖPPENHET FÖR NYA ERFARENHETER
Kritik som bör framhållas är att kriterierna vilka personligheten bedöms utifrån är hypotetiska
konstruktioner och bör således inte sväljas som sanningar. Utredande samtal och mer kvalitativa
bedömningar av testpersoners personlighet är av stort kompletteringsvärde till dessa test. Testhäftet
om GPI och egna slutsatser.
• Vad ingår i Eysenck´s ”Giant Three”?
I Eysenck´s trefaktor teori ingår följande biologiskt förankrade personlighetsdrag: Extraversion (E),
Neuroticism (N) samt Psykoticism (P).
• Vad ingår i Big Five?
Big Five är en modell av personligheten som består av fem, från varandra tämligen fristående
faktorer. På svenska kallas dimensionerna: Känslomässigt välanpassad, utåtriktad, empatisk,
plikttrogen och öppen för nya idéer (Den positiva änden av skalorna). Big Five grundar sig inte på en i
förväg fastställd teori om personlighetens struktur, utan på ett konstaterande att när människor fyller i
självskattningsformulär rörarande olika sätt att uppleva och bete sig i arbetslivet så tenderar dessa
fem faktorer framträda (Mabon, s. 70). ”Big Five” utkristalliserades alltså genom faktoranalys och
faktorerna anses vara universella för människan. På engelska heter dimensionerna (Ung.
översättning.)
”Openness”: Artistiskt känslig - Artistiskt okänslig; Intellektuell- oreflekterande; Slipad - Oslipad; Fantasirik –
Enkel
”Conscientiousness”; Ordningsam - Vårdslös; Ansvarstagande – Oberoende; Samvetsgrann – Skrupelfri;
Ihärdig – Ger upp lätt
”Extraversion”: Pratsam – Tyst; Öppen – Hemlighetsfull; Äventyrlig – Försiktig; Social – Tillknäppt
”Neuroticism”: Balanserad – Nervös; Lugn – Orolig; Samlad – Hetsig; Stabil – Instabil
Som vi har lärt oss i tidigare kurser är ”Big five” enkel att minnas genom den förnämliga akronymen:
OCEAN.
BIG FIVE – PersonlighetsProfil är ett multidimensionellt personlighetstest. Detta test bygger på
utveckling av tester som baseras på analys av lexikaliskt material. Man har studerat
språkanvändningen inom flera språk när det gäller hur man beskriver personligheten. Denna
lexikaliska analys har man bearbetat med statistiska metoder varpå fem faktorer framstår som
generella faktorer. De FEM FAKTORERNA är:
N0 EMOTIONELL STABILITET
A0 VÄNLIGHET-BEHAGLIGHET
C0 MÅLMEDVETENHET-ANSVARSKÄNSLA
De fem faktorerna har vidare 6 FACETTER som redovisas tillsammans på ett profilkort. Utökad
rapport ger vidare möjlighet att utvidga testresultatet till en kompetensprofil där upp till 54 vanliga
kompetenser i arbetslivet sammanställs i de fall de förekommer hos testanden.
• Beskriv ett test som helt eller till viss del bygger på Big
Five modellen.
Testet NEO PI R baseras delvis på Big Five-modellen. Se kompendium ”testbeskrivningar” för
beskrivning.
NEO PI-R, testet är främst avsett för tillämpning i kliniska sammanhang för att få en fördjupad bild av
personligheten men kan även användas i urvalssammanhang.
NEO PI-R™ omfattar de fem faktorerna: Känslomässig instabilitet (N-skalan), Utåtriktning (E-skalan),
Öppenhet (O-skalan), Vänlighet (A-skalan) och Målmedvetenhet (C-skalan). Var och en av de fem
faktorerna innefattar egenskaper som avgränsar varje faktor, så kallade aspektskalor. Till var och en
av faktorerna hör sex sådana aspektskalor.
Såväl faktor- som aspektskalor är bipolära; det vill säga att såväl höga som låga poäng tolkas.
Syfte: Personlighetsinventorium
Ålder: Vuxna
Administrering: Grupp eller individuell
(Källa:Assessio och Örjans häfte).
• Beskriv Catell´s 12 faktormodell (som testet 16PF bygger på).
Detta är den personlighetsteori som har flest personlighetsfaktorer av alla personlighetstest. Testet är
framtaget med ett lexikalisk metod vilket innebär att man faktoranalyserat fram adjektiv ur ett lexikon.
Det finns 16 stycken personlighetsfaktorer som Raymond Cattell kommit fram till genom faktoranalys.
Catell menade på att dessa 16 personlighetsaktorer var de primära, i motsats till big-5 som han
menade bestod av 5 globala faktorer där hans 16 gick att inplacera som mer specifika sub-grupper.
Slutsatsen att dessa 16 var sub-grupper drog han då han konstaterat att samtliga 16 korrelerar med
de 5 globala. De globaka faktorerna är extraversion, ångest, hårdförhet, oberoende och självkontroll.
Testet innehåller också tre stycken svarsstils-skalor för att bedöma svarens validitet. Den mäter social
önskvärdhet, ovanliga svar och instämmande svar. 16 pf används främst i urval och rekrytering, emn
även vid karriärsplanering och yrkesrådgivning. Man kan säga att den ger en bild av personligheten
på två plan då den dels uppvisar de primära faktorer, dels uppvisar de globala faktorerna.
Jag har pratat med en vän i T6, dom skrev bara om 16pf på den här frågan då de ej hittat info om "12
faktorsmodellen". Jag vet faktiskt inte vad 12-faktorsmodellen skulle innebära, men jag kollar lite mer
imorgon och uppdaterar på lunch om jag förstår nåt mer.
Exempel på test
• Beskriv 16PF testet.
16PF (16 PersonlighetsFaktorer) bygger på Cattells sexton personlighetsfaktorer och är ett
internationellt välkänt personlighetstest för bedömning av olika grundläggande drag i personligheten.
Lättadministrerat och finns datoriserat. Det används framför allt för urval, ledar- och
medarbetarutveckling samt karriärplanering. Testet är konstruerat utifrån faktoranalys av ett stort
antal personlighetsbeskrivningar. Med utgångspunkt i närmare 18 000 personlighetsbeskrivande
adjektiv, utformade Raymond Cattel 16 grundläggande personlighetsdrag, vilka utgjort basen för
konstruktion av skalorna.
Testet har 16 primära bipolära skalor (dvs. både höga och låga poäng har betydelse):
Värme (reserverad - varm)
Emotionell stabilitet (reaktionsbenägen - emotionellt stabil)
Dominans (undfallande dominant)
Livlighet (allvarlig - livlig>
Regelmedvetenhet (opportunistisk - regelmedveten)
Social dristighet (blyg - socialt dristig)
Känslighet (krass - känslig)
Vaksamhet (tillitsfull - vaksam)
Förströddhet (förankrad - förströdd)
Tillbakadragenhet (rättfram - tillbakadragen)
Oro (självsäker - orolig)
Öppenhet för förändringar (traditionell - öppen för förändringar)
Självtillit (grupporientering - självtillit)
Perfektionism (tolererar oordning - perfektionistisk)
Anspändhet (anspänd - avspänd)
Slutledningsförmåga
Oberoende (tillmötesgående - självständig)
Självkontroll (ohämmad - självbehärskad)
Det finns en rad svarsstilsskalor som bl.a. mäter socialönskvärdhet i svaren.
Detta test anses i svenska normer mätt vara mindre validt om man tittar på metodens prognostiska
värde i arbetslivet. Forskning pågår och bl.a. Assessio använder sig i nuläget av testet. Det finns dock
få replikerade studier av Cattels synsätt gällande dessa personlighetsfaktorer.
Källa: Testbeskrivningar, Mabon sid 256 samt Assessios hemsida
• Beskriv ett test som bygger på en personlighetsmodell
som innehåller fler än 5 faktorer.
16 pf (personality factors questionnaire) är ett personlighetstest som är baserat på Cattells 16
personlighetsfaktorer. Testet avser att mäta grundläggande personlighetsdrag i urval och rekrytering
(mäter normal personlighet) men kan även användas vid karriärsplanering och yrkesrådgivning.
Testet består av 16 primära och bipolära skalor som balnd annaat ”värma”, ”livlighet” och ”dominans”.
Testet har vidare 5 globala faktorer som är extraversion, ångest, hårdfördhet, oberoende och
självkontroll. I testet finn även tre svarsstilskalor som mäter social önskvärdhet, ovanliga svar och
instämmande svar. Testet är lätta att administrera och ger en bild av personen på två plan genom att
använda både primära och globala faktorer. 16 pf predicerar karriärsmässig kompetens,
förhållningssätt gentemot andra, tankestil, arbetssätt och stresshantering.
• Beskriv kortfattat ett test där faktoranalys använts vid
konstruktion av testet.
Ett bra expempel är Catells 16PF – Sixteen Personality Factor Questionnaire. 16PF utvecklades
genom en lexikalisk metod där engelskans alla adjektiv som kan användas om människor bearbetats
faktoranalytisk för att kategorisera dessa adjektiv. Syftet var att identifiera grundläggande
personlighetsdrag. 16PF var bland de första testen som utvecklades med faktoranalytiska tekniker.
Idag används används faktoranalys i utvecklingen eller valideringen av i stort sett alla större test.
• Beskriv HPI (Hogans).

HPI – Hogans Personlighetsinventorium
o
Beskrivning: Avsett att mäta ”normal personlighet” vid urval och rekrytering.
Består av sju primära skalor; Anpassning, Ambition, Sällskaplighet, Sympatiskhet,
Ordentlighet, Intellektans och Studiehåg (även en validitetsskala och sex
yrkesskalor; Serviceinriktning, Stresstolerans, Integritet, Administrativ potential,
Försäljarpotential och Chefspotential)
o
Styrkor:
De 16 primära skalorna kan kombineras till 5 globala skalor som ger en mer allmän och bredare bild
av personligheten i termer av:
Extraversion (extravert - introvert)
Ångest (oberörd - lättoroad)
Hårdförhet (mottaglig - hårdför)
o

Lätthanterligt

God reliabilitet

Relativ god validitet (i jämförelse med personlighetstest i allmänhet)

Svensk normgrupp (endast normalbefolkning)
Svagheter:

Krävs bättre bevis ang. kriterierelaterad- och begreppsvaliditet.


Krävs fler svenska normeringar med gedignare normgrupper

Diskussioner förs om huruvida big 5 är det lämpligaste sättet att kategorisera dimensioner av
personlighet. Samt om kategorierna håller över kulturer.
• Vid användning av personlighetstest är det viktigt att ta
hänsyn till hur uppriktiga och ”sanna” svaren är. Detta
har man försökt lösa på olika sätt. Diskuterar hur detta
problem kan hanteras med exempel från några
personlighetstest. Ange minst två (2) olika metoder. (Se
sid 37!)
• Beskriv, kortfattat, ett test för att mäta typiskt
utförande som är lämpligt att använda i en
rekryteringsprocess t.ex. vid chefsrekrytering? Motivera
ditt val och ge en kort och översiktlig beskrivning av
testet. Diskutera kortfattat de styrkor och ev. brister hos
det test du valt.
B) I valet mellan Hogans och Gordons valde jag Hogans, enda anledningen för att Hogan har
normerad skala och därför finns möjlighet att jämföra med andra sökande eller med
normeringsgrupper. Användning av Gordons ställer därmed högre krav på analysen, då det saknas
normeringsgrupper.
Hogans mäter "normal personlighet" i sju primära skalor och sex yrkesskalor. Homogenitet och
stabilitet är tillräcklig. Kriterievaliditet är acceptabel och begreppsvaliditet är god. HPI är vidare enkelt
att administrera. Dock saknas bra svenska normeringsgrupper för yrkeslivet.
Vid en genomläsning av karaktäristiken verkar Gordons bättre om man inte jämför sökande med
varandra. Ex Gordons dimension ascendancy förutsäger enligt test chefs- och ledarframgång. Jag
stödjer mig dock på pm:et som säger att Gordons är olämpligt i rekryteringssammanhang om
jämförelser ska göras.
• Beskriv NEO PIR.
• Beskriv ett test som helt eller till viss del bygger på Big
Five modellen. (Igen!)
Ett personlighetstest som baseras på självskattning av grundläggande personlighetsdrag i
normalpersonligheten hos vuxna (16 år o uppåt). Det visar hur du bedömer dig själv ur olika aspekter.
Testet är främst avsett för att användas i kliniska sammanhang för att få en fördjupad bild av
personligheten, men kan även användas i urvalssammanhang.
Baseras på big 5 och mäter:
-känslomässig instabilitet
-öppenhet
-vänlighet
-målmedvetenhet
-utåtriktning
Materialet består av frågehäfte och svarsblankett. Testet består av 240 items, med tre validitetsfrågor
i slutet (tex: ”Har du besvarat alla frågor ärligt”?). Fem olika svarsalternativ på varje påstående, från
”stämmer mkt bra” till ”stämmer inte alls”. Hälften av alla items har vänd poängsättning. Tolkningen är
icke-ipsativ. Dvs, en persons testresultat jämförs mot en vald normgrupp. Råpoängen görs om till Tpoäng som läses av i tabell. Tillgång finns till svensk normdata.
• Beskriv BDI.
Beck depression index är ett självskattningstest för bedömning av grad av depression. Det kan även
användas för att se förändringar i depressionstillstånd. Det konstruerades utifrån observationer av
deprimerade patienter och utifrån deras symtombeskrivningar. Testet mäter flera olika symtom som
testpersonen ska skatta utifrån hur denne har känt sig den senaste veckan. Skuldkänsla självförakt,
obeslutsamhet, aptitförlust, socialt tillbakadragande och självmordstankar är exempel på faktorer som
skattas. Ju fler poäng man får totalt sett på testet, desto mer deprimerad bedöms man vara. Testet
ska alltid kompletteras med en klinisk intervju. I de låga poängen finns en risk för att svaren har varit
lite förskönande, alltså att personen faktiskt är mer deprimerad än den uppgett, och därför ska man
vara extra uppmärksam i bedämningen av dessa resultat.
Begreppsvaliditeten är god(.65<r<.75)
BDI har hög inre konsistens i både kliniska(.86) och icke kliniska populationer(.81).
Källa: Testhäftet.

• Beskriv, kortfattat, ett test för att mäta typiskt
utförande som är lämpligt att använda i klinisk
verksamhet i samband med utlåtande, diagnostik och
behandlingsplanering? Motivera ditt val och ge en kort
och översiktlig beskrivning av testet. Diskutera kortfattat
de styrkor och ev. brister hos det test du valt.
A) BDI. Beck är ett av världens mest använda självskattningsinstrument för att bedöma grad av
depression. (förutsätter då att man misstänker depression hos patienten) Det kan också mäta
förändringar i tillstånd. Det är vältestat, tar kort tid och är lätt att administrera.
Beck är därför lätt att använda flera gånger för att ex. utvärdera behandling. Testet är normerat på
många personer, men borde normeras i fler grupper för bättre jämförelsematerial.
Testet anger graden av depression och vilka attribut som depressionen består av, ex. aptit,
självförakt, skuldkänslor etc. Testet ger därför ett underlag för ev medicinsk behandling och vilka
områden som kan vara aktuella för terapeutisk/psykologisk behandling.
Sammanfattningsvis är testet väl underbyggt, lätt att upprepa och ger möjlighet att diskriminera
delar av attributen depressionen visar upp.

depression.
• Beskriv ett test som avser att mäta graden av
Hur mycket har Du besvärats av:
Förslagsvis BDI. Se testbeskrivning.
• Beskriv BAI.
Självskattningstest för att bedöma grad av ångest. Innehåller 21 påståenden/symtom vilka skattas på
en fyragradig skala utifrån svårighetsgrad. BAI utvärderar fysiologiska och kognitiva ångestsymtom.
Man tolkar resultatet mot framtagna gränsvärden.
Måste vara leg. psykolog, leg. läkare eller leg. psykoterapeut för att få använda.
• Beskriv SCL 90.
The Symptom Checklist-90-R (SCL-90-R) är ett självskattningsinstrument som kan hjälpa till att
utvärdera ett brett spektrum av psykologiska problem och psykopatologiska symptom. Instrumentet är
också användbart för att mäta framsteg hos patienter och behandlingsresultat.
SCL-90 är ett ofta använt självskattningsinstrument avsett att mäta fysiskt och psykiskt hälsotillstånd
senaste veckan. Flera olika översättningar har använts och någon svensk standardisering, normering
och validering har inte funnits. Skalan har i avsaknad av svensk normering vanligtvis utvärderats efter
utländska normer. Vidare visar resultaten att de i SCL-90 ingående skalorna differentierar
tillfredsställande mellan normal- och patientmaterial och vissa diagnosgrupper, men räcker inte till att
predicera olika syndrom. Skalan kan således inte användas ensamt som diagnostiskt instrument.
Testet kan vara användbart vid: Initial bedömning av patienter vid inskrivning som en metod att skatta
symptom; Mätning av patientframsteg under och efter behandling för att beskriva förändring; Mätning
av resultat av behandlingsprogram och hos vårdgivare genom aggreggerad patientinformation
;Kliniska försök som stöd att mäta förändringar av symptom som depression och ångest.
SCL-90 kan användas för personer från ca 13 år och uppåt. Formuläret består av 90 påståenden om
hur man har besvärats av psykiska och fysiska symptom de senaste 7 dagarna, som skattas på en 5gradig Likert-skala från "Inte alls" till "Väldigt mycket".
Instrumentet mäter 9 primära dimensioner av symptom och det är utformat för att presentera en
överblick av en patients symptom och deras intensitet vid en specifik tidpunkt. Låga värden betyder
att man har god psykisk hälsa. Symptomskalor:
Somatisering. Hur man upplever kroppsliga obehag (om ev eventuell hypokondri kan föreligga).
Tvångssymptom. Man känner sig tvungen att tänka vissa tankar eller upprepa vissa beteenden.
Interpersonell känslighet. En överdriven känslighet för andras beteenden eller förändringar i
omgivningen
Depression. känslor eller upplevelser av nedstämdhet.
Ångest. Man har starka känslor av panik eller obehag.
Aggressivitet, fientlighet. I vilken utsträckning man hyser aggressiva känslor mot andra.
Fobisk ångest. Man undviker specifika situationer som man upplever som obehagliga.
Paranoida föreställningar. Man känner sig förföljd eller hotad.
Psykoticism. Ens förställningsvärld är förvirrad eller splittrad.
Genom att instrumentet ger en överblick av symptomens svårighetsgrad kan det användas för att
underlätta beslut i behandlingen och för att identifiera patienter innan problemen blir akuta.Observera
att SCL90 inte är ett diagnostiskt instrument, den slutsats man kan dra är om respondenten tillhör den
aktuella patientgruppen eller inte.
1. Huvudvärk
Ganska
Väldigt
mycket
mycket
3
4
2. Nervositet eller inre oro
3
4
3. Återkommande tankar, ord eller 0
4
Inte
Lite
Måttligt
alls
grand
0
1
2
0
1
2
1
2
3
1
2
3
mycket
idéer som Du inte kan göra Dig fri från
4. Svimningskänsla eller yrsel?
4
0
• Beskriv KSP.
KSP (Karolinska Scales of Personality) är ett personlighetstest som syftar till att kartlägga hur en
person känner sig och fungerar i olika sammanhang. Användningsområde är i prekliniska och i
kliniska sammanhang, dvs det är ett test som utreder personlighetsstörningar hos individer. KSP är
ett formulär med 135 påståenden (med 4 svarsalternativ till varje påstående) som mäter 15 delskalor
(psykisk ångest, somatisk ångest, muskelspänning, impulsivitet, monotoniundvikande, socialisation,
social desirability, psykasteniskalan, distans, misstänksamhet, skuldkänslor, hämmad aggressivitet,
indirekt aggressivitet, verbal aggressivitet, irritabilitet). Resultatet på formuläret kan ge info om vilka
områden som kan vara viktiga att gå vidare med i en behandling. KSP kan oxå i
forskningssammanhang ge info om vilka aspekter av personligheten som har ett samband med en
viss problematik.
Fördelar:
- billigt och lättadministrerat.
- det finns en skala för att mäta social önskvärdhet
Brister:
- bristande normering
(från örjans häfte)
• Beskriv SSP.
(Källa Örjans häfte samt testgenomgången)
Swedish University Scales of personality - SSP är en vidareutveckling av KSP (karolinska scales of
personality). Det är således ett typiskt utförande test som används prekliniskt och kliniskt med syfte
att kartlägga hur personen känner sig och fungerar i olika sammanhang. KSP utvecklades för att testa
personlighetsstörning hos alkoholister men nu används både KSP och SSP till att mäta
sårbarhetsfaktorer hos individer även i andra sammanhang. SSP har 13 skalor vilket är två mindre än
KSP. Kan användas för att få information om hur man ska gå vidare med behandling. Då KSP fått
kritik för bristfälligt urval vid normeringen har en ny och bättre sådan gjorts för SSP.
• Beskriv MMPI-2.
Det här blev ett mycket långt svar men tyckte det behövdes eftersom det inte står något om testet i
testbeskrivningen och jag tror inte att så många av er kollade på det.
Minnesota Multiphasic Personality Inventory är en självskattningsskala där man ska svara om
påståenden stämmer eller inte stämmer. Exempel på items är ”Jag blir arg ibland”, ”Jag tycker om att
flörta”, ”Jag skulle tycka om en bibliotekaries arbete”, ”För det mesta önskar jag att jag vore död”.
Som ni förstår av att påståendena skiljer sig så mycket från varandra består MMPI-2 av många olika
delskalor. Man kan dela upp skalorna i kontrollskalor, kliniska skalor och tilläggsskalor.
Kontrollskalorna ger information om testpersonens inställning till testningen, exempelvis om han
försökte fuska sig till ett sämre resultat genom att fylla i fler skalor med patologiskt innehåll än vad
personens verkliga problem rättfärdigar. Man kan också få reda på om en person fuskar sig till ett
bättre resultat. De kliniska skalorna skapades för att identifiera psykiska sjukdomar som depression
och schizofreni.
Syftet med MMPI-2 är att särskilja de som har emotionella störningar från normalpopulation (konstigt
formulerat kanske, i boken står det distinguishing normal from abnormal groups), testet skapades för
att hjälpa till vid diagnosticering eller utredning av psykiska sjukdomar. Testet används fortfarande
mestadels i detta syfte men tydligen även vid rekrytering eftersom en av våra föreläsare pratade om
det. Som kliniskt instrument ska MMPI alltid användas i kombination med andra utvärderingsmetoder,
man kan inte diagnosticera enbart baserat på testresultatet.
Skalorna utvecklades redan på 1940-talet genom att man utgick ifrån 1000 items som valts ut ur
fallstudier, psykologiska artiklar, läroböcker etc. utifrån dessa valdes 504 items ut som bedömdes
vara relativt oberoende av varandra. Skalorna skapades sedan empiriskt genom att man testade alla
item på en kriterie- (psykiatriska patienter inom slutenvården) och en kontrollgrupp (patienternas
anhöriga samt besökare på sjukhuset). Kriteriegruppen delades upp i åtta grupper beroende på
diagnos, därifrån skapades de åtta kliniska skalorna.
MMPI-2 blev klart 1989, 567 items och tar mellan 1-2 timmar att genomföra. Skillnaden är framförallt
att man genomfört ny standardisering men även att man tagit bort en hel del item och lagt till nya. Nya
kontrollskalor har även lagts till.
Skalorna: Kliniska: Hypokondri, Depression, Hysteri, Psykopati, Maskulin- Feminin, Paranoia,
Psykasteni, Schizofreni, Hypomani samt Social Introversion (las till senare).
Kontrollskalor: L- skalan, K-skalan, F-skalan,?-skalan, VRIN-skalan, TRIN-skalan, Fb-skalan. Jag tror
det är överkurs att veta vad alla de här betyder men om ni vill:
http://psychology.about.com/od/psychologicaltesting/a/mmpi_3.htm
Reliabiliteten är helt ok men det finns vissa problem man inte tog itu med när MMPI-2 skapades.
Skalorna överlappar varandra i väldigt hög grad varför de korrelerar med varandra, något som inte är
bra för testets validitet (kan man verkligen utläsa olika mönster hos testpersoner?) Ändå varierar
reliabiliteten mellan skalorna väldigt mycket, alpha mellan.32-.90. Begreppsvaliditeten är hög, man
har genomfört fler studier på MMPI än på något annat personlighetstest, exempelvis har många
studier visat att testresultat kan kopplas till alkohol- och drogmissbruk, det verkar alltså som att man
kan hitta personer som löper risk att bli alkoholister med detta test.
• Beskriv MBTI (Myers-Briggs).
Blir ganska mycket repetering från häftet om testen, men i en lite kortare version.
Testet bygger på C-G Jungs teori om psykologiska typer och kategoriserar människor till en av de två
polerna i dessa fyra motsatspar: Extroversion-Introversion (EI), Sinnesförnimmelse-Inuition (SN),
Tanke-Känsla (TF) och Bedömning-Perception (JP). Det kan då bli 16 olika preferensprofiler, vilken
profil man blir beror på hur man svarar på olika påståenden. Man menar att kombinationen visar
personliga preferenser, att det är vägledande i hur man utformar sitt liv i stort och att testet är bra för
självkännedom. MBTI används vid förändringsarbete i organisationer och företag, t.ex. teambuilding,
ledarutveckling och karriärplanering. Kan användas både enskilt och i grupp.
Försöker besvara frågeställningar som t.ex. hur man uppfattar sin omvärld, hur man löser problem
och hur man kan förväntas reagera under stress.
MBTI har i vissa delar en ipsativ itemkonstruktion och i vissa delar en normativ konstruktion.
MBTI är inte ett normativt test.
Som ni säkert alla har läst i häftet så skriver Örjan där att MBTI kanske inte kan fungera som något
mer än ett ”underhållande sällskapsspel”. Han skriver att om det nu utger sig för att bidra till
självkännedom så måste begreppsvaliditetet förbättras för det finns inga vetenskapliga belägg för
detta. Eftersom testet inte är normrelaterat så bör det inte användas i rekrytering och urval, eftersom
man då jämför individer och det kan man inte göra med detta test.
• Beskriv GPI (Gordons).
Gordons personlighetsinventorium mäter egenskaper och värderingar hos normalbefolkningen. Det
var ett av de första allmänna personlighetstesten inom det arbetspsykologiska området och har varit
ett av de mest använda personlighetstesten i Sverige. Inventoriet består av tre delar: GP:A, GP:B och
GP:C som man kan använda var för sig om man vill. GP:A mäter åtta personlighetsegenskaper som
t.ex. ansvar, känslomässig stabilitet, försiktighet och originellt tänkande. GP:B mäter sex
nyckelvärderingar i arbetslivet så som praktiskt sinnelag (värderar att få ”valuta för pengarna”) och
ordentlighet (värderar att saker och ting är på rätt plats). GP:C mäter sex mellanmänskliga
värderingar, t.ex. stöd (värderar att bli vänligt och hänsynsfullt bemött) och självständighet (värderar
att kunna göra saker och ting på sitt sätt).
Gordon utgick från studier av bland andra Cattell när han utformade del A. När del B & C
utarbetades baserades de på andra forskares arbete om vad som anses karakteriskt i olika
sammanhang. Eftersom det som alltid med självskattningar finns en risk att testpersoner väljer det
svar som är mest önskvärt, ville Gordon se hur individer värderade olika alternativ relativt varandra.
GPI är därför indelat i olika block med antingen negativa eller positiva svarsalternativ. Svaren är av
s.k. forced-choicekaraktär, exempelvis kan individen tvingas välja vad den värderar mest/minst av
några alternativ, som alla egentligen är positiva egenskaper.
När ett test på detta sätt har ett fast antal poäng som fördelas över olika dimensioner, är testet
ipsativt. Vid ipsativa tester kan man inte göra normativa jämförelser, det enda resultatet säger är hur
en viss person har rangordnat sina preferenser. Gordon har ändå försökt göra så att testet går att
jämföra mellan individer, varför det heter att GPI är kvasi-ipsativt. Det innebär att Gordon försökt lösa
problemet med ipsativitet genom att i varje block om fyra ange två positivia och två negativa
egenskaper, då finns det flera alternativ och därmed olika tänkbara poängsummor. Detta gör enligt
Mabon att man kan tillämpa statistisk analys på ett helt annat sätt än vid ipsativa tester. Örjan verkar
mer kritisk och säger att eftersom GPI är ipsativt ska det inte användas i situationer där man jämför
individer, alltså t.ex. ska det inte användas i urvals- och rekryteringssammanhang.
Kriterievaliditeten för flera av GPI:s variabler är utmärkt (>0,55). Ingen information finns gällande
begreppsvaliditeten. Homogeniteten är OK (0,7 – 0,8). Det finns ingen information om stabiliten.
Man kan läsa mer i häftet Testbeskrivningar och i Mabon s. 251-253.
Barntest
Allmänt om barntest
• I Smedlers bok diskuteras tre olika tillvägagångssätt för
individualdiagnostiska utredningar av barn: a. metodorienterad
utredning, b. problemorienterad utredning, c. utredning mot befintlig
behandling. Beskriv arbetsgången i dessa tre.
a) Smedler (1993, s. 25) skriver följande:
”Vid en metodorienterad utredning har man ett standardbatteri med test som man administrerar vid i
stort sett alla individualdiagnostiska utredningar. Man gör sällan några ändringar eller tillägg. Att ha ett
standardbatteri har förstås fördelen att psykologen är väl bekant med de ingående testen. Det
förbättrar reliabiliteten och gör det möjligt att göra finstämda observationer i testsituationen.
Testresultaten kan också tolkas på ett nyanserat sätt, då psykologen har en rik klinisk erfarenhet med
dessa test att utgå ifrån. En metodorienterad utredning riskerar dock att bli något mekanisk, och de
ingående testen kanske inte är särskilt väl ägnade att spegla just det här barnets centrala
problematik. Metodiken har på förhand begränsat vilka diagnostiska frågeställningar som kan
formuleras. Kopplingen till behandling är inte heller given.”
b) Smedler (s. 25-26) fortsätter så här:
”Vid en problemorienterad utredning använder man ingen förutbestämd metod, utan utgår från den
preliminära bild av problemet man skaffat sig i utredningens inledande skede. Med denna som
utgångspunkt formulerar man hypoteser om vad kärnproblematiken kan tänkas vara. Detta bör göras
så brett och förutsättningslöst som möjligt. Kanske inställer sig frågor kring barnets allmänna mognad
(sensorimotoriskt, kognitivt, emotionellt, socialt). Man kan komma att uppmärksamma tecken på
avgränsade förseningar eller funktionsstörningar. Frågor kring tidiga relationsstörningar kan väckas.
Kanske uppstår frågor kring barnets kommunikativa förmåga, språkutveckling, uppmärksamhet och
koncentrationsförmåga. Ibland finns det somatiska inslag i problembilden, och man kan behöva
utreda om det rör sig om ett psykosomatiskt uttryck. Andra gånger vill man få undersökt om det finns
en somatisk grund för det psykiska symtomet. Listan på tänkbara arbetshypoteser kan göras lång,
men själva poängen är att den knappast kan göras heltäckande. Man utgår från vad man hittills vet
om just detta barn, och formulerar sina arbetshypoteser så förutsättningslöst som möjligt. Dessa
prövas sedan stegvis under utredningen, och till sin hjälp tar psykologen bland annat test.”
c) Slutligen skriver Smedler (s. 27) detta:
I en ”utredning riktad mot befintlig behandling vill man få klarhet i om barnet kan tänkas vara hjälpt av
det man har att erbjuda. Arbetssättet kan dock slå snett, som i följande exempel: man ’hittar’ ett barn
som erbjuds en obesatt plats i en nedläggningshotad specialförskola. Utredningen har varit ganska
ensidigt inriktad på att få stöd för att just detta barn skulle behöva den speciella förskoleplaceringen,
istället för att mera förutsättningslöst undersöka barnets behov”.
• I barnkliniskt utredningsarbete kan man använda sig av
bl.a. en metodinriktad arbetsgång, eller göra en mer
probleminriktad utredning. Beskriv och jämför skillnader
och likheter.
Vid metodinriktat utredningsarbete har man ett standardbatteri med test som man administrerar vid i
princip alla utredningar. Man gör sällan några ändringar eller tillägg. En fördel med detta arbetssätt är
att psykologen är van att använda dessa test, vilket förbättrar reliabiliteten i bedömningarna. Om
psykologen är bekant med testen behöver heller inte lika mycket fokus läggas på att koncentrera sig
på att administrera på rätt sätt, utan det finns möjlighet att göra nyanserade observationer under
testningen. Även tolkningen av testresultatet blir mer nyanserad när psykologen har stor erfarenhet av
testet. Det som talar emot en metodinriktad arbetsgång är bland annat att man på förhand begränsar
de diagnostiska frågeställningar som kan formuleras. Det testbatteri man valt att använda kanske inte
passar ett visst barns problematik. Det metodinriktade arbetssättet riskerar alltså att bli allför
mekaniskt.
Vid problemorienterad utredning har man ingen förutbestämd metod utan utgår från den
preliminära bild av problemet man skaffat sig under utredningens första del. Med denna problembild
som utgångspunkt formulerar man hypoteser om vad kärnproblematiken kan tänkas vara. Man utgår
från det specifika barn man vill utreda och försöker vara så öppen och förutsättningslös som möjligt
för att inte snäva in sig. Hypoteserna kan t.ex. handla om ifall det finns somatiska inslag i
problembilden, ifall det finns relationsstörningar eller kommunikationsstörningar. Dessa hypoteser
testas sedan under utredningens gång och utefter vilka frågeställningar som bekräftas gör man upp
en plan för behandling. Nackdelen med detta arbetssätt är att ingen psykolog kan behärska alla
sorters test och det är svårt att vara helt objektiv i en utredning. Tar man emellertid modellen med en
nypa salt och inser att man inte kan kunna allt, så är det enligt Smedler ett bra sätt att arbeta på.
Det finns också något som heter utredning riktad mot befintlig behandling, vilket går ut på att få
klarhet i ifall barnet kan dra nytta av någon av de behandlingsformer man har att erbjuda. Denna
metod kan dock vara riskfylld, som i Smedlers exempel där man har en plats över på särskolan och
”hittar” ett barn som man erbjuder denna plats. Utredningen kan i detta fall ha varit ensidigt inriktad på
att få stöd för att barnet skulle dra nytta av särskoleplats, istället för att mer förutsättningslöst titta på
barnets behov.
Läs mer om detta i Smedler s. 25-28.

• Jämför testning av barn med testning av vuxna, framförallt med
avseende på själva testsituationen och på de slutsatser man kan dra
av resultaten på testet.
Hjärnan är plastisk. Barn befinner sig i ständig och dynamisk utveckling. Ju yngre barn desto mera
uttalat blir detta. Eftersom testteoretiska begrepp som är gängse vid testning av vuxna bygger på ett
antagande om relativ stabilitet finns här omedelbara implikationer för testning av barn. För att kunna
dra slutsatser utifrån resultaten måste därför hänsyn tas till detta. Ju yngre barn som testas desto
svårare blir det att hitta exempel på egenskaper som är stabila ens i ett kortare perspektiv. För att
kunna använda sig av resultaten på testningen krävs det att många barn inom alla åldersintervall som
man har för avsikt att täcka prövas. Testningen kräver också utvecklingspsykologiska överväganden i
utformandet av testmaterialet. Den slutgiltiga normeringen kräver alltså ett oftast långt mer
omfattande standardiseringsarbete än vad fallet är inom vuxenområdet. Eftersom kraven för att ett
barntest ska bli bra är större finns det få barntest som är av god psykometrisk kvalitet (Smedler s. 1517).
av vuxna också men är kanske än mer viktigt när man testar barn. Om barnets förälder är med ska
denne informeras om hans/hennes roll under testningen.
Enligt Smedler är det rimligt att uttala sig om vad barnet kan må väl av och ha för behov under
det närmaste året. Hon skriver också att tidiga tecken på utvecklingsavvikelser i allmänhet är ganska
diffusa. Och det som hos ett barn var ett tidigt tecken kan hos ett annat spontant försvinna. Det går
alltså inte att tvärsäkert uttala sig om den individuella utvecklingen (Smedler sid128-130).
Sammanfattningsvis krävs kanske en större försiktighet när testledaren drar slutsatser om barnets
resultat än vad som är fallet vid vuxentestning.
Under tiden när testet bjuds ska testledaren vara uppmärksam på kontakten med barnet för att barnet
ska känna sig trygg i situationen och kunna kommunicera vid behov. Det är också bra att vara
uppmärksam på om barnet tröttnar, tappar koncentrationen eller verkar känna sig obekväm. En god
kontakt ger även större möjligheter till andra observationer under testningen.
Trots detta är testning av barn vid utredningar faktiskt mer vanligt än vad testning vid
vuxenutredningar är. Anledningen är enligt Smedler att intervju som är det vanligaste sättet att utreda
vuxna på inte passar lika bra för barn. Barnet blir ofta stelt i en intervjusituation. Om man istället leker
med barnet är det mycket vanligare att barnet spontant väljer att på sitt sätt berätta om dagens
händelser. Ett test kan fungera som ett kontaktmedel och ge viktig information av en förutbestämd art.
En testsituation med barn blir oftast mindre stram men också mer rik på information än när vuxna
testas. Detta kan bero på att barnet ofta uttrycker sig mera spontant, och utöver det namngivna
innehållet i testet får man i regel en vidare inblick i barnets sätt att vara. Enligt Smedler uttrycker
barnet sin personlighet i sättet att relatera till testledaren och hur han/hon handskas med materialet
och frågorna. Även omvänt framskymtar ofta barnets intellektuella mognad även i en
personlighetstestning (Smedler, s. 11-12).
Barn är inte lika förutsägbara som vuxna och kan inte inhibera sina impulser såsom "normala" vuxna
kan, detta ställer högre krav på testledaren. Det är mycket viktigt att etablera en god kontakt med
barnet och vidare att hålla barnet intresserad och motiverad att göra sitt bästa på en specifik uppgift,
det har visat sig att kontakten/personkemin med testledaren spelar stor roll för prestationen hos barn.
Detta gäller framförallt under ett begåvningstest. Det är självklart extra viktigt att vara bekant med
materialet och testet som sådant så att man kan koncentrera sig till fullo under testets gång,
observation är nämligen extra viktig under barntester. Tänk på att testsituationen med all sannolikhet
är mycket konstig för barnet. Vid tolkning av testresultatet måste man vara försiktig då barnet ju hela
tiden förändras och att resultatet som man fått fram kanske inte är representativt om en vecka. Barn
utvecklas ofta i etapper och avvikanden från det "normativa" resultatet kan vara helt i sin ordning,
man bör alltså komma ihåg att en ojämn testprofil kan vara helt ok nån vecka senare. Man skall även
vara försiktig med att "stämpla" barnet då en diagnos kan resultera i att barnet blir bemött på ett annat
(inte alltid positivt) sätt av både vuxna och andra barn. Dagsformen hos ett barn är dessutom mer
ombytligt och fragilt än för den "normativa vuxne", barn är även känsligare för faktorer så som sömn,
mat och allmänt psykiskt tillstånd.
• Att testa barn ställer speciella krav både på testledaren och på
själva testsituationen. Beskriv och motivera varför, samt vad man
som testledare speciellt bör tänka på.
Smedler s. 65.
Eftersom barn inte har samma förståelse som en vuxen inför en testsituation är det viktigt att
testledaren etablerar en bra kontakt med barnet innan testningen påbörjas. Det finns ingen
standardiserad procedur för detta men det man vill uppnå är en samarbetssituation, barnet bör vara
informerat om att man ska arbeta tillsammans en stund och att testledaren håller i tyglarna. För att det
inte ska bli onödiga störningar i testningen ska man se till att sitta ostört, gäller visserligen vid testning
• Vad bör du enligt Smedler vara extra uppmärksam på i själva
testsituationen, när du ska testa ett barn?
Det är viktigt att vara uppmärksam på kontakten med barnet under hela testningen. Den bör inte vara
nära och påträngande, men man bör ha koll på hur bekvämt barnet känner sig i situationen, och om
han/hon känner sig fri att kommunicera med dig. Man observerar inte bara själva testresultaten utan
också hur barnet handskas med uppgiften och situationen i sin helhet. Smedler listar en lång rad
faktorer som man ska vara observant på i testsituationen. De övergripande rubrikerna är: kontakt,
barnets attityd till testningen, förhållande till testsituationens krav (tex uppmärksamhet), arbetssätt,
språk, visuomotorik (barnets motorik) och yttre faktorer. (smedler, s 66-69)
• Ett problem med barntest gäller den s.k. prediktiva validiteten. Ge
exempel på hur det visar sig, och resonera kring varför den
prediktiva validiteten ofta är låg. (Se sid. 4)
• Ange fördelar och nackdelar med mer eller mindre strukturerade
testsituationer vid testning av barn. Beskriv gärna med exempel.
Mer strukturerade testsituationer har sina fördelar i att reliabiliteten blir hög. Om allt är ordningsställt
likadant och manualer följs till punkt och pricka kan man också försäkra sig om att mätsäkerheten blir
hög. Andra fördelar är att man som testledare för strukturerade test bara behöver lära sig följa
”körschemat”, som Smedler uttrycker det. När man känner sig hemmastadd med materialet är det
bara att testa på. Förberedelserna kan sägas vara av handfast karaktär. Problemen uppstår när man
inser att barn inte är robotar och reagerar väldigt annorlunda på testsituationer. Vissa kanske tycker
att det är helt ok att sitta med en vuxen som pratar konstigt och inte svarar på frågor man som barn
ställer, medan andra upplever det konstigt och olustigt och därav presterar sämre.
Projektiva test, som är ostrukturerade, bereder problem av en lite annan karaktär. De är så fria och
öppna att det ibland kan kännas som att det inte går att skapa en testsituation - och om det går- var
går gränserna för denna? Vidare kan barnet kan bli ganska berört av materialet och situationen,
därför kan det kännas svårt att utföra testet utanför en klinisk situation eftersom man då inte får
möjlighet att följa upp kontakten.
Fördelar med ostrukturerade test är just framsidan av problemen. Den fria situationen främjar ett
aktivt och ohämmat beteende hos barnet som inte behöver förställa sig eller känna sig obekvämt. På
så sätt är ostrukturerade mätningar att föredra. Exempel får ni fundera ut på egen hand. Smedler sida
79-80.
Jag hittade inte det här så jätteklart någonstans, men plockar lite varstans för att få ihop en bild.
Nackdelar: Man får räkna med mindre tålamod och är mer oberäknelighet än de flesta vuxna.
Situationer man inte räknat med kan dyka upp (som kisspaus, vägran, prat om annat etc.) under
testsituationen. Man bör också vara medveten om att testsituationen kan göra så att barnet beter sig
helt annorlunda än vad hon egentligen gör. Resultaten kan därmed bli missvisande många gånger.
Därför är det viktigt att titta på barnets beteenden från många olika synvinklar (observationer av olika
slag eller andra tester).
Barn förstår inte alltid testsituationen och kan t.ex. fråga testledaren om svaren vilket man bör undvika
att svara på, både pga. övningseffekt och för att inte göra situationen prestationsladdad.
Fördelar: Strukturerad testing ger svar på många frågor som man ev. har. Om testet har hög validitet
så kan det ge mycket för barnets skolgång och allmänna leverne.
Exempel på barntest
• Beskriv testet Griffith. (Test för barn som är 0-2 år)
Systematiska observationer av små barns beteenden och beteendeförändringar över tid. Två
versioner finns: 0-2 år samt 2-8 år. Oftast testas barnet i hemmiljön med en förälder närvarande.
Testsituationen tillåts vara väldigt flexibel. De olika momenten: Testuppgifter, observationer samt
information från föräldrarna sker på ett väldigt fritt sätt. Detta gör att individuella skillnader även hos
testledaren i hög grad kan påverka resultatet. Friheten gör också att testsituationen blir föga
standardiserad.
Man mäter 5-6 olika aspekter av ett barns utveckling. Antalet delskalor är beroende av barnets ålder.
(0-2 5st, 2-8 6st)
-Motorik
-Personligt och socialt beteende
-Hörsel och tal
-Samordning av öga och hand
-Performance (handskas med föremål, klossar och pussel)
-Praktiskt resonerande (2-8år, kunna klockan, veckans dagar, upprepa sifferserier mm)
Bjudningstid: 15-60 min beroende på ålder.
Testet används tex vid misstanke om cp-skada
Griffiths är utformat efter systematiskt genomförda observationer och testet vilar följaktligen inte på
ngn särskild utvecklingsteoretisk modell. Eftersom testet saknar teoretisk grund, är därav en
begreppsmässig validitetsbedömning omöjlig.
Reliabilitet: Korrelationer mellan deltesten är höga (0.60 – 0.90), men genom detta kan man inte
heller säga att delskalorna faktiskt mäter olika aspekter av ett barns utveckling.
Validiteten är ofullständigt redovisad. Begreppsvaliditet är inte möjlig, eftersom ingen prövbar teori
ligger till grund för testet.
• Beskriv ett test som kan användas för att studera
utvecklingen hos en 1-åring. Motivera ditt val och
diskutera kortfattat de styrkor och ev. brister hos det
test du valt.
Jag tror att Griffiths utvecklingsskala I fungerar ganska bra. Det är det enda testet i testhäftet som
används för att bedöma utvecklingen hos så pass unga barn som ett år, och därför finns det inte så
mycket att välja på.
Styrkor: Vokalt beteende mäts redan i tidig spädbarnsålder. Svensk normering finns. Ger möjlighet till
flexibel utformning av testningen (kanske är detta samtidigt en svaghet?).
Svagheter: Vilar inte på någon teoretisk modell. Gammal normering. Inga bevis på validitet eller
reliabilitet. (Källa: testhäftet)
Griffiths utvecklingsskala I passar till att testa så här pass små barn, det är Sveriges mest använda
test för bedömning av barn i förskoleåldern. Testet administreras oftast i hemmamiljö och inleds med
en intervju med föräldrarna. I manualen betonas det att det är viktigt att etablera en god relation till
både föräldrar och barn. Det kan t.ex vara bra att ta små lekpauser om barnet verkar trött på
uppgiften. Utifrån barnets beteende och attityd i testrummet avgör psykologen vilken av delskalorna
som är lämplig att börja med. Man kan även hoppa vidare från en skala till en annan om barnet verkar
ha lessnat på den föregående. Samma uppgifter och material återkommer på olika åldersnivåer med
ökad svårighetsgrad. Griffiths skala I som ju är den vi använder på så här små barn är uppdelad i 5
delskalor (A-E) Den består av 226 uppgifter, 156 för de första 12 månaderna och 104 för åldrarna 1224 månader. Testet är en vidareutveckling på Gesell och Buhler-Hetzers tester. Griffih har utformat
testet vidare genom sina systematiskt utförda observationer och testet vilar följdaktligen inte på någon
särskild utvecklingsteoretisk modell. Detta är det enda testet som har med vokalt beteende från tidig
spädbarnsålder.
Varje delskala är avsedd att belysa en speciell aspekt av ett barns utveckling. Delskalorna är de
följande;
A-Motorik
B-Personlighet och socialt beteende
C-Hörsel coh tal
D-Samordning av öga och hand
E-Performance
Om man t.ex. misstänker att barnet har en CP-skada så studerar på vilken utvecklingsnivå barnet
befinner sig i de fem delskalorna. Skalan är normrelaterad. Antalet rätta uppgifter summeras och en
månadsnivå räknas ut för var och en av de fem delskalorna. Utvecklingsåldern för varje delskala får
man genom att summera månadspoängen i varje kolumn i sammanfattningstabellen. Resultaten
räknas om till staninepoäng och prickas in i ett profilschema, vilket visualiserar "toppar och dalar".
Griffith´s är ett test som är tidskrävande att lära sig och kräver omfattande material. En van
användare behöver dock bara förberedelsetid för intervjun men föräldrarna. Griffiths har ganska svag
dokumentation av psykometriska egenskaper och inga eller svaga bevis för reliabilitet, validitet. En
del talar för att man som erfaren barnpsykolog skulle kunna göra en likvärdig bedömnin utan att
administrera testet. En av styrkorna med testet är just att den mäter verbalt beteende från tidig ålder.
Testets flexibilitet då det anbelangar testlokal är å ena sidan positivt, å andra sidan negativt. Testet
ger en ram och måttstock för testledaren i dennes bedömning och underlättar kommunikationen kring
resultaten över tid. Den prediktiva validiteten är.40 vilket kan tyckas lågt, men liknande reultat är
vanliga inom barntester. Testet saknar också teoretisk grund och därav är en begrppsmässig mätning
av validiteten omöjlig.
• Vilket/vilka test kan du använda för att bedöma
utvecklingen hos ett 15 månader gammalt barn? Beskriv
kortfattat. Vad kan du närmare studera och vilka
slutsatser kan du dra?
Ett alternativ är Griffiths utvecklingsskala I som används för barn i åldrarna 0-2 år (Griffiths skala II är
för barn i åldrarna 2-8 år). Testet för ett 15 månader gammalt barn består av 104 uppgifter fördelade
på fem delskalor (A-E). A – motorik, B – personligt och socialt beteende, C – Hörsel och tal, D –
samordning av öga och hand, E – Performance. Testet ger en uppfattning om barnets utvecklingsnivå
inom de olika områdena och används t ex vid misstanke om cp-skada. En stor fördel med detta test
är att det är flexibelt då det gäller administreringen, det är exempelvis valfritt vilken skala man börjar
med och det är tillåtet att hoppa mellan skalorna om barnet blir uttröttat och okoncentrerat. En annan
styrka med Griffiths är att det mäter verbalt beteende från tidig ålder. Enligt testbeskrivningshäftet ger
det huvudsakligen en ram och måttstock för testledaren i bedömningen samt möjlighet till jämförelser
över tid. Det underlättar också kommunikationen kring resultaten. Den prediktiva validiteten mellan
Griffiths skala I och II är dock relativt låg och bevisen för reliabilitet och validitet är för övrigt få. Detta
gör förstås att slutsatser om utvecklingsnivån inom olika färdighetsområden bör dras med stor
försiktighet.
I övrigt är det svårt att hitta test för barn under tre år. Möjligtvis skulle Bayles utvecklingsskalor
kunna användas. En student som tidigare läst kursen skriver: ”Alternativet är att använda Bayles
utvecklingsskalor som består av tre delar : mental scale, motor scale och infant behavior record. En
styrka är att färdighetstesterna kompletteras med en personlighetsbedömning och att testet har god
reliabilitet och validitet och därför är ett bra instrument i forskningssammanhang. Tyvärr är inte skalan
normerad i Sverige.”
• Beskriv Griffiths utvecklingsskala II kortfattat. (Test för barn som är
2-8 år)
Är ett instrument för utvecklingsbedömning för barn 2-8 år. Det är det i Sverige mest använda testet
för utvecklingsbedömningar av barn i förskoleåldern. Griffiths utvecklingsskala II består av sex
delskalor A-F som alla avser att belysa en speciell aspekt av ett barns utveckling. Dessa delskalor är
motorik, personligt och socialt beteende, hörsel och tal, samordning av öga och hand, performance
och praktiskt resonerande. Bedömningen görs ofta i hemmiljö med en förälder närvarande. Först görs
en intervju av föräldern och i manualen betonas hur viktigt det är att skapa en god relation till både
förälder och barn. Testledaren väljer själv i vilken ordning delskalorna administreras grundat på
bedömningen av barnets attityd och beteende i testrummet. Man kan även hoppa mellan skalorna
t.ex. om barnet blir trött. Samma uppgifter och material återkommer på olika åldersnivåer med ökad
svårighetsgrad. Har svaga bevis rörande validitet, reliabilitet, användbarhet och normer men skapar
goda förutsättningar för kontakt med barnet och tillfällen till allsidig observation och bedömning.
• Jämför Griffiths med WISC när det gäller själva testsituationen och
testledarens roll.
Griffiths´Developmental scale är en utvecklingsskala som bygger på systematiska observationer av
små barns beteenden och beteendeförändringar över tid. Det finns två delar, en för åldrarna 0-2 år
och en för åldrarna 2-8 år. Bedömningarna görs oftast i hemmiljö med en förälder närvarande.
Turordningen på uppgifterna är flexibel och man varvar testuppgifter, observationer och information
från föräldrarna på ett mycket fritt sätt. Smedler skriver att flertalet barnpsykologer tycker att den
”mjuka” testsituationen är tilltalande och fungerar bra (Smedler s. 30). Som beskrivningen ovan
antyder är testsituationen inte särskilt standardiserad (Smedler s. 34).
Wechsler Intelligence Scale for Children är ett allmänintelligenstest för barn. WISC täcker
åldrarna 6-15 år. WISC består av en verbal del med sex deltest och en perfomancedel också med sex
deltest. Varje deltest består av uppgifter i stigande svårighetsgrad och man avbryter deltestet då
barnet med relativt stor säkerhet nått sitt tak på deltestet. (Smedler, s. 38). Jag hittar det inte skrivet
någonstans i litteraturen men något som vi har blivit smärtsamt medvetna om är att WISC ställer höga
krav på testledaren som strikt förväntas följa det som står skrivet i manualen. Utan referenser vågar
jag påstå att WISC är, till skillnad från Griffiths, väl administrativt standardiserat.
Vid Griffiths görs bedömningarna oftast i hemmiljö med förälder närvarande. Dessutom görs alltid en
intervju med förälder som inledning av testningen. Testsituationen ska utformas stödjande för barnet.
Det är tillåtet att bryta standardsituationen bara för att ha roligt med barnet. Testledaren avgör utifrån
barnets attityd och beteende i testrummet vilken av delskalorna det är lämpligt att börja med. Man kan
även hoppa från den ena skalan till den andra om barnet exempelvis blir trött. Det är alltså en s.k.
mjuk testsituation till skillnad från WISC. Testledareffekten har visat sig vara betydande eftersom
testsituationen tillåts vara så pass flexibel. Smedler skriver att just det att man har så stor frihet som
testledare skapar goda förutsättningar för kontakt med barnet och tillfällen till allsidig information och
bedömning. Testsituationen blir å andra sidan inte alls standardiserad. När man administrerar WISC
är den administrativa standardiseringen på ett helt annat sätt säkerhetsställd, den muntliga
presentationen inför varje uppgift är exakt formulerad i manualen, även tidsramen är preciserad i
vissa deltest (jag går inte in så mycket på WISC eftersom jag antar att alla har ganska bra koll på hur
det går till).
• Beskriv NEPSY. (Neuropsykologiskt test)
NEPSY är ett testbatteri för neuropsykologisk undersökning av barn i åldern 3:0-12:11 år. Det är det
enda som finns på detta område och det används väldigt mycket! Det tillämpas inte bara för
neuropsykologisk bedömning (svårigheterna kartläggs) utan även för planering av behandling och
uppföljning (svårigheterna analyseras). Testet är en viktig del i grunden för planering av
habiliteringsåtgärder för barn med utvecklingsavvikelser, dysfunktion, epilepsi eller andra
neurologiska sjukdomar. Testet är mycket omfattande i sin helhet (27 deltest), men ofta räcker det att
till en början använda ett par deltest (ett "startbatteri") ur varje domän för att få sig en allmän bild av
barnets neuropsykologiska status. Sedan kan man utifrån resultatet på dessa deltest gå vidare med
lämpliga deltest (ett utvidgat batteri). Testet 5 domäner (delar) är: "Uppmärksamhet och exekutiva
funktioner", "Språkliga funktioner", "Sensomotoriska funktioner", "Visuo-motoriska funktioner" och
"Minnes- och inlärningsfunktioner". Ofta används NEPSY i kombination med ett begåvningstest - t.ex.
med WISC.
(från örjans häfte)
minnesförmågan.
• Du arbetar på Barnhabiliteringen och skall utreda en 6årig pojke vars förskollärare tycker att han har blivit mer
okoncentrerad och fumlig efter en trafikolycka ett halvt
år tidigare. Vilket/vilka test vill du använda. Beskriv
kortfattat.
Ref. Häftet testbeskrivningar.
Leiter-R, NEPSY & WISC kan alla användas för att kartlägga pojkens funktion inom olika områden. I
Leiter kan uppmärksamhets/minnes-batteriet användas och NEPSYS deltest som fokuserar på
uppmärksamhet, sensomotoriska och visuomotoriska funktioner bör ge intressant information.
Performanceskalan i WISC är också relevant. Testerna kan givetvis ges i sin helhet om man så vill.
Leiter-R; Deltest som är uppdelade på två batterier; ett visuellt-logiskt batteri och ett
uppmärksamhets-minnes batteri. Lämpar sig tex för barn med hjärnskada. Används för att identifiera
brister i uppmärksamhet och minne vilka kan indikera inlärningssvårigheter. Deltesten kan även
användas för att udnersöka olika frågeställningar som har med ovan att göra.
– Psykiska färdigheter hos individen, färdigheter, talanger och begåvning. Psykiskt välmående t.ex.
psykisk stabilitet, styrka och ångest.
– Individens relationer till andra i omgivningen, föräldrar, familj, lärare, kamrater.
Testet används för forskning samt i skola, psykisk utredning av barn och ungdomar, diagnostisering
samt som hjälp och underlag för terapisamtal.
• Du arbetar som skolpsykolog på en central förvaltning
och kan få vara med och påverka uppläggningen av en
riksomfattande undersökning av hur svenska skolbarn
mår idag. Beskriv ett test som skulle kunna vara
användbart för detta syfte. (Se BUS)
NEPSY; Neuropsykologiskt test. Deltest som är uppdelat på fem domänder och där man kan
analysera exakt vart svårigheterna finns. Man kan även använda enbart några deltest.
Ex på deltest är uppmärksamhet och exekutiva funktioner samt minnes-och inlärningssvårigheter,
språkliga funktioner, sensomotoriska funktioner, viuo-motoriska funktioner
• I ett forskningsprojekt inom skolhälsovården vill man
bl.a. relatera barnens prestationer (enligt betyg) till ett
mått på hur barnen ser på sig själva, inklusive sina
kamratkontakter. Finns det något lämpligt test för detta
ändamål? Föreslå, motivera och beskriv kortfattat.
• Beskriv ett test som man kan använda sig av för att
försöka få svar på frågeställningen om ett förskolebarn
har en neuropsykologiskt normal utveckling eller ej.
Redogör för styrkor och svagheter hos testet.
För detta ändamål skulle NEPSY vara ett lämpligt test. Det riktar sig mot barn i åldern 3:0 – 12:11 år.
NEPSY är en barnneuropsykologisk undersökningsmetod som bygger på Lurias teori. Testet
innehåller 27 deltest uppdelade på fem områden: uppmärksamhet och exekutiva funktioner, språkliga
funktioner, sensomotoriska funktioner, visuomotoriska funktioner och minnes- och
inlärningsfunktioner. Testet används för bedömning, åtgärdsplanering och uppföljning.
”Jag tycker jag är…” vore lämpligt. Det stämmer överens med projektets syfte genom att det mäter
självvärdering.
NEPSY har visat sig ha god validitet, vilket är en styrka hos testet. En svaghet är att det är verbalt,
vilket försvårar utredningen av barn som inte behärskar svenska språket. En annan svaghet skulle
kunna vara att det krävs att testledaren har omfattande specialkunskaper. Det är ett väldigt
omfattande test som kan ge en gedigen bild av den neuropsykologiska utvecklingen hos ett barn,
men för mindre utredningar kan man välja ut några av deltesten. NEPSY ska kombineras med
begåvningstest, då det är viktigt att veta barnets utvecklingsnivå, när man tolkar resultaten från
NEPSY. Sedan hittar jag inget mer om NEPSY, men säg gärna till om ni gör det.
Psykiska egenskaper (delområde två: färdigheter, begåvning, talanger; delområde tre: psykiskt
välmående: psykisk stabilitet, styrka och ångest)
För en repetition av ovan nämnda Lurias teori handlar den om tre block. Block I svarar för graden
av vakenhet, medvetandegrad och ämnesomsättningsprocesser. Block II fungerar med hjälp av
hjäss-, tinning- och nackloberna och spelar roll för mottagande av alla sorters sinnesintryck. Block III
utgörs av frontalloberna och har avgörande betydelse för planering och styrning av våra handlingar.
Källa: Häftet Testbeskrivningar.
• Beskriv testet Jag tycker jag är.
(Källa Örjans häfte samt testgenomgången)
Detta är ett personlighetstest för barn, testet syftar till att mäta barns självvärdering/självuppfattning
som ett utryck för den allmänna psykiska hälsan. Jag tycker jag är visar på allmänt välbefinnande och
mäter själskattningen i tre delar.
Testet gör det i form av tre huvudkomponenter som fördelar sig på fem underliggande delområden:
Fysiska egenskaper hos individen (delområde ett: kroppsupplevelse, utseende)
Individens relationer till andra i sin omgivning (delområde fyra: relationer till föräldrar och familj;
delområde fem: relationer till kamrater och lärare)
Alla barn i grundskoleåldern kan delta eftersom testet finns i två olika versioner, ett för barn i
lågstadieålder och ett för barn som går på mellan- och högstadiet. Lågstadieversionen: 32
påståenden med svarsalternativen ”ja” och ”nej”, mellan- och högstadieversionen: 72 påståenden
med fyra svarsalternativ från ”stämmer inte alls” till ”stämmer precis”. En nackdel med två test är
svårigheten att jämföra lågstadiet med övriga stadier.
Om många barn ska ingå i studien är ”Jag tycker jag är…” bra eftersom det kan administreras i grupp.
Att det finns som dataversion gör det ännu mer lättadministrerat. Ett annat argument för användning
av detta test är att det har hög validitet.
Jag skulle föreslå barntestet ”Jag tycker jag är…” för ett sådant projekt. ”Jag tycker jag är…” stämmer
överens med projektets syfte genom att det mäter självvärdering i form av tre huvudkomponenter som
fördelar sig på fem underliggande delområden:
-
Fysiska egenskaper hos individen (delområde ett: kroppsupplevelse, utseende)
-
Psykiska egenskaper (delområde två: färdigheter, begåvning, talanger; delområde tre:
psykiskt välmående: psykisk stabilitet, styrka och ångest)
-
Individens relationer till andra i sin omgivning (delområde fyra: relationer till föräldrar och
familj; delområde fem: relationer till kamrater och lärare)
– Fysiska egenskaper hos individen, kroppsupplevelse och utseende
Dessutom kan alla barn i grundskoleåldern delta eftersom testet finns i två olika versioner, ett för
barn i lågstadieålder och ett för barn som går på mellan- och högstadiet. Om många barn ska
ingå i studien är ”Jag tycker jag är…” också praktiskt eftersom det kan administreras i grupp. Det
gör även testet ekonomiskt motiverat för en större studie. Ett annat argument för användning av
detta test är att det mäter det som det avser att mäta, det har hög validitet (enligt
testbeskrivningshäftet).
Övriga egenskaper:
-
Självskattningsformulär
-
Bygger på traitteorin
-
Lågstadieversionen: 32 påståenden med svarsalternativen ”ja” och ”nej”, mellan- och
högstadieversionen: 72 påståenden med fyra svarsalternativ från ”stämmer inte alls” till
”stämmer precis”
-
Kan administreras individuellt eller i grupp
-
Papper och penna eller datorversion
• Du arbetar som skolpsykolog och skolsköterskan vill att
du skall ta kontakt med en 11- årig tystlåten pojke som
vid flera tillfällen har varit hos henne och klagat över ont i
magen. Finns det någon/några testmetoder som du kan
ha nytta av i en sådan kontakt? Beskriv och motivera ditt
val.
Om pojken vill träffas skulle jag inleda kontakten genom att bjuda Jag tycker jag är, under
förutsättning att pojken inte självmant börjar prata om sina besvär. Jag utgår dock ifrån att han inte
gör det.
• Beskriv C.A.T.
Childrens apperception test.
Det är ett projektivt barntest, dvs det bygger på tolkning. Det innebär även att testet utgår ifrån
spykisk determinism, dvs att individen styrs inifrån av sin personlighet och av omedvetna processer.
Komplexa stimuli tolkas utifrån personlighet och omedvetnaprocesser och dessa blir då synliga
genom denna tolkning. Det inre projiceras på så vis ut på omgivningen, och behov och konflikter blir
synliga. Testet utgår från psykoanalytisk teori(Smedler s. 49).
Det ska kunna nå barnets inre drifter, försvar och konflikter. Barnet får se bilder och utifrån bilderna
berätta historier som sedan tolkas. Barnets kroppsspråk och kommentarer som inte direkt rör bilderna
ska också noteras.
Bildernas innehåll rör kända psykoanalytiska utvecklingsteman som matsituationer och orala problem,
aggressivitet, den oidiala triangeln, primalscenen, kastrationsångest, syskonrivalitet,
toalettsituationen, mörkerrädsla, onanai och sexuella lekar.
Bilderna tolkas sen och man tar 10 variabler i beaktning: huvudtema, hjälten, hjltens behov och drifter,
hur den närmaste omgivningen beskrivs, reaktioner inför föräldrafigurer, jämnåriga och yngre,
signifikanta konflikter(adekvata el. patologiska?), ångest för att bli skadad straffadlämnad e.d.,
ådersadekvata försvar, överjagsfunktioner, jagstyrka. Man uppmärksammar också om det finns något
återkommande tema.
Det finns 10 bilder, i två versioner med antingen djur eller människor(för lite äldre barn. Det finns
också 10 mindre djurfigurer som kan användas som komplement till djurbilderna. Det finns inte några
uppgifter om validitet eller reliabilitet. Men Smedler hävdar att det finns validitet för klinisk användning
i syfte att ta fram hypoteser som sedan kan prövas med andra metoder. Kliniker* säger att testet är ett
bra samtalsunderlag.
källa: testhäftet, "att testa barn", A-C smedler s. 49, 54-58 och *kommentar från Monica Östberg.
• Beskriv ett personlighetstest för barn och de
frågeställningar testet försöker besvara.
Jag tycker jag är beskrivs vara ett ”personlighetstest för att mäta barns självvärdering som ett uttryck
för den allmänna psykiska hälsan” (se testbeskrivning). Eftersom pojken, låt oss kalla honom för
Kalle, är 11 år fyllda skulle jag använda den version som är avsett för elever på mellan- och
högstadiet. Motivet till att jag väljer att bjuda Jag tycker jag är beror främst på att Kalle, enligt uppgift,
är tystlåten av sig och därför ter sig en intervju som direkt opassande.
Machovertestet är ett projektivt test där barns människoteckningar och frågor om teckningarna
används för kliniska bedömningar. Barn anses uttrycka sina kroppsupplevelser symboliskt i de
människortecknigar de ritar vid testsituationen. Testet kan ge ”värdefulla pusselbitar” om självbild,
kroppsuppfattning, önskningar och konflikter.
Enligt Smedler (1993, s. 11) verkar det inte vara särskilt lyckat att försöka intervjua barn. Hon menar
att intervjun ligger ”för långt från barns spontana uttryckssätt” och att ”även trygga barn med god
verbal förmåga blir fåmälda och stela i en intervju”. Vidare skriver Smedler (s. 12) att ”ett test erbjuder
barnet ett konkret material att arbeta och uttrycka sig med. Testet fungerar alltså som kontaktmedel,
och kan ge viktig information av en förutbestämd art”. Visserligen skriver Smedler (s. 11) att man kan
göra det möjligt för barnet att spontant berätta om dagens händelser ifall man är med barnet ”i lek
eller parallell samvaro”, men eftersom Kalle är 11 år och inte tidigare varit i kontakt med
skolpsykologen skulle jag tippa att lek förmodligen inte är en framkomlig väg.
”Jag tycker jag är” är ett objektivt personlighetstest i form av ett självskattningsformulär som avser
mäta barns självvärdering. Det kan användas i en utredning för att ge en bild av barnets medvetet
uttryckta självvärdering, som har visat sig ha samband med psykisk hälsa.
• Du arbetar inom barnpsykiatrin och ska utreda en 7-
åring där det finns vaga misstankar om att han/hon har
varit utsatt för sexuella övergrepp. Beskriv några
testmetoder som kan bli aktuella i en sådan utredning.
(Se CAT)
CAT är ett annat projektivt test bestående av en uppsättning bilder med djurfigurer på. Barnet
uppmanas att berätta historier utifrån bilderna och historierna analyseras och tolkas. Testet används
vid barnutredningar för att få förståelse för barnets relationer, konflikter och försvar.
• Nämn minst ett projektivt test för barn och beskriv en
klinisk situation/frågeställning där detta test kan vara
användbart.
Machovertestet är det mest använda projektiva teckningstestet. Man antar i testet att egna
kroppsupplevelser uttrycks symboliskt i de människofigurer man ritar och att man i teckningarna
också visar sin bild av människor i sin omgivning. Det går till så att barnet uppmuntras att rita en
människa och sedan en till fast av motsatt kön. Psykologen tittar på hur barnet väljer att rita, om det
missar någon viktig del etc. Sedan frågar psykologen om figurerna enligt ett frågeschema. T.ex. Vad
säger folk om honom?, Har hon många kompisar? etc. I manualen finns förslag på hur man kan tolka
bilderna, stora öron kan t.ex. betyda att man är auktoritetsbunden, framträdande knappar kan tyda på
modersbundenhet (naveln då alltså, om ni mot förmodan inte fattade det:) De flesta psykologer
använder sig dock av testet på ett mjukt sätt för att få en helhetsbild av barnet och man kan då, enligt
Smedler, få en insikt i barnets självbild, kroppsuppfattning, önskningar och konflikter. Man kan också
använda sig av testet för att se barnets utvecklingsnivå, man observerar då hur barnet ritar
teckningen.
Det används vid barnpsykologiska utredningar där det är aktuellt med utvecklings- och
personlighetsbedömningar (häftet). Man använder alltid andra barntest tillsammans med
Machovertestet.
Ett annat projektivt barntest är CAT-Children’s Apperception Test. Här visar man bilder på djur som
ser ut som människor med psykoanalytiska utvecklingsteman för barnet och så får barnet berätta om
bilderna. Man tolkar sedan svaren och antar att de speglar barnets inre drifter, försvar och konflikter.
Man kan använda testet vid utredningar för att generera psykoanalytiska hypoteser eller för att förstå
barns relationer, konflikter och försvar.
relationer till familj, föräldrar och andra vuxna vara (Se Smedler s 62-64 eller kompendium
”testbeskrivningar” för utförlig beskrivning.).
Källa: Smedler s 49, 50-53, 54-57, 58-61 och 63-64 och kompendium ”testbeskrivningar”.
• Beskriv Machover-testet.
Machover är ett projektivt, expressivt test, där man använder sig av fria uttryck i form av teckningar.
Man antar att egna kroppsupplevelser uttrycks symboliskt i de figurer man ritar, men även bilden man
har av sin omgivning.
Machover bör aldrig användas som det enda testet om man utreder ett barn utan är framförallt en
komplettering när man söker svar på barnets självbild, kroppsuppfattning, önskningar, konflikter och
kognitiv och känslomässig utveckling.
En klinisk frågeställning där man kan använda sig av Machover kan vara när man gör en större
utredning av ett barn. Om psykologen gjort ett testbatteri, men ännu inte kunnat bilda sig en
helhetsbild av problematiken kan Machover hjälpa till att lägga sista pusselbiten eftersom det är
ganska ostrukturerat och bjuder till observation av många av barnets beteenden. Smedler sida 52.
• Beskriv ett personlighetstest för barn och de
frågeställningar testet försöker besvara. (Se s. 59)
Läs kap 8 i Smedler för bättre förståelse, där finns trevliga fallbeskrivningar!
• Du arbetar inom barnpsykiatrin och ska utreda en 7åring där det finns vaga misstankar om att han/hon har
varit utsatt för sexuella övergrepp. Beskriv några
testmetoder som kan bli aktuella i en sådan utredning.
Ett övergrepp är något väldigt traumatisk och det är därför otroligt viktigt att klargöra vad som hänt.
Franz undrar om det i detta fall skulle vara möjligt att använda någon testmetod, jag har sökt i
litteraturen men inte hittat något stöd för någon specifik metod men gissar att Frans syftar på de s k
projektiva testen. Om dessa kan allmänt sägas att de är förankrade i psykoanalytisk teori och syftar till
att undersöka individers personlighet utifrån den s k projektiva hypotesen, vilket innebär att individens
beskrivningar reflekterar dess inre drifter, försvar och konflikter (Smedler s 49). Min tanke är dessa
test, p g a sin karaktär, skulle kunna fungera som verktyg för att nå detta traumatiska och känsliga
ämne.
I testet CAT får barnet beskriva bilder vilka illustrerar etablerade psykoanalytiska utvecklingsteman
(se Smedler s 54-57 eller kompendium ”testbeskrivningar” för utförlig beskrivning.), i detta fall tänker
jag att bilderna kring sexualitet och förhållande till vuxna skulle kunna ge särskilt viktig information. Ett
enligt mig likvärdig alternativ är Machover Draw-a-Person Test (se Smedler s 50-53).
Smedler (se s 58-61 för utförlig beskrivning) beskriver Family Relations Test (FRT), vilket är ett test
präglat av projektiva såväl som objektiva principer. Testet ger barnet tillfälle att uttrycka sina
medvetna känslor gentemot olika familjemedlemmar. Inledningsvis konstruerar barnet sin familj
utifrån testmaterialets figurer (projektivprincip) och parar ihop dessa med kort uttryckande positiva och
negativa känslor, beroende och liknande (enligt objektivprincip i den mening att barnet ska ta ställning
till olika påstående med ett begränsat antal svarsalternativ). Genom detta test skapas en förståelse
för hur barnet upplever relationerna till sin familj.
Det är även möjligt att det objektiva personlighetstestet ”jag tycker jag är” vilket ger uttryck för psykisk
hälsa och självvärdering kan vara relevant. Särskilt intressant i detta test skulle frågorna kring

• Nämn minst ett projektivt test för barn och beskriv en
klinisk situation/frågeställning där detta test kan vara
användbart. (Se s. 59)
• Beskriv Leiter testet. (Icke-verbalt begåvningstest, 2-21 år, håller
på att konkurrera ut WISC?)
Ett icke-verbalt begåvningstest för åldrarna 2-21 år. 20 deltest, två batterier: ett visuellt-logiskt och ett
uppmärksamhets-minnes. Ett bra sätt att göra en snabb IK-screening. Speciellt lämpat för barn och
ungdomar med försenad kognitiv utveckling, bristande verbal förmåga, inlärningssvårigheter, ADHD,
autism eller hjärnskada.
Finns tre protokoll: ett för det visuellt-logiska, ett för uppmärksamhets-minnesdelen och ett för
utvecklingspoäng och skattningsskalornas profiler. För uppmärksamhets-minnesdelen finns tre
häften: lärarens, förälderns och testledarens uppskattning.
Bygger på Horn och Cattells ”fluid” och ”crystallized” intelligens, Spearmans g-faktor och Gustavssons
hierarkiska modell. Överst generell intelligens och därunder åtta faktorer: formad begåvning, formbar
begåvning, spatial begåvning, minnes- och inlärningsförmåga, snabbhet i bearbetning och
beslutsfattande. Under detta finns ett stort antal specifika förmågor.
Poäng
Norm- eller kriterierelaterade jämförelser. Ex IK-poäng eller utvecklingsålder (utvecklingspoäng).
Administrering
Alla instruktioner sker icke-verbalt. Tid ca 90 min. Poängberäkning ca 20 min.
Kriterievaliditet och begreppsvaliditet – goda.
Homogenitet – god, stabilitet – acceptabel för uppmärksamhet-minne och utmärkt för visuellt-logiska.
• Du arbetar som psykolog inom barnhabiliteringen, och
får en remiss på en 5-årig pojke som man vill att du ska
utreda. Enligt remissen förefaller pojken kunna vara
försenad/ha svårigheter både med sin verbala och sin
motoriska utveckling. Vilket/vilka test kan du använda i
utredningen? Motivera valet och beskriv kortfattat.
Eftersom pojken har verbala svårigheter är kognitiva mått givna i utredningen. Pojkens motoriska
svårigheter motiverar en neuropsykologisk utredning. Jag skulle inleda utredningen med ett samtal
med pojkens familj men också med pojken själv.
Vid det andra tillfället skulle pojken få göra Leiter-R för att få en uppfattning om pojkens
begåvningsprofil. Testet är särskilt lämpligt bla för barn med försenad kognitiv förmåga, bristande
verbal förmåga, inlärningssvårigheter, ADHD och autism (Testbeskrivningar).
instrument, utan kan användas vid inledning av en kontakt som samtalsunderlag. Dessa
frågeformulär kan ge indikationer på problemområden ex familj, skola, vänner mm. De består av:
Depression (BUS-D), innefattar påståenden om ledsenhet och depression, negativa tankar om sig
själv, livet och framtiden och fysiska symptom som associeras med depression.
Ångest (BUS-Å), påståenden som berör oro för olika saker, ex skolan, hälsa och kroppsliga symptom
som kan associeras med ångest.
Ilska ((BUS-I), påståenden som berör ilska på olika sätt, ex orättvis behandling, negativa tankar om
andra mm
Normbrytande beteende (BUS-NB), påståenden som associeras med uppförandestörning ex att man
är elak mot djur.
Självbild (BUS-S), hur barnet upplever sig själv, sin kompetens och färdigheter
• Du arbetar som skolpsykolog på en central förvaltning
och kan få vara med och påverka uppläggningen av en
riksomfattande undersökning av hur svenska skolbarn
mår idag. Beskriv ett test som skulle kunna vara
användbart för detta syfte.
Pojken får sedan utföra Bender Visual Motor Gestalt Test (BVMGT) för att jag ska få ytterligare
information om pojkens uppmärksamhetsförmåga och förmåga att formulera och följa en strategi
(Smedler s. 108-109). BVMGT är ett visiografiskt test vilket innebär att försökspersonen får till uppgift
att kopiera en uppsättning objekt. Den här typen av test har en central position inom neuropsykologisk
testning pga av deras känslighet gentemot olika typer av hjärnskador (Kaplan, s. 303).
Trail Making Test är ett tidsmässigt kort test men kan ändå ge värdefull information om
koncentration, ”sekvensering” och kognitiv bearbetning. Barnet får till uppgift att dra linjer genom ett
antal spridda punkter på ett papper (Kaplan, s. 482).
För att få veta mer om pojkens kommunikativa utveckling kan Illinois Test of Psycholingvistic
Abilities (ITPA) vara ett alternativ. ITPA är bra för att resultatet bidrar till att kartlägga viktiga drag och
kännetecken i kommunikationen och samtidigt uppmärksamma starka och svaga sidor i språket.
Testet testar tre processer: 1) den receptiva, de färdigheter som är nödvändiga för att känna igen
och/eller förstå vad man sett eller hört 2) den organiserade, dvs. den inre bearbetningen av
perception, begrepp och språkliga symboler. 3) Den expressiva dvs. färdigheter nödvändiga för att
uttrycka sig vokalt eller motoriskt.
Det kan också finnas anledning att komplettera ovan nämnda test med NEPSY. NEPSY är en
barnneurologisk undersökningsmetod som består av 27 deltest som tillsammans genererar en
uttömmande neuropsykologisk utvärdering av barnet.
Frostigs rörelseprov kan vara ett komplement för att pröva pojkens motoriska rörelseförmåga
(Testbeskrivningar).
• Du arbetar på Barnhabiliteringen och skall utreda en 6årig pojke vars förskollärare tycker att han har blivit mer
okoncentrerad och fumlig efter en trafikolycka ett halvt
år tidigare. Vilket/vilka test vill du använda. Beskriv
kortfattat. (Se s. 56)
• Beskriv Becks ungdomsskalor.
Becks ungdomsskalor är ett självskattningsinstrument för bedömning av emotionell och social
problematik. Den kan ges till ungdomar mellan 9-18 år (Sverige). Dessa skattningsskalor är
uppdelade i 5 delar och kan användas tillsammans eller var för sig. De är inte i sig ett diagnostiskt
(Källa Örjans häfte samt redovisningar)
Jag väljer Becks barn- och ungdomsskalor (så vitt jag kan se skulle Jag tycker jag är också lämpa
sig). Den svenska versionen av Beck ungdomsskalor är ett lättadministrerat självskattningstest för
barn och ungdomar 9-18 år som kan identifiera depressiva symtom, ångest, självskattning,
aggressivitet samt normbrytande beteende. Testet används alltså inte diagnostiskt utan för att få
förståelse för barnets situation. Testet kan administreras i grupp vilket är praktiskt vid en omfattande
undersökning, det tar 25-60 minuter att utföra. Vid testning tar barnet ställning till färdiga påståenden
vilket är lämpligt då barn och ungdomar kan ha svårt att lämna muntlig information. Testet består av
ett formulär med fem skalor (20 items poäng per skala) vilka bedömer emotionell och social
problematik. Skalorna är:
– Depression (BUS-D)
Skalan innehåller spåstånden som speglar olika symtom på ledsamhet och depression, exempelvis
barn och ungdomars negativa tankar om sig själv, sina liv, sin framtid samt kroppsliga symtom som
associeras med depression.
– Ångest (BUS-Å)
Denna skala innefattar påståenden som avser spegla barns och ungdomars oro och ängslan,
exempelvis avseende skola, hälsa, att bli skadad samt kroppsliga symtom associerade med ångest
– Ilska (BUS-I)
Här söker man finna upplevelser av ilska, att ha blivit orättvist behandlad, kroppsliga tecken på ilska
samt negativa tankar om andra.
– Normbrytande beteende (BUS-NB)
Skalan innefattar påståenden som innefattar attityder och beteenden som associeras med
uppförandestörning och trotssyndrom
– Självbild (BUS-S)
Denna skala speglar barns och ungdomars upplevelse av sig själva exempelvis vad gäller
kompetens, färdigheter och positiv självvärdering.
Becks barn och ungdomsskalor är välundersökt och har väldokumenterade psykometriska
egenskaper. Den kriterierelaterade validiteten är utmärkt och reliabiliteten är också mycket
tillfredsställande. Den svenska normgruppen består av 2358 barn och ungdomar.
• Du arbetar som skolpsykolog och skolsköterskan vill att
du skall ta kontakt med en 11- årig tystlåten pojke som
vid flera tillfällen har varit hos henne och klagat över ont i
magen. Finns det någon/några testmetoder som du kan
ha nytta av i en sådan kontakt? Beskriv och motivera ditt
val. (Se s. 58)
Välj lämpligt test
• Du arbetar som skolpsykolog och blir kontaktad av en förälder som
är orolig för sin son – 8 år – som är ledsen och inte vill gå till skolan.
Klassläraren har inte lagt märke till annat än att pojken är tystlåten
och tycks ha vissa svårigheter (dock ej så stora) med läs- och
skrivinlärning. Hur kan du angripa problemet? Vilket/vilka test kan
eventuellt bli aktuella att använda? Beskriv kortfattat.
Problemet kan angripas genom att pojken får göra ett begåvningstest, förslagsvis WISC, som mäter
hans begåvningsmässiga förutsättningar att prestera bra i skolan, samt ett test som mäter barns
psykiska tillstånd, förslagsvis "Becks ungdomsskalor" eller "Jag tycker att jag är". WISC-testet mäter
generell intelligens och är i detta fall bättre att använda än t.ex. Leiter-R, eftersom det är just verbal
intelligens som verkar behöva utredas (och Leiter-R mäter ju inte detta). Resultatet från WISCtestningen ger information om både huruvida och isåfall hur mycket pojkens generella verbala
intelligens är nedsatt. Om pojken får ett anmärkningsvärt lågt testresultat på WISC, t.ex. på den
verbala delskalan, kan man gå vidare med detta genom att t.ex. använda NEPSY, och då framförallt
de deltest som är kopplade till språkliga funktioner. "Becks ungdomsskalor" och "Jag tycker att jag är"
är två självskattningstest som kan användas för att utreda pojkens psykiska tillstånd. "Becks
ungdomsskalor" används egentligen från 9 år i Sverige, men skulle eventuellt kunna användas även i
detta fall. De skalor som främst bör användas är depressionsskalan (BUS-D), ångestskalan (BUS-Å)
samt självbildsskalan (BUS-S). Resultatet på självskattningen kan ge en tydligare bild av pojkens
emotionella och sociala problematik och kan bidra till att initialt identifiera depressiva symtom, ångest,
låg självskattning etc. Ett alternativ till BUS är att använda "Jag tycker att jag är". "Jag tycker att jag
är" mäter barns självvärdering och detta anses vara ett uttryck för den psykiska hälsan. Testet passar
bättre åldersmässigt än BUS eftersom det används från 7 års ålder. Det finns ett formulär med
påståenden att ta ställning till för lågstadieelever och ett annat för mellanstadieelever. De områden
som undersöks med dessa påståenden är hur barnet ser på sina fysiska och psykiska egenskaper
samt hur barnets relation till familj och andra är. "Jag tycker jag är" kan alltså skulle alltså kunna vara
till hjälp i utredningen av pojken. Alla dessa test måste givetvis kompletteras med intervjuer och
samtal med pojken och hans föräldrar. (från Smedler exempelfallet sid 100ff + sid 40-41 + örjans
häfte)
• Beskriv en klinisk frågeställning där det kan vara befogat att
använda sig av barntest. Motivera vilket/vilka test du skulle vilja
använda och beskriv kort hur du skulle gå till väga.
Om man trots insatser i skola, hem och familj inte kommer tillrätta med ett barns problematik kan det
vara aktuellt med individualdiagnostik. Denna ger en ökad förståelse för barnets intrapsykiska värld
och vägleder i frågor om åtgärder. Viktigt är dock att man inte ska diagnostisera utan att veta att man
kan täcka behandlingsbehovet. Smedler, sida 13.
Emil, är en liten pojke med problem i skolan. Trots omfattande åtgärder med bl.a. stödpersonal i
skolan och läxhjälp kvarstår problemen, han halkar efter i snart sagt alla ämnen. Psykologen som
familjen har kontakt med på BUP väljer att jobba med en problemorienterad utredning där man utgår
från föräldrarnas beskrivning av problemen och formar hypoteser och väljer testmetoder därefter.
Psykologen i detta fall ställer sig frågor om Emils mognad och beslutar sig för att göra Griffiths för att
kunna se om det finns förseningar eller funktionsstörningar hos Emil. Efter detta måste Emil även
genomlida WISC för att få en bättre bild av hans allmänna begåvningsnivå. CAT görs också, ganska
oberoende av dess psykodynamiska grund, mest för att få en bild av Emils fantasiförmåga och hur
han upplver sig själv och familjen.
Resultatet är sekretessbelagt, men Emil fick börja i specialklass där han trivs mycket bättre och får
glass på fredagar.
Ullrik 9 år är väldigt lugn, långsam i tal och rörelser, samt ligger efter en hel del i skolan jämfört med
sina kamrater. Hans mor hade en svår förlossning med Ullrik och han föddes 2,5 månader för tidigt.
Här är det ganska uppenbart att Ullrik kan lida av allmän nedsättning av kognitiva funktioner i och
med den svåra förlossningen. Vi kan här testa Ullriks begåvningsnivå och utvecklingsnivå med hjälp
av Wisc III och Leiter-R alt NEPSY. Sen kanske det kan vara befogat att testa för depressiva symtom
som också de kan inverka på Ullriks skolresultat samt aktivitetsnivå. Beck ungdomsskalor skulle
lämpa sig för att titta närmare på detta.
Först och främst skulle jag skaffa mig all nödvändig bakgrundsfakta om Ullrik vad gäller förlossning,
uppväxt, trauman etc. När det kommer till testningen skulle jag börja med Leiter-R eller NEPSY för att
ta reda på vilken utvecklingsålder Ullrik ligger på. Därefter skulle jag testa hans begåvningsnivå med
exempelvis Wisc III.
Testningen skulle kunna hjälpa skolan att tillgodose eventuella behov av stöd som Ullrik kan ha. Det
är viktigt att Ullrik får ut så mycket som möjligt av sin skolgång.
(I Smedlers Att testa barn står det att man sällan gör den här typen av test utan att man istället
försöker lösa problematik genom familj och miljö i första hand? Men i exemplet ovan tar vi för givet att
skolproblematiken är så pass allvarlig att en utredning är behövlig =))

Generell testkunskap Reliabilitet

Transcription

Similar documents

UPP-5-kort-berskrivning

Dagens Industri - Stefan Lindström

Bruksanvisning för självtest Prostata

1 215 respondenter

Bruksanvisning för självtest Dolt blod i avföring

Bruksanvisning för självtest tidig graviditet

Bosch mfw68660