Generell testkunskap Reliabilitet
Transcription
Generell testkunskap Reliabilitet
Generell testkunskap Reliabilitet • Vad innebär reliabiliteten för ett test? Ange några olika mått. Realibiliteten på ett test står för precision i mätinstrumenten - mätsäkerhet. Man eftersträvar hög reliabilitet. Men denna bör inte bero på att man frågat samma saker om och om igen att man testat ett ett mkt avgränsat område. Hur mäter man reliabiliteten: 1. Test-retest. Samma personer med samma test vid två tillfällen. Korrelationen mellan resultaten ger ett mått på reliabiliteten. 2. Parallellformer. Ett test konstrueras samtidigt som en parallell variant med samma svårighetsgrad, eller innebörd, och samma personer testas med dessa tester varefter korrelationen beräknas. Ovanlig metod. 3. Intern konsistens (Consistency borde översättas konsekvens). Denna form har att göra med i vilken utsträckning alla uppgifter mäter samma egenskap. Split half – delar testet i två likvärdiga halvor och korrelerar resultatet. Vid denna metod minskar reliabiliteten hos kortare test varför man måste förlänga med 2 för att uppskatta hela testets reliabilitet. Alphakoefficienten är ett annat sätt att undersöka reliabiliteten där man kollar sambandet mellan de item som ingår i en skala. I vissa tester kan det dock vara bra att ha lågt alpha eftersom man har behov att mäta oberoende items för att fånga en komplex verklighet. Ju fler metoder som används för reliabilitetsmätning desto bättre. • Vad innebär test-re-test reliabilitet? En använd metod heter Test-Retest och innebär att man istället för att göra ett nytt test, gör om samma test vid två olika tillfällen. Test-Retest mäter reliabiliteten genom att korrelera resultaten från testet vid tillfälle 1 med resultaten från testet vid tillfälle 2. Detta förutsätter att man under de två testen gör mätningarna på samma individer. Test-Retest sägs mäta ett tests stabilitet, dvs reliabiliteten över tid. Problemet blir, om de två testningarna görs med kort mellanrum, att den testade helt enkelt minns sina svar från första testomgången. Resultaten från de olika omgångarna blir i detta fall väldigt lika och man får en hög korrelation mellan testningarna. Reliabiliteten riskerar på detta sätt att överskattas. Om däremot lång tid löper mellan testningarna, kan andra faktorer som ålder, utbildning och mognad påverka att resultaten skiljer sig åt vid testtillfälle 1 & 2. Reliabiliteten kan på detta sätt riskera att underskattas. En testtagare som gör testet för andra gången kan i vissa fall tendera att få ett sämre resultat pga lägre motivation att göra om samma test för andra gången. Att hitta ett lagom långt tidsintervall mellan testtillfällena är önskvärt, men tyvärr lättare sagt än gjort. • Vad innebär split-half reliabilitet? Split Half metoden har fördelen att individen endast testas en gång. Här mäter man testets interna konsistens, som syftar till att undersöka om uppgifterna är homogena eller inte, alltså om alla delar av testet mäter samma begrepp. För att mäta reliabiliteten i ett test med hjälp av denna metod kommer man att dela ett test i 2 för att få två delar att korrelera mot varandra. Vanligast är att dela upp testets items i jämna och udda, men olika uppfattningar om hur indelningen ska ske förekommer. Individens testpoäng från de två halvorna korreleras med varandra för att få ut reliabiliteten. Reliabilitetskoefficienten blir en uppskattning av halva testets tillförlitlighet (reliabilitet). Denna reliabilitet riskerar att underskattas eftersom man bara mäter på hälften av alla items. Ju större ett test är (ju fler items det innehåller), desto mer växer reliabiliteten och tvärtom. Felen jämnar ut sig vid många frågor, och tillförlitligheten växer ju fler frågor vi ställer om en viss egenskap. För att få en realistisk bild av reliabilitet vid split half metoden förlänger man testet med 2, enligt Spearman-Browns formel och får en uppskattad reliabilitetskoefficient för hela testet. Fördelarna med split-half metoden är att man undkommer inlärningseffekter och krångel med två testtillfällen. Nackdelen är att den inte går att användas vid testning där man har hastighet som dominant faktor eftersom man i regel klarar de flesta frågor man gör ett försök på. Överskattning av reliabiliteten blir här fallet. • Vad ger alpha beräkningar för sorts reliabilitet? Ett annat mått på den interna konsistensen är alpha beräkningar, som liksom KR är ett sammanfattande korrelationsmått mellan samtliga items. Som andra test som mäter intern konsistens, mäter även Alpha beräkningar i vilken utsträckning olika items i ett test faktiskt mäter samma sak. Den ovan beskrivna KR metoden bygger på att testpersonen svarar antingen ”rätt” eller ”fel” på varje item. Men det finns många test som inte består av rätt/fel antingen/eller svar. Många personlighetstest eller attitydsundersökningar består av flervalssvar som tex: alltid, ofta, ibland, sällan, eller aldrig. Inget av svaren är rätt eller fel, utan man mäter på ett kontinuum mellan ”alltid” och ”aldrig”. Vid bedömning av intern konsistens hos test med flervalssvar på items, använder man alpha beräkningar. Alpha beräkningsformeln liknar KR-formeln till stor del, skillnaden är uppenbarligen just hur man gör beräkningarna för varje item innan man sätter in dom i formeln. Annars är metoderna lika. Alpha beräkningarna kan sägas vara lite mer generella då de kan tillämpas på både test med rätt/fel svar och på test med flervalssvar, till skillnad från KR metoden. • Vad innebär homogenitetsmetoden? (KR) (Kuder-Richardsons metod, KR)? Detta är också ett mått på intern konsistens och fokuserar på till viken grad uppgifterna i ett test fungerar på likartat sätt och mäter samma egenskapsvariabel = testets homogenitet. Vid KR metoden för beräkning av reliabilitet testas individerna endast vid ett tillfälle. KR används vid dikotoma variabler i ett test, dvs. där svarsalternativen endast kan anta två olika värden, tex. 0 & 1. KR kan tolkas som ett medelvärde av korrelationerna som skulle ha erhållits från alla möjliga split-half reliabilitetsuppskattningar. Man delar alltså inte upp testet i enbart två delar, utan gör beräkningar på alla potentiella items-kombinationer. Efter beräkningar får vi fram en KR koefficient som ligger mellan 0 & 1 och som vanligt är värden närmare 1 mer reliabla. Det speciella här är att det beräknade KR utgör en nedre gräns för testets reliabilitet, medan den sanna reliabiliteten åtminstone är = KR, eller högre. Låga resultat på KR kan tyda på ett opålitligt, icke reliabelt test men även på bristande homogenitet mellan items. Ett lågt KR värde säger alltså inte så mkt alls eftersom reliabiliteten fortfarande kan vara mkt högre än det vi beräknat. Superhög KR betyder i alla fall massa reliabilitet och även bra homogenitet. KR-skattningen återspeglar alltså både pålitlighet och homogenitet, och oftast vill vi ju ha både och. Korrelationskofficient. KR metoden förutsätter att samtliga uppgifter i testet mäter samma egenskaper och är känslig för brister i homogeniteten i ett test. Man bör alltså väga in hur testet är sammansatt innan man ger sig på att bedöma reliabiliteten med denna metod. Titta huruvida populationen som använts är representativ för de personer man själv vill testa. Vid uträkning beräknar man proportionen som hade rätt (p-värde) respektive fel (q-värde) på varje item och multiplicerar ihop dessa till ett pq för varje item. I nästa steg summerar man alla pq. Dessa siffror pluttas in i formeln tillsammans m uppgifter om antal items i testet och den totala variansen. Formeln finns tex. i Fhanér s79 men det blir lite överkurs ju. Validitet • Beskriv begrepps- och prediktiv validitet, likheter och skillnader. • Vad innebär begreppsvaliditet? Begreppsvaliditet blir aktuellt då det INTE är ett väl avgränsat och tydligt kriterium man vill mäta. Det är istället ett abstrakt psykologiskt begrepp/en psykologisk egenskap, som man tror finns och kan mätas, som man vill mäta (t.ex. allmän begåvning, psykisk balans). Ett test har god begreppsvaliditet om det mäter just det abstrakta begrepp som man har för avsikt att mäta med testet. Eller med andra ord: När testet lyckas fånga det abstrakta begreppet i hög grad! • Vilka metoder kan man använda för att uppskatta ett tests begreppsvaliditet? Begreppsvaliditeten i ett test kan uppskattas genom korrelationsundersökning mellan t.ex. en persons testresultat på det aktuella testet och samma persons testresultat på andra redan etablerade test. Begreppsvaliditeten kan även uppskattas genom korrelation mellan testresultat och arbetsprestation eller genom att testet korreleras med andra variabler som man redan vet har ett samband med den abstrakta psykologiska egenskapen som man önskar mäta. • Vad innebär prediktiv validitet? Prediktiv validitet är en slags kriterierelaterad validitet (empirisk validitet). Kriterievaliditet är uppdelad i prediktiv och samtidig validitet och handlar om hur väl ett test predicerar ett visst väl avgränsat och tydligt kriterium. Vid samtidig validitet kan man göra mätningen av huruvida kriteriet uppfylls samtidigt som testet utförs, men vid prediktiv validitet kan denna variabel bara mätas vid ett senare tillfälle, och alltså först senare svara på hur väl testet verkligen förutsade ett visst kriterium. Prediktiv validitet anses förövrigt vara en av de mest intressanta aspekterna av validitet. Titta på vad testet är korrelerat mot. Korrelerat mot andra test som visat sig predicera väl? Om storleken på stickprovet är tillräckligt. • Ett problem med barntest gäller den s.k. prediktiva validiteten. Ge exempel på hur det visar sig, och resonera kring varför den prediktiva validiteten ofta är låg. Den här frågan var lite lurig tycker jag, för som jag förstår det så likställer Smedler prediktiv validitet med samtidig. Men ni kanske inte ska lite helt blint på det här svaret, men här kommer ett försök iaf. Ett problem med att testa barn och tolka dess resultat är att barn påverkas mycket mer än vuxna av kontexten i testsituationen. Om då resultaten inte blir helt tillförlitliga så är det också svårt att få någon prediktiv validitet. Smedler skriver också att det inte är bra om den prediktiva validiteten är för hög. Om man t.ex. använder skolbetyd som ett uttryck för ett intelligenstests prediktiva validitet är en korrelation på 0.8 för hög, för då kanske det helt enkelt är så att intelligenstestet mäter skolfärdigheter och inte är ett mått på intelligens. Det är då bättre om korrelationen ligger på runt 0.5, för då förklarar den uppmätta intelligensen 25 % av variansen, och då finns det andra faktorer som kan ha påverkar skolprestationen. Men även här kan man inte helt klart veta att testet verkligen mätte intelligens, det kan mäta andra saker som har ett samband med skolprestationer, som t.ex. uppmärksamhet och motivation. Jag förstår inte riktigt hur det här skiljer sig från när man testar vuxna, men det kanske ni gör? Jag tänkte maila Örjan om den här frågan och fråga honom också, så ni får hålla till godo med det här svaret så länge så mailar jag mer sen! Barn påverkas mer än vuxna av kontexten i testsituationen, exempelvis instruktioner och testrum. Om resultaten inte är tillförlitliga minskar den prediktiva validiteten. Smedler skriver också att det inte är bra om den prediktiva validiteten är för hög. Om man t.ex. använder skolbetyg som ett uttryck för ett intelligenstests prediktiva validitet är en korrelation på 0.8 för hög, för då kanske det helt enkelt är så att intelligenstestet mäter skolfärdigheter och inte är ett mått på intelligens. Det är då bättre om korrelationen ligger på runt 0.5, då finns det andra faktorer som kan ha påverkar skolprestationen. Men även här kan man inte helt klart veta att testet verkligen mätte intelligens, det kan mäta andra saker som har ett samband med skolprestationer, som t.ex. uppmärksamhet och motivation. Egna tankar om prediktiv validitet: möjligtvis kan också åldern och barns snabba utveckling påverka. Barnen går snabbt igenom olika utvecklingsfaser vilket gör det svårt att hitta bra normgrupper som grund för förutsägelsen. • Vilka metoder kan man använda för att uppskatta ett tests Ett barn som har svårt med vissa testdelar kan dessutom ha perfekt förståelse ett halvår senare, vilket också borde påverka predikationen. När man skapar eller standardiserar ett test: Om frågor väljs utifrån kronologisk ålder, ex 3 år, kan utvecklingsnivån helt naturligt skilja mycket mellan två barn, vilket borde vara ett exempel på svårigheten att förutsäga barns utveckling. prediktiva validitet? Prognostisk validering: följa upp ex. ett verkligt urvalsförfarande för att se hur det gick. Samtidig validering: att ex. testa ett antal redan anställda för att få fram kriteriedata och validitetsmått på studs. När man ska använda ett test: Sammanfattningsvis blir det känsligt att utgå från kronologisk ålder när barnen är små och genomgår snabba förändringar. • Vad innebär egentligen face-validitet? Att frågorna i ett test förefaller relevanta för den egenskap som ska mätas. Face-validitet har inget psykometriskt värde. Graden av face-validitet påverkar motivationen hos den som testas. • Vilka validitetsuppgifter vill du finna i en manual för ett urvalstest? • Beskriv kortfattat och i allmänna termer de generella principerna för användning av faktoranalys vid konstruktion av ett personlighetstest. Beskriv fördelar och begränsningar. Face-validitet – är testets innehåll relevant för den typ vi söker. Vid faktoranalys börjar analytikerna med en stor mängd data där de sedan analyserar korrelationerna mellan olika items eller test, för att hitta ett mindre antal faktorer som inte är korrelerade och som står för så stor del av variationen i data som möjligt. Man kan använda sig av faktoranalys för att på detta vis empiriskt få fram de grundläggande dimensionerna av personligheten. Diskriminerar testet – får vi värden i resultatet som kan jämföras – alltså hur ser svarsalternativ och poängsättning ut. Fördelar med faktoranalys är bland annat att man kan reducera stora mängder data till ett antal, färre, faktorer som antas beskriva de viktigaste dragen i personligheten. Population – är den relevant utifrån de personer vi söker. Den kritik som faktoranalys har fått handlar bland annat om att man anser att faktoranalys fokuserar på samvariation av variabler på bekostnad av den unika variansen, och att man på detta vis kan missa viktiga faktorer när man bara klumpar ihop data. Det finns heller inga definitioner eller regler för hur man ska benämna faktorer som man råkar hitta. Om ett visst antal variabler samvarierar, hur kan man veta vad de egentligen mäter? Om våghalsig, bestämd och utåtriktad samvarierar starkt, vilket personlighetsdrag mäter dessa variabler egentligen tillsammans då? (psychological testing s 352 och 371) Innehållsvaliditet – mäter testet det vi vill mäta. Empirisk validitet (prediktiv validitet) – hur väl kan vi predicera. Övergripande • Vad finns det för samband mellan reliabilitet och validitet? En god reliabilitet är förutsättningen för en god validitet. En god reliabilitet kan finnas utan en god validitet. Hög face-validity krävs för reliabilitet. • Vilken metod använder man om man vill beräkna ett tests stabilitet? Jag frågade Johan om det här och han sa att det är ett mer övergripande mått som innefattar både reliabilitet och validitet (så då kan man ju räkna upp massa av de metoderna om man vill). Han pratade också mycket om huruvida ett test håller sig över tid och om det fungerar i olika socioekonomiska grupper, yrkesgrupper osv. Alltså väldigt mycket samma som reliabilitet men som sagt ett mer allmänt begrepp. • Vad innebär Good report då det gäller att få de som testas att svara sanningsenligt? Jag har inte hittat detta begrepp annat än i Örjans handouts och därför blir svaret väldigt kort. Man uppmanar helt enkelt försökspersonerna att svara sanningsenligt och ökar (förhoppningsvis) motivationen att göra det genom att dessutom förklara vad resultaten ska användas till. Faktoranalys • Vad innebär explorativ faktoranalys? (Med Örjans ord innebär en explorativ faktoranalys att man kokar en fond på en buljong – ngt litet expanderar). Mer konkret menas att man söker hitta fler hypoteser/modeller utifrån ett antal faktorer. Man söker en massa fakta för att skapa hypoteser, exempelvis kan jag tänka mig att Cattells 16faktorteori gjordes med denna metod. • Vad innebär konfirmatorisk faktoranalys? Vid denna typ av faktoranalys söker man konfirmera de hypoteser/modeller man redan har. Sker ofta efter en explorativ faktoranalys, man har ett antal teorier och modeller om exempelvis personlighet och söker genom faktoranalys hitta bekräftelse på dessa. Faktoranalys börjar med en empirisk databas som består av interkorrelationer mellan ett stort antal items eller test. Dessa interkorrelationer faktoranalyseras sedan för att hitta det minimum antal faktorer som förklarar så mycket varians som möjligt i datan. Dessa etiketteras sedan genom att fastställa vad de items som är relaterade till en specifik faktor har gemensamt (Kaplan, s. 352). Det kan sammanfattas som en ”datareduktionsteknik” (Kaplan, sid. 89) Vid konstruktion av personlighetstest kan man alltså använda sig av faktoranalys för att empiriskt få fram de grundläggande dimensionerna av personligheten. Faktoranalysens stora fördel är att den gör ohanterliga datamängder hanterbara. Kritik: Vid faktoranalys grupperas items om de korrelerar, proceduren är generellt datoriserad och eftersom fokus ligger på den gemensamma variansen finns det risk för att identifieringen av källorna till den gemensamma variansen sker på bekostnad av den unika variansen och viktiga faktorer kan således förbises. Det kan också uppstå problem när de slutgiltiga faktorerna ska namnges. Det finns inga definitiva regler för hur faktorerna ska namnges. Således blir det en högst subjektiv bestämning. Om exempelvis våghalsig, lättretad, bestämd och orädd delar gemensam varians återstår processen att namnge den gemensamma faktorn. Det kan lätt bli godtyckligt (Kaplan, sid 371). • Beskriv kortfattat ett test där faktoranalys använts vid konstruktion av testet. Ref. Häftet testbeskrivningar, Kaplan s. 20, 367. Ett bra expempel är Catells 16PF – Sixteen Personality Factor Questionnaire. 16PF utvecklades genom en lexikalisk metod där engelskans alla adjektiv som kan användas om människor bearbetats faktoranalytisk för att kategorisera dessa adjektiv. Syftet var att identifiera grundläggande personlighetsdrag. 16PF var bland de första testen som utvecklades med faktoranalytiska tekniker. Idag används används faktoranalys i utvecklingen eller valideringen av i stort sett alla större test. Klassisk teori vs. Item response theory • Vid innebär administrativ standardisering? • Vad innebär ” Item response theory”? För administrativ standardisering behöver man bara ta och se till att ha en uppsätnting anvisningar avseende den administrativa testproceduren, dvs ha en manual, och se till att individer även vad gäller andra avseenden testas under så lika förhållanden som möjligt. Detta för att säkerställa reliabiliteten. Det är en ny approach till test. Testpersonen definieras inte längre av summan av antal klarade items utan av svårighetsnivån på de items som den klarar av att besvara korrekt. Testitem väljs baserat på sannolikheten att varje item besvaras rätt eller fel, genom att matcha itemsvårighet mot itemdiskriminabilitet. Man kan då urskilja inom vilken nivå som personen börjar få problem. Man utgår från utförlig item-analys. Varje item får sin egen itemkarakteristik-kurva som beskriver sannolikheten att få rätt givet kunskap/förmåge-nivån hos varje testtagare. Man kan då identifiera den itemnivå på vilken personen börjar få problem och det blir möjligt att bedöma förmåga utan att utsätta testpersonen för hela itemansamlingen. I konstrukktionen av test enl IRT tar man oftast hänsyn till två dimensioner, svårighet och diskriminabilitet. (Ibland även en tredje för sannolikheten att de med lägst förmåga kommer att svara rätt.) Itemsvårighet fås genom att beräkna andelen personer som klarar itemen(84% = .84 i itemsvårighet även fast det egentligen borde heta itemlätthet). Diskriminabilitet är hur bra personer som klarar itemen klarar sig på hela testet, dvs hur bra itemen är på att skilja ut de som är bra vs dåliga på testet. Om ett IRT test anpassas till datoranvändning kan varje testperson få ett individualiserat test där datorn känner av och fokuserar på den nivå där personen har en 50% sannolikhet att klara frågorna. Förmågan blir då allra noggrannast utvärdera på den nivå där den behöver bli det. Konventionella test, utformade efter klassisk testteori, har antingen sitt största fokus(=flest items) på medelnivå, eller lika stort fokus(=lika många items) på alla nivåer. Precisionen är i båda fallen mindre god för många(de som inte är medel) eller alla av de som testas. Med IRT utformade datortest blir precisionen god och lika god för alla testade. • Vid innebär teknisk standardisering? Innebär att testet är utprövat för en viss population eller vissa populationer och att itemanalyser är utförda. Testets mätsäkerhet (validitet/reliabilitet) är fastställd och testet är normerat. • Vad innebär itemanalys? Är ett generellt samlingsbegrepp för ett antal metoder som används för att utvärdera test-items. Är en av de viktigaste aspekterna för testkonstruktion. De mest grundläggande metoderna går ut på att analysera ”item difficulty” (antalet personer som får rätt på en viss item), samt ”item discriminability” (huruvida en person som presterat väl på en item, även presterat bra på resten av testet). • Vad innebär normering av ett test? Normering är de åtgärder som direkt syftar till att möjliggöra för den som använder ett prov att jämföra det enskilda resultatet med resultaten i en referensgrupp, det vill säga en normgrupp. I normeringen ingår definition och urval av normgrupper, beräkning av medelvärde och standardavvikelse i råpoängfördelningarna, överföring av råpoäng till standardskalor samt upprättade normtabeller. Man ska alltså enkelt kunna relatera individers testresultat relativa värde till normgruppens resultat. • Vad utmärker den klassiska testteorin? • Vad är normgrupp/grupper i testsammanhang? Klassisk testteori står mot IRT(Item Response Theory). Till skillnad från IRT så bedöms prestation eller det man vill mäta med utgångspunkt från den totala råpoängen som erhålls vid testning. Är ett representativt stickprov från den population testet är menat att användas till. Syftet med dessa är att underlätta för testanvändaren att fastställa var individer eller grupper som testats ligger i förhållande till det stora antalet tidigare testade. Klassisk testteori bygger på antagandet om att en observerad provpoäng består av ett hypotetiskt sant värde samt en felkomponent. Den moderna testteorin bygger på uppgifter och hur prestationen på dessa är relaterad till den förmåga som mäts med hjälp av uppgiften(=IRT). • Redogör för vilka aspekter av testgivningen som ska beaktas för att Klassisk testterori antar att beteendedisposition (beteendevariabler som ska mätas) är konstant över tid. Fluktuationer i mätningarna betraktas därför som fel, mätfel. I och med detta kan man räkna ut inom vilket spann man troligen kan hitta det sanna värdet eftersom man kan räkna ut hur stort felet är (med stor sannolikhet). Två typer av standardisering nämns: teknisk och administrativ. Standardisering och normering av test • Vid innebär standardisering av ett test? Att testet är tekniskt och administrativt standardiserat. Teknisk standardisering innebär att det är utprovat för en viss population eller vissa populationer, att itemanalyser har gjorts, att mätsäkerheten är fastställd och att testet är normerat. Utprovningen för en viss population på ett representativt stickprov därur möjliggör att testresultat sedan kan jämföras mot denna standard. Stickprovets resultat blir genom att medlevärde, varians(?) och standardavvikelse räknas ut en måttstock som visar hur de senare testresultaten står sig gentemot den övriga populationen. Vad allt det här betyder vet ni säkert bättre än jag eftersom det säkert har besvarats av nån av er. en testning kan anses genomföras under standardiserade förhållanden. Administrativ standardisering Innebär att individer testas under så snarlika förhållanden som möjligt, exempelvis avseende instruktioner, miljö (lokal), tidpunkt (egna exempel). Denna standardisering av testproceduren samlas ofta i särskilda anvisningar. Teknisk standardisering Fyra grundläggande aspekter bör vara specificerade: utprövat för en viss population, genomförda itemanalyser, säkerställd mätsäkerhet (reliabilitet och validitet) och normering av testet. Källa: Frasses handout 1, s 7. Jag har sökt i övrig litt men har inte hittat något relevant. Standardskalor och itemkonstruktion undvika extrema svarskategorier, välja att hålla med påståendena eller vilja framstå som bättre än dem är. • Vad är en standardskala? • Vad innebär normativ itemkonstruktion? • Vilket medelvärde och standardavvikelse har Z-skalan? Ref. Örjan Föreläsning 2, Mabon s. 249. Z- skalan: Medelvärde: 0 Standardavvikelse: 1. Wechsler skalan: Medelvärde 10 Standardavvikelse 3. Normativ itemkonstruktion innebär att man skapar items som ger data i en normativ skala. Normativa poäng från en individ kan jämföras mot en normgrupp för att se hur individen förhåller sig till gruppen. Normativa items är alltså items som frågar efter något på en skala, i vilken grad eller utsträckning något är på ett visst sätt. Ett exempel är items i BAI och BDI som undersöker i vilken grad man upplever symtom på ångest respektive depression. Även enkla ja/nej-frågor ger normativa data. Normativa items är relativt lätta att genomskåda om man vill förställa sina svar, detta kan kontrolleras med lögnskalor som mäter i vilken grad man försöker försköna sina svar. Ett annat sätt att komma ifrån förställningstendenser kan vara ipsativa items som t.ex frågar efter vilken av två olika egenskaper som stämmer bäst. Nackdelen med ipsativa skalor är att de inte medger jämförelser mellan individer. • Vilket medelvärde och standardavvikelse har Stanine-skalan? • Vad innebär ipsativ itemkonstruktion? Stanine-skalan: Skalan går från 1 till 9 och är standardiserad så att den har ett medelvärde på 5och en standardavvikelse på ungefär 2. (s 52 i Kaplan). På en ipsativ skala kan man uttrycka val mellan alternativ som ligger på två olika skalor. Man väljer alltså ett alternativ på bekostnad av det andra alternativet. Sedan kan man få fram en relation mellan de svar som ligger på den ena skalan, och de som ligger på den andra. • Vilket medelvärde och standardavvikelse har T-skalan? T- skalan: Medelvärde: 50 Standardavvikelse: 10. • Vilket medelvärde och standardavvikelse har IK-skalan? IK- skalan: Medelvärde: 100 Standardavvikelse: 15. • Vilket medelvärde och standardavvikelse har Wechsler-skalan? • Vilket medelvärde och standardavvikelse har Sten-skalan? Sten-skalan: Medelvärde 5,5 Standardavvikelse 2. • Vad innebär Standard Error of Measurement (SEM)? Om en student gör samma prov flera gånger (utan att hans kunskapsnivå ändras) så är det möjligt att resultatet på provet ändå kommer att vara lite lägre eller högre än den poängen som exakt skulle överensstämma med studentens kunskapsnivå. Så denna skillnad mellan det aktuella testresultatet och det hypotetiska högsta eller lägsta resultatet man skulle kunna få på samma test är Standard error of measurement. Eller också om denna student faktiskt skulle göra flera test så skulle standardavvikelsen av testresultaten bero på standard error of measurement. Det går inte att göra interpersonella jämförelser med hjälp av ipsativa test. Med det menas att man inte kan mäta individernas absoluta värde på någon skala. Varje person blir sin egen referensram. (Kaplan, s 374) • Ge ett exempel på ett test med ipsativ itemkonstruktion? GPI; Gordons personality inventory. Anses vara kvasi-ipsativt, Örjan menar att det är varken eller. Test makarna själva hävdar att det är både ipsativt och till viss del normativt, då vissa delar är normerade. Detta trots att grejen med ipsativ konstruktion är att den ej går att normera. Läs gärna mer om detta då det kan vara oklart. Men så vitt jag kan läsa mig till är detta test egentligen helt ipsativt, enligt andra test makare. Det kan även nämnas här att MBTI även det är lite ipsativt, men inte helt och att det inte • Vad innebär Forced choice? heller är normerat. Forced Choice innebär att man skapar alternativ som svar på en fråga och genom detta tvingar testpersonen att välja ett svar. Gordons personlighetsinventorium (åtminstone kvasiipsativt) • Vad innebär svarsskalan Likert? Likertskalan är den skalan som oftast används i frågeformulär. När testpersonen svarar enligt Likertskalan så ska han ta ställning till hur mycket han håller med om ett påstående. Till ex: Strongly disagree, Disagree, Neither agree nor disagree, Agree, Strongly agree . Denna skala mäter antingen positiva eller negativa svar på ett påstående. Ibland används en fyrskala, vilket är ett forced choice alternativ eftersom mellan alternativet ”Neither agree nor disagree” inte är tillgängligt. Det finns problem med Likertskalan, testpersoner kan vilja Myers Briggs (vissa delar har ipsativ svarsskala). Allmänna frågor kring test • En väsentlig del i testkunskapen är att kunna administrera test på ett professionellt sätt. Vad ska man som testgivare tänka på för att testningen ska utföras på ett tillförlitligt sätt? Att testmiljön är samma för alla testdeltagare Man ska tänka på att vara på samma sätt mot alla testdeltagare, både innan och under testet. Forskning har visat att testresultaten kan variera om testgivaren är positiv och uppmuntrande eller om han/hon är negativ eller neutral. Att verbala test är känsliga för språkkunskaper Att testgivaren har tillräcklig erfarenhet och utbildning av testet Man ska vara uppmärksam på förväntanseffekter, att man får de resultat man förväntar sig att få Att olika personer reagerar olika på testsituationen, ex tentaångest och andra inte presterar på bästa sätt under tidspress. tänkandet, det kan göra att man missar saker i testningen. C) Ett tredje spår är hur testgivaren kan påverkas. Örjans föreläsning 2 och Kaplan kap 7 Frågan berör administrativ standardisering, dvs att: Anvisningarna är lika och tydliga Individer testas under snarlika förhållanden A) Kaplan tar upp några "fallgropar" att tänka på: Relationen mellan examinatorn och den som testas: Vilken typ av feedback man ger påverkar testresultatet. Uppmuntringar förbättrar poängen. Även rapporten man skriver kan tolkas, så att resultatet påverkas. Språkkunskaper: Om fp kan flera språk, bör testet ges på det språk fp kan bäst. Skicklighet hos testaren: Försök visar att antalet misstag gick ner efter cirka 10 administreringar med WAIS-R. Misstag är ett avsteg från målet med lika förhållanden. Förväntningseffekter: Kallas också Rosenthal effects. Test har visat att om testaren förväntar sig bra resultat blir resultatet också bättre, och vise versa. Det verkar också gälla att fp tycker responser från testare som de tror är intelligenta är bättre och tvärtom. Kontrollerade förhållanden: Ter sig självklart. Test har visat att om barn får godis eller pengar ändrar det förutsättningarna, beroende på vilken bakgrund barnen har. Individuella variabler: Ex testångest, hormoniella effekter, (ex. menstruation), ålder, medicinering etc. kan påverka resultatet. Detta kan var svårt att göra något åt, men ändå kanske viktigt att ha i åtanke vid utvärderingen av resultatet. B) Ett annat spår är datorer som administratörer. Det har visats att: Datorer ger bra standardisering Kan skräddarsys gentemot fp Ger bra precision i tidtagning "Mänskliga administratören" kan göra andra saker Fp blir inte stressad (Vår föreläsare gav dock ex. på att vissa blir extra stressade av datorer, men förblir lugna vid sociala relationer) Ger kontroll av bias, ex. förväntningar etc. Det har också visat sig att fp är mer ärliga gentemot datorer i MMPI-test. Problem som tagits upp är att rapporter från datatest kan vara svårtolkade för oerfaren psykolog, jämfört med kliniska rapporter. Poängsättningen är också svår att kontrollera. Vidare är validiteten inte alltid kontrollerad, och svår att bedöma utan tillgång till programvaran. Ett ytterligare problem är att låta datorn göra för mycket av Om testgivaren får instruktioner att han ska kontrolleras, blir testningen bättre. Ett sätt att minska problemet är att slumpvis kontrollera testgivarna. Testgivare tenderar att bli mindre strikta när de lär sig testet. Ett tredje problem är att man tror att man är bra på att bedöma människor, om de tex. ljuger. Tester visar dock att det är mycket svårt. Boken kommer inte så långt här, men kan vara värt att tänka på att egen bedöming av människor är klurigt. Halo effekten, tendensen att man tillskriver någon positiva attribut bara beroende på de beteenden man observerat. Ett sätt att komma åt detta har varit att testa specifika attribut och generella "performances" för sig. Då ökar diskrimitiviteten mellan de delarna. • Vilka faktorer, förutom personens förmåga att lösa testuppgifterna, kan påverka ett testresultat? Enligt klassisk testteori utgår från att det finns ett sant värde, som skulle synas i testet om det inte fanns några mätfel. Skillnaden mellan det uppmätta värdet och det sanna värdet kallas för mätfel. Ett annat antagande i klassisk testteori är att mätfelen är slumpmässiga. Det uppmätta resultatet kommer alltså att se ut som en nomalfördelningskurva med det sanna värdet i mitten. Förutom de slumpmässiga mätfelen finns det även systematiska mätfel, alltså mätfel som alltid drar åt samma håll från det sanna värdet, till exempel att en fråga är dåligt eller tvetydig formulerad (eget, antaget exempel!). (Källa: kaplan, s.101-102) I vilken utsträckning administreringen är standardiserad. Förväntningar hos testledaren Förstärkning, uppmuntran på specifika svar Testpersonens tillstånd vid testning. Ex. prestationsångest etc. Språkbakgrund eller språkbegåvningsnivå. Utbildningsnivå hos testledaren vad gäller det aktuella testet. Beteendeobservationer Reactivity – när en person vet att han blir observerad. Contrast effect – när man bedömmer samma beteende olika vid olika tillfällen. • Vad menas med testing of limits? Om barnet har svårt med uppgifterna eller ger avvikande svar, kan det vara bra att få veta hur barnet tänker och fungerar. Vad som krävs då är att man frångår testramarna och använder materialet friare. Detta kan man göra genom att: 1) -ge barnet extra hjälp, t.ex. genom att ge första steget i en problemlösning, ställa följdfrågor och uppmuntra barnet att tänka annorlunda. 2) Fråga barnet hur det tänkt. Be barnet beskriva hur det tänkt, vilka knep han/hon använt sig av. 3) Ge barnet mer tid. Har man väl gjort ”testing om limits” på ett deltest kan man inte gå tillbaka till att testa standardiserat eftersom svårighetsgraden och karaktären på testet påverkas av dess förändringar. Ger en djupare förståelse för barnet om det utförs på ett bra sätt. Smedler, sid 70-71. Vad menas med problemorienterad utredning? Meningen är att psykolgen ska utgå från den preliminära bild av problemet man fått i början av utredningen och formar hypoteser utifrån denna. Utredaren bör försöka göra detta så brett och förutsättningslöst som möjligt. Frågor som vanligtvis väcks är kring barnets allmänna mognad, förseningar och funktionsstörningar, relationsstörningar och barnets kommunikativa förmåga såsom språkutveckling, uppmärksamhets- och koncentrationsförmåga. Påminner om explorativ faktoranalys fast applicerat på ett barn. Meningen är att man efter att ha täckt av alla dessa områden ska kunna rekommendera olika sorters behandling. En bred, problemorienterad utredning är meningsfull först om den motsvaras av en liknande bredd på åtgårdssidan. Smedler sid 26-27. • Vad menas med profiltolkning? När man gör utvecklingsbedömningar strävar man efter att få en bild av de svårigheter som barnet har, man vill se den intraindividuella variationen. Man vill kunna säga någonting om hur barnet fungerar psykiskt, alltså göra en profiltolkning. För att detta ska kunna ske måste testen man använder vara teoretiskt välgrundade. Många test man använder (t.ex. Griffiths) utgör sällan mått på en väldefinierad och avgränsad psykologisk egenskap (de är inte begreppsvaliderade). Ett test som dock kan användas som grund i profiltolkning är WISC. När man gjort faktoranalyser på WISC framträder tre huvudsakliga faktorer: verbal förståelse, perceptuell-spatial organisation och en distraktionsfaktor. Dessa kan sägas vara begreppsvaliderade och således kan man kolla om barnets profil är begriplig utifrån dessa faktorer. Stor försiktighet krävs vid profiltolkning. Smedler sida 97-98 • Vad menas med generaliserbarhet? Cronbachs teori om generaliserbarhet frångår antagandet om att varje testperson har en ”sann” poäng. Man antar istället att varje individs testpoäng representerar en mängd möjliga observationer av samma individ. Generaliserbarhet är viktigt då test inkluderar skattningar, observationer, och bedömningar utförda av testledaren eftersom likvärdigheten mellan mätningarna i dessa fall ofta är oklar. För att beräkna generaliserbarheten måste man först specificera vilken typ av generalisering man vill göra. Exempel på olika beräkningar av generaliserbarhet är: test-retest (tid och mättillfälle), homogenitet (generalisering till andra uppgifter ur samma domän) och interbedömarreliabilitet (generaliseringen mellan testledare). Kort sagt, att systematiska pröva generaliserbarheten (slå samman alla dessa mätningar till en, ett mått på generaliserbarhet) tar en sjujädrans massa energi och tid och är en högst komplicerad process. Generaliserbarhet äger sin giltighet i att det suddar ut gränserna mellan reliabiltet och validitet, vilket är bra eftersom validitetsbestämningar ofta är haltande. Ett annat värde är att klassisk reliabilitetsteori inte är tillfredsställande vad gäller mätningar av observationer och skattningar, som är vanligt vid barntest. Generaliserbarhet skulle vara ett gott komplement/ersättningsmått. Smedler sida 21-22 • Vad menas med projektiv testmetod? (Försök svara kort!) Bygger på psykodynamisk teori. Utgår från psykisk determinsim, att vi huvudsakligen styrs inifrån, av våra personligheter och undermedvetna processer. När en person betraktar en bild tolkar han/hon den från tidigare erfarenheter och ger således utlopp för sina behov och konflikter. De projektiva metoderna antas synliggöra djupare och omedvetna nivåer av personligheten. Individen är ovetande om vad han/hon avslöjar när bilden/händelsen/situationen tolkas. Varje svar och uttryck antas vara meningsbärande och ett testprotokoll från ett projektivt test tillräckligt uttömmande för att kunna göra en personlighetsdiagnostik. Den som hävdar annorlunda kommer att bli hemsökt i sina drömmar av självaste Sig(is)mund första söndagen i varje månad! Machover och CAT är exempel. Smedler sida 49 • Beskriv de viktigaste skillnaderna mellan maximal prestationstest och typiskt utförandetest. Ett maximal prestationstest mäter vad en individ som bäst kan prestera. Till denna kategori hör test som avser att mäta en individs maximala förmåga. Tex färdighetstest, nivåbestämningstest, funktionstest. Typiskt utförandetest avser istället mäta hur en individ vanligtvis reagerar i en given situation. Exempel på dessa är: personlighetstest, personlighetsstörningstest, attitydformulär och diagnostiseringshjälpmedel. Även projektiva test hör till kategorin typiskt utförande. • Ett psykologiskt test konstrueras för att vara ett värdefullt verktyg i en bedömningsprocess. Vad innebär, i detta sammanhang, att ett bra test diskriminerar och att resultaten för en stor population bör följa normalfördelningskurvan? Mabon (2006, s. 120) skriver i kapitlet om psykometri, att test oftast är ”utformade så att de ger symmetriska fördelningar för testresultaten, det vill säga varken negativt eller positivt skeva. Vidare vill man gärna att resultaten grupperar sig på så sätt att stora flertalet testade befinner sig relativt nära medelvärdet, medan endast ett fåtal i vardera riktningen presterar långt från detta medelvärde. En fördelning med sådana egenskaper kallas för en normalfördelning, och en betydande del av våra psykometriska resonemang är uppbyggda kring antagandet att våra testresultat (ungefär) följer en sådan fördelning, åtminstone för en större och representativ grupp testade.” Detta att ett bra test diskriminerar innebär, som jag förstått saken, att testet går att använda för att särskilja individer utifrån deras värden på testet, dvs att med hjälp av testet går det att differentiera mellan individer. Att ett bra test diskriminerar innebär att testet särskiljer - på ett (förhoppningsvis) inte otillbörligt sätt. Ett test bör t.ex. inte diskriminera med avseende på kön, etniskt ursprung och ålder. Däremot är det bra om ett test särskiljer på så vis att en testpersons (tp) resultat på testet kan jämföras med populationens resultat på testet, så att man t.ex. kan se om en tp presterar bättre eller sämre än medel samt hur många andra i populationen (hur många procent av dem) som har högre eller lägre resultat, eller som ligger inom samma intervall. En populations resultat följer ofta normalfördelningskurvan, om populationen är tillräckligt stor, där de flesta av individernas (individerna i populationen) resultat hamnar nära medelvärdet för hela populationen. Ju längre ett resultat är ifrån medelvärdet, antingen lägre och högre, desto färre individer återfinns. Denna symmetriska fördelning (som jag knappast tror att jag behöver rita ut hur den ser ut) på en populations resultat ger stora möjligheter till jämförelser. Individers resultat kan med hjälp av en normalfördelning jämföras med varandra och man kan även undersöka om skillnaden mellan deras resultat beror på verkliga skillnader mellan individerna eller på slumpen. En normalfördelning ger information bl.a. om hur många procent av populationen som befinner sig inom ett visst intervall (t.ex. en standardavvikelse). Vet man således att populationens resultat är normalfördelad, samt känner till normalfördelningens medelvärde och standardavvikelse (dvs testet är normerat), så kan jämförelser och särskiljanden mellan olika testpersoners resultat enkelt göras. (från fhanér sid 51ff + örjans föreläsning nr 3) Format, papper eller data • Du har fått i uppdrag av ett känt svenskt testförlag att komma med synpunkter på ett engelskt test som man funderar på att ge ut i Sverige och som du har fått till påseende. Testet rubriceras som ett personlighetstest. Nu när du skall lusläsa manualen och ev. övrig information du har. Vilka uppgifter är du främst intresserad av och vilka krav ställer du på testet? Beskrivning, allmän ex. vad avses mätas, historisk bakgrund. Värderingsfri faktabeskrivning Stiftelsen för Tillämpad Psykologi (STP) har tidigare gjort och gör fortlöpande granskningar av både begåvningstest och personlighetstest. STP arbetade efter ett bedömningssystem som i stora drag undersökte följande för respektive test: Förutsättningar, vad krävs utöver de normala förutsättningarna? (tystnad, god belysning och ventilation, bordsyta och sittplats). Priser, för start och varje bjudning Service, finns det möjlighet till rättning, tolkning via leverantören 2. Historik och beskrivning Typ av skala, pers.test (fördelas grovt i två skalor: ipsativa eller normativa även projektiva test förekommer). Typ av poäng, vilka värden får man ut, råvärden och andra skalor som kan tas fram via manualen. 3. Administrering Bakgrundsdata: Namn, typ, tillbehör, användarvillkor, format, priser och service. Tid, Bedömningen utgår från att testningen görs av en person med erfarenhet av testet. Tiden delas in i förberedelsetid, bjudningstid, poängberäkning, analys, presentation. Historik och beskrivning: Faktabeskrivning, typ av skala, typ av poäng 4. Användardokumentation Administrering: Förutsättningar, utrustning, tid Material som medföljer, exempelvis hur är trycket, strukturen och organisationen. Bedöms från 0-5. Läsbarheten i materialet, är det lätt att sätta sig in i utifrån språk, termer, översikt,. Mäts också på en skala från 0-5. Användardokumentation: Materialets tryckkvalitet, läsbarhet, användarvänlighet Vetenskaplig dokumentation: Allmän teknisk dokumentation, validitet (kriterierelaterad, begreppsvaliditet), reliabilitet (homogentitet, stabiliti´tet), normer (ändamålsenlighet, allmängiltighet, stickprovsstorlek); omfattning och tydlighet i dokumentationen. Denna granskning mynnar ut i ett sammanfattande utlåtande som omfattar: Utvärdering av den tekniska dokumentationen Utvärdering av omfattning och tydlighet Design: lätt att läsa, fylla i, tolka Allmänt omdöme: användningsområden samt begränsningar, utbildningsbehov Slutsats 5. Vetenskaplig dokumentation Kvalitén i den tekniska dokumentationen samt omfattning och tydlighet i innehållet, bedöms 0-5 där två eller högre är acceptabelt. 6 Validitet Kriterie- samt begreppsvaliditet. När och var är studierna gjorda, har prediktiva studier gjorts, hur har kriterier valts ut. Helheten bedöms på 0-5 gradig skala. Vilken mängd data redovisas? 7. Reliabilitet Bedöms som validiteten. Homogenitet, mängd o median. Stabilitet, mängd o median. (Mabon, s. 190-193). 8. Normer, bedöms likt validitet o reliabilitet. Ändamålsenlighet samt allmängiltighet bedöms liksom stickprovsstorlek (Källa: Artikeln om kvalitetskriterier vid personlighetsbedömningar) 9. Sammanfattande utlåtande. Enligt STPs kvalitetskriterier bör följande undersökas i ett test för personlighetsbedömning: Allmän beskrivning av granskning samt kommentarer till de betyg som satts. Huvudfrågan är: lever testet upp till sina anspråk? 1. Testinformation Typ av instrument (ex. typiskt utförande, attitydformulär) Fråga 7 En väsentlig del I testkunskapen är att kunna administrera test på ett professionellt sätt. Vad ska man som testgivare tänka på för att testningen ska utföras på ett tillförlitligt sätt? Svar: (Psychological testing, kap 7, s184). Tillbehör, vad behövs för att bjuda testet Att testmiljön är samma för alla testdeltagare Namn, förläggare, distributör Användarvillkor, vilka krav ställs från leverantören i form av utbildning av testledaren Formulär, vilka finns, beskrivning av dessa Man ska tänka på att vara på samma sätt mot alla testdeltagare, både innan och under testet. Forskning har visat att testresultaten kan variera om testgivaren är positiv och uppmuntrande eller om han/hon är negativ eller neutral. Att verbala test är känsliga för språkkunskaper Att testgivaren har tillräcklig erfarenhet och utbildning av testet Man ska vara uppmärksam på förväntanseffekter, att man får de resultat man förväntar sig att få Att olika personer reagerar olika på testsituationen, ex tentaångest och andra inte presterar på bästa sätt under tidspress. • Som ortens mest berömde psykolog har du blivit inbjuden av Rotary att hålla en föreläsning om psykologiska test. Man har sagt till dig att man främst vill veta vad som skiljer ett bra ”intelligenstest” från ett dåligt sådant. Vilka punkter tycker du är viktigast i ditt föredrag och vilka viktiga krav på tester vill du förmedla till dina åhörare? Och hur är det med intelligensbegreppet? Ref. Kaplan s. 231. Fahner s. 70, 93. Mabon s. 57, 116. För att kunna säga huruvida en person är intelligentare än en annan måste man först definiera begreppet intelligens. Det finns många försök till att göra detta. Ett par exempel är Binets definition som lyder ”the tendency to take and maintain a definite direction; the capacity to make adaptations for the purpose of attending a desired end, and the power of autocritisism”, och Spearman som definierar intelligens som förmågan att härleda antingen relationer eller korrelationer. Oavsett hur man väljer att definiera intelligens så förblir begreppet abstrakt. Hur väl ett test mäter intelligens kan undersökas genom att se hur testet korrelerar med sådant beteende som man kopplar samman med intelligens. En eventuell korrelation visar att testet mäter någonting som hänger samman med intelligensbegreppet, man säger att testet har begreppsvaliditet. En förutsättning för god validitet i ett test är reliabilitet, testet ska vara ett pålitligt mätinstrument. Reliabiliteten är ett mått på mätsäkerheten i testet, hur stor del av variansen i testresultaten som beror på reella skillnader. För att man ska ha någon nytta av resultaten från ett intelligenstest måste man ha något att jämföra med, testet måste vara normerat. Ett normerat test har normtabeller där man kan läsa ut hur ett testresultat förhåller sig till den population som tabellen gäller. Det är mycket viktigt att den normgrupp som man jämför mot är relevant för personen vars resultat man analyserar. De krav jag tycker man ska ha på ett intelligenstest är först och främst att det ska finnas en manual. Manualen ska definiera vad det är testet avser mäta och presentera reliabilitet- och validitetsundersökningar för detta. Testet ska också vara normerat för den population man avser använda det på, detta för att få en rättvisande referens. Det är såklart viktigt att testet är ordentligt utvärderat, normerat och reliabilitets och validitetstestat och att dessa uppgifter finns redovisade.... Men att få det formulerat på det sättet är kanske inte rotary så intresserade av. Med begreppet intelligens kan man mena lite olika saker. En tidig teori som med viss modifikation står sig än idag är Spearmans g-faktorteori. Han menade att det finns en generell intelligens som kunde manifesteras lite olika hos olika människor men att det ändå rörde sig om en övergripande begåvning och inte en begåvning för ett visst område, som t.ex. språklig eller numerisk begåvning. IQ är också ett mått på allmän begåvning som används än idag iform av IQ-skalan för att beskriva hur olika resultat förhåller sig till popuationen i stort. Ett test som används i Sverige som anses mäta g-faktor är Ravens matriser. En teori som istället hävdar att intelligens består olika av varandra oberoende faktorer är Thurstones 7-faktor modell. De 7 sk primärfaktorerna är verbal försåelse, verbal rörlighet logiskt tänkande, numerisk förmåga, minne, spatial förmåga och varseblivningshastighet. Denna modell är speciellt användbar när man i reryteringssammanhang söker efter en viss sorts begåvningsprofil. I Sverige har testföretaget SHL Sverige AB utvecklat test med specifika yrkesrelaterade begåvningsprofiler, t.ex. ett testbatteri för tillämpad teknologi ATS.(Mabon s. 244) Senare forskning har genererat en ytterligare modell som i viss mån integrerar de båda tidigare.I denna hierarkiska modell tänker man sig att g-faktorn är den viktigaste och övergripande begåvningsfaktorn som framför allt består av logisk förmåga och att det under den finns 3 specifika begåvningar; spatial, språklig och numerisk förmåga. Detta säger inte på lång väg allt om begreppet begåvning men de är de tre mest efterforskade modellerna utifrån vilka man också har kunnat utveckla tillförlitliga mätmetoder för att uppskatta individers begåvning. Utifrån den hierarkiska modellen har man i sverige utvecklat testet basIQ För att ett intelligenstest ska kunna utvärderas som bra eller dåligt krävs det alltså att man har definierat (operationaliserat) begreppet intelligens eller begåvning. Det krävs också att man har utvecklat metoder(test) som med godtagbar säkerhet faktiskt kan ge ett mått på detta. Ett bra test ska alltså ange hur det definierar begåvning och ange på vilket sätt man har kunnat visa att det är just det som testet också mäter. Källa: H Mabon, s. 57-61, s- 239-244. • I ditt kliniska arbete har du bestämt dig för att bland annat använda psykologiska test när du gör utredningar av individers problem. Motivera varför och beskriv inför vilka frågeställningar du använder test i stället för (eller tillsammans med) andra alternativa metoder. Jag har försökt samla ett antal argument till varför psykologiska test är lämpligt att använda vid utredningar av individers problem. Test kan anses vara mer objektiva än andra metoder, d v s mer befriade från slumppåverkan (Frasses handout 1 s 5). Test är relativt sätt enkla och snabba att använda (Frasses handout 1 s 5), vilket ger tids- och kostnadsmässigt positiva effekter. Smedler (s 11-12) beskriver att den vanligast tillämpade undersökningsmetoden, intervju, kan i arbete med barn vara begränsad p g a deras begränsade förmåga att uttrycka sig i tal. Smedler konstaterar därmed värdet med test som metod. Det finns för test genomarbetade och beprövade metoder för att utvärdera kvalité (Jämför standardisering och reliabilitets- och validitetsmått). Psykologiska test är tillämpbara i samband med flertalet frågeställningar. Jag har här valt ut tre områden, personlighets-, neuropsykologisk-, och begåvningsproblematik, som jag uppfattar som centrala inom klinisk tillämpning. I dessa sammanhang kan det vara lämpligt att endast använda psykologiska test eller att kombinera test med andra metoder. Vid personlighetsproblematik, kan test ex vis SSP tillsammans med SQID-2 vara lämpligt som underlag i en utredning. Vid neuropsykologiskproblematik kan test vara ett effektivt verktyg för att förstå funktionsnedsättningen och utgöra underlag för diagnostisering och åtgärdsprogram. Vid begåvningsproblematik kan test som WAIS, WISC vara effektivt för att kartlägga brister och resurser. Källa: Frasses handout 1 s5, Smedler s 11-12 och egna resonemang. • Testanvändaren har ofta att ta ställning till etiska frågor, varav två av de viktigaste berör skydd mot intrång i privatlivet samt sekretess. Diskutera vad dessa termer innebär, i vilka situationer de är särskilt relevanta, samt hur man värnar testtagarnas integritet. Resultaten från en testning är en integritetsmässigt känslig handling som ska hanteras därefter. För datalagrat material styr personuppgiftslagen hanteringen och för vissa yrkesgrupper gäller journalföringslagen. I organisationer där testresultat betraktas som offentlig handling ska rutiner finnas som värnar om de testades integritet. Sorry men här kunde jag inte hitta något bra svar. Tror att man kan babbla en hel del om självklara saker om hur testreusultat skall behandlas. Test för att mäta maximal prestation • Hur översätter du ”achievement” och ”aptitude” till vardagssvenska? Achievement kan översättas till förmåga eller kunskap som bygger på tidigare inlärning, dvs redan formad begåvning. Aptitude kan översättas till fallenhet eller anlag, dvs formbar begåvning. Aptitude syftar på ens potential att lära in en specifik färdighet Både achievement och aptitude är ex på begåvningtermer 1. Achievement: typ; ”crystalized intelligence”, kunskap, förmåga, erfarenhet, inlärd kunskap. (Anses redan formad). 2. Aptitude: typ; ”fluid intelligence”, fallenhet, anlag, logisk förmåga, problemlösnings förmåga, det som vanligtvis kallas för generell G faktor. Olika begåvningsmodeller: Spearman, Thurstone, Gustafsson och G-faktorn • Vad kännetecknar Charles Spearmans begåvningsteori? Enligt Spearmans begåvningsteori finns det en generell mental begåvning som ligger till grund för allt intelligent beteende. Spearman kallade denna generella mentala begåvningen för g-faktorn (Mabon, s. 58). Intellektuell prestation beror alltså dels på g-faktorn och dels på den speciella förmåga som krävs vid den specifika uppgiften. Graden av g-faktorns betydelse varierar förvisso från uppgift till uppgift men eftersom g-faktorn ändå är inblandad i i stort sätt alla uppgifter anses det av många vara grunden för intelligens. Spearman undersökte skolbetyg och uppmärksammade att betygen i olika ämnen ofta korrelerade positivt. Spearman upptäckte också att individers resultat på en mängd olika begåvningstest korrelerade och definierade alltså g-faktorn som den gemensamma nämnaren (Passer & Smith, s. 308). Spearman uppfann år 1907 faktoranalytiska metoder för att studera intelligensens faktorstruktur. Han myntade begreppet G-faktor som avsågs förklara allmänbegåvningen. Enligt Spearmans s.k. tvåfaktorteori beror varje intellektuell prestation dels på en allmän faktor (g), som i större eller mindre grad har betydelse för alla uppgifter, dels på en specifik faktor (s), som har betydelse för en viss typ av uppgift. Spearmans teori utgår alltså ifrån att det finns en generell begåvning som kommer att ligga till grund för hur man presterar på olika områden. Begåvningen kan enligt S. manifesteras på olika sätt, men specifikt för Spearmans teori är ändå att det finns en G-faktor som är ett övergripande mått på ”flytande intelligens”. (Mabon, 58), (NE sökord ”Spearman”) • Vad innebär G-faktorn? Ref. Mabon s. 58, 163. G-faktorn, den generella faktorn, är enligt Spearman det övergripande måttet på begåvning, även om begåvningen kan manifesteras på många olika sätt så har g-faktorn påverkan på alla begåvningstyper. Thurstones sjufaktormodell talar emot g-faktorn, Thurstone ansåg att den var en produkt av de relativt primitiva statisktiska metoder (faktoranalys) som Spearman använde. Thurstone använde multipel faktoranalys vilket resulterade i att g-faktorn ersattes av sju olika begåvningsfaktorer som inte verkade ha någon gemensam nämnare. Den hierarkiska modellen slår samman dessa motstående teorier, g-faktorn är den övergripande, dominerande och främst logiska begåvningen, på en lägre nivå finns spatial, språklig och numerisk begåvning. G-faktorn anses tillförlitlig gällande prognoser för framtida prestation och framgång på arbetsmarknaden. Ref. Kaplan s. 234. En underliggande faktor till allt intelligent beteende. Intelligens består av en generell faktor (g) plus ett stort antal specifika faktorer. Modellen grundad i fenomenet att när man ger olika begåvningstester till en generell population så korrelerar dessa test positivt, oavsett vilka olika förmågor testen mäter, alla test mäter i någon grad g-faktorn. Enligt Spearman så kan man generellt säga att uppskattningsvis hälften av variansen i olika intelligenstest beror på g-faktorn. Det var Spearman som myntade begreppet g-faktorn och begreppet är fortfarande av stor betydelse. Intelligens ses här som en generell underliggande faktor, och en rad andra specifika faktorer. Man menar att det är g-faktorn som är den underliggande orsaken till att en persons resultat på flera olika typer av test samvarierar. Resultatet på varje enskilt test beror dels på g-faktorn och dels på den specifika förmågan när det gäller just av vilken typ det enskilda testet är. (tex om det mäter verbal förmåga) Om man testar en person med flera olika test som fokuserar på olika saker så tar dock de specifika förmågorna ut varandra och man kommer allt närmare att bara mäta själva g-faktorn. (psychological testing s 235-236) • Inom begåvningsteori och konstruktion av vissa begåvningstest så talar man om en generell G-faktor. Vad innebär denna? Beskriv kortfattat ett test som mäter G-faktorn. ”Spearman myntade begreppet g-faktorn, den generella faktorn, som fortfarande är av stor betydelse i intelligensdebatten. Enligt Spearmans synsätt var g-faktorn det övergripande måttet på begåvning…” (Mabon, 2006, s. 58) Ett test som avser att mäta (bland annat) g-faktorn är BasIQ. Se testbeskrivning. G-faktorn myntat av Charles Spearman, står för en generell begåvning och motsvarar förmågan att lösa problem och dra slutsatser ur komplex information. Inom begåvnings mätning så pratar man om en formbar begåvning dvs. G-faktorn där specifika fallenheter, logisk problemlösningsförmåga och en underliggande slutledningsbegåvning lyfts fram. Den g-faktor man har genereras till personens alla andra förmågor. Detta kan vara ett antal breda faktorer (språklig, spatial och numerisksnabbhet) som i sig inte är observerbar utan endast kommer till uttryck i olika aktiviteter. Tester som är avsett att mäta g-faktorn är bl.a. BasIQ (g-fakotor samt spatial, verbal och numerisk förmåga) samt Ravens matriser som skapades på 50-talet för just Spearmans forskning om den eduktiva förmågan. Källa: Kaplan s. 234-236 och Testbeskrivningar • Vad kännetecknar Louis Thurstones begåvningsteori? Modellen är en flerfaktorteori. Intelligens enligt Thurstone består av 7 olika faktorer (dessa heter olika på svenska beroende på källa, men jag använder mig av Örjans handouts från föreläsn 2). Faktorerna är: Verbal förståelse, perceptuell snabbhet, logik, numerisk förmåga, spatial förmåga, verbalt flöde, minne. • Vad innebär Flerfaktorteorin? Flerfaktorteorin utvecklades av Louis Thurstone som reaktion mot Spearmans g-faktormodell. Flerfaktorteorin går ut på att det finns sju begåvningsfaktorer som är relativt oberoende av varandra. De kallas primära faktorer och utgörs av: V (verbal förståelse), W (verbal rörlighet), R (logiskt tänkande), N (numerisk förmåga), M (minne), S (rumsuppfattning) och P (varseblivningssnabbhet). Indelningen tyder på att vi kan vara begåvade inom vissa områden och sämre inom andra, vilket kommer till användning t.ex. inom rekrytering. Man kan alltså sammanställa ett begåvningstest som passar för en viss profil. Läs mer i Mabon s. 58 och Kaplan s. 246. Flerfaktorterorin nämns också på den handout som heter Psykologiska testmetoder, föreläsning 2. Flerfaktorteorin utvecklades av Louis Thurstone som reaktion mot Spearmans g-faktormodell. Flerfaktormodellen kom att ersätta g-faktormodellen eftersom den bygger på mer raffinerade statistiska metoder, s.k. multipel faktoranalys. Flerfaktorteorin går ut på att det finns sju begåvningsfaktorer som är relativt oberoende av varandra. De kallas primära faktorer och utgörs av: V (verbal förståelse), W (verbal rörlighet), R (logiskt tänkande), N (numerisk förmåga), M (minne), S (rumsuppfattning) och P (varseblivningssnabbhet). Denna indelning tyder på att vi kan vara begåvade inom vissa områden och sämre inom andra, vilket kommer till användning t.ex. inom rekrytering. För att bli pilot kanske höga resultat på vissa av dessa förmågor är idealiskt, medan andra förmågor passar för en säljare. Man kan alltså sammanställa ett begåvningstest som passar för en viss profil. Läs mer i Mabon s. 58 och Kaplan s. 246. Flerfaktorterorin nämns också på den handout som heter Psykologiska testmetoder, föreläsning 2. • Beskriv sammanfattande den begåvningsmodell som brukar kallas flerfaktormodellen. Beskriv kortfattat ett test som bygger på denna modell. Thurstone kan sägas vara fadern till flerfaktormodellen. Han reagerade mot G-faktorn vilken han ansåg vara ett resultat av primitiva statistiska metoder. Thurstone använde sig av multipel faktoranalys, en mer gedigen statistisk metod och efter denna utformade han sju, ganska fristående begåvningsfaktorer. Dessa är i sin korthet: 1) verbal förståelse 2) verbal rörlighet 3) ogiskt tänkande 4) numerisk förmåga 5) minne 6) rumsuppfattningförmåga 7) varseblivningssnabbhet. Testet har väldigt stor giltighet vad gäller arbetspsykologisk testning. Varför? Jo, eftersom begåvningarna skiljer sig så pass mycket åt (man kan vara begåvad inom vissa områden och sämre inom andra) kan man försöka fastställa den ”bästa” begåvningsprofilen för en viss befattning. Thurstones dimensioner och måtten har visat sig ha god prediktiv förmåga avseende framgång inom olika arbeten. APU är som ni kanske förstått ett av de test som bygger på denna teori. Om ni vill läsa mer om detta test hänvisar jag eder till den s.k. testluntan. Mabon, sida 58-59 För beskrivning av Thurstone’s flerfaktormodell, se fråga 14 där jag redan försökt svara på den saken. APU (Arbetspsykologiskt Utredningstest) är ett test som bygger på denna teori. Testet är avsett att användas vid rådgivning, rekrytering, vägledning, urval och rehabilitering. De olika deltesten mäter Thurstone’s sju primära faktorer på olika sätt, exempelvis finns test som formlogik, ordförståelse, associationsflöde, simultankapacitet, stresstolerans, matematik i praktiken och perceptuell snabbhet. Hela testet tar ca 2,5 h. En kritik mot APU är att validiteten är dåligt testad. Reliabiliteten har däremot testats och det visade sig att homogeniteten är tillräcklig (0,7 – 0,8) och att stabiliteten är mycket bra (r > 0,85). Den höga reliabiliteten kan bero på att testet har tydliga instruktioner och därmed är lätt att administrera. Man kan läsa mer i häftet Testbeskrivningar. • Vad kännetecknar en hierarkisk modell begåvningsteori? Forskning har visat att begåvning förmodligen bäst kan förklaras av en hierarkisk modell. Denna kännetecknas av att det finns en övergripande nivå bestående av en dominerande g-faktor (g-faktor, ursprungligen Spearmans teori, se s 58), vilken främst består av logisk förmåga. Under denna nivå finns en nivå bestående av tre förgreningar – spatial, språklig och numerisk begåvning (jämför Thurstones sju primära faktorer, se s 58). Källa: Mabon, s 58-60 • Ge exempel på en hierarkisk modell begåvningsteori. Spearmans begåvningsmodell utgår från att det finns en underliggande faktor, g-faktorn och under denna finns ett helt gäng med specifika faktorer. Dessa är t.ex. numeriskt resonerande, vokabulär och mekanisk förmåga. Man kan alltså se intelligens som både generell förmåga och specifik. Enligt Spearman influeras alla givna test -hur olika de än är- av g-faktorn. Många psykologiska test idag använder sig av liknande hierarkiska begåvningsmodeller, t.ex. McCarthys skalor och Leiter-R för barn och WAIS för vuxna. Kaplan, sida 235 • Beskriv sammanfattande den hierarkiska begåvningsmodellen och ett test som bygger på denna modell. Den hierarkiska begåvningsmodellen kan sammanfattat beskrivas bestå av en övergripande nivå bestående av en dominerande g-faktor, vilken främst består av logisk förmåga. Under denna nivå finns en nivå bestående av tre förgreningar – spatial, språklig och numerisk begåvning. uttryck vid muntlig eller skriftlig framställning), logiskt tänkande, numerisk förmåga, minne, spatial förmåga och varseblivningssnabbhet (förmåga att kunna korrekt uppfatta detaljer likheter och skillnader i former av olika slag). Ett test som baseras på denna modell är det svenskutvecklade BasIQ. För beskrivning av BasIQ, se kompendium ”testbeskrivningar”. Indelningen tyder på att människor kan vara begåvade inom vissa områden och sämre inom andra. Denna modell kom efter Spearman’s och Thurnstones modeller. Man kom fram till denna modell med hjälp av konfirmatorisk faktoranalys (och det lärde vi ju oss vad det är inför duggan). I den konfirmatoriska faktoranalysen ingår bl.a. ett datorprogram, LISREL, och man kan då med denna revolutionerande metod signifikanstesta hypoteser. Man kom då alltså fram till den hierarkiska modellen genom sådan signifikanstestning. Och vad innebär modellen? Jo, att begåvningen bäst kan förklaras av en hierarkisk modell där g-faktorn är den dominerade faktorn (främst logisk begåvning), och under den finns tre olika områden; spatial, språklig och numerisk begåvning. (Mabon s. 59-60) Ett test som bygger på modellen är BasIQ. Beskriver det inte så ingående eftersom det finns ju en hel fråga för det. Testet lanserades 2000, det har nio deltest och tar en timme att genomföra. BasIQ har god reliabilitet och god begrepps- och innehållsvaliditet. Det som fattas är olika typer av kriterievalideringar (Mabon s. 242) • Beskriv sammanfattande två olika begåvningsmodeller som olika test baseras på. Exemplifiera med några olika test. Flerfaktormodellen: Thurstone använde multipel faktoranalys och kom fram till att det fanns sju oberoende begåvningsfaktorer, som han kallade primära faktorer. Dessa sju faktorer var: verbal förståelse, verbal rörlighet (förmåga att snabbt finna rätta ord och uttryck vid muntlig eller skriftlig framställning), logiskt tänkande, numerisk förmåga, minne, spatial förmåga och varseblivningssnabbhet (förmåga att kunna korrekt uppfatta detaljer likheter och skillnader i former av olika slag). Indelningen tyder på att människor kan vara begåvade inom vissa områden och sämre inom andra. Exempel på test som bygger på Thurstones sju primära faktorer är APU (arbetspsykolgiskt utredningstest), (Arbetspsykologisk testning sidan 58) Gustafssons hierarkiska modell: Denna modell kom till efter att forskare hade intresserat sig för motsättningen mellan Spearmans Gfaktor och Thurstones primära metoder. Man använde sig av konfirmatorisk faktoranalys och kom fram till att g-faktorteorin stämde, och att begåvning nog bäst förklaras av en hierarkisk modell. På den övergripande nivån finns g-faktorn som främst består av logisk begåvning, och på nästa nivå tre förgreningar, spatial, språklig och numerisk begåvning. Exempel på test som bygger på denna modell är BasIQ (arbetspsykologisk testning s 59-60) Thurstones sju primära faktorer: Thurstone använde multipel faktoranalys och kom fram till att det fanns sju oberoende begåvningsfaktorer, som han kallade primära faktorer.(Han var kritisk till spearmans g-faktormodell) Dessa sju faktorer var: verbal förståelse, verbal rörlighet (förmåga att snabbt finna rätta ord och Exempel på test som bygger på Thurstones sju primära faktorer är APU (arbetspsykolgiskt utredningstest), (arbetspsykologisk testning sidan 58) Gustafssons hierarkiska modell: Denna modell kom till efter att forskare hade intresserat sig för motsättningen mellan Spearmans Gfaktor och Thurstones primära metoder. Man använde sig av konfirmatorisk faktoranalys och kom fram till att g-faktorteorin stämde, och att begåvning nog bäst förklaras av en hierarkisk modell. På den övergripande nivån finns g-faktorn som främst består av logisk begåvning, och på nästa nivå finns tre förgreningar, spatial, språklig och numerisk begåvning. Exempel på test som bygger på denna modell är BasIQ (arbetspsykologisk testning s 59-60) Kulturella skillnader och problem • Resonera kring vilka svårigheter som kan uppstå när man använder "svenska" begåvningstest på människor som kommer från andra kulturer än den svenska. Det finns då en överhängande risk för att testledaren får missvisande resultat. Först och främst har många begåvningstest språkliga inslag och således presterar ofta nya svenskar sämre än etniskt svenskar (Mabon, s. 215). Jag kan tänka mig att en del av problemet kvarstår även om de verbala delarna översätts. Exempelvis kan ordspråk vara knepiga att översätta. I olika kulturer värderas dessutom olika sorters kunskap olika. Vad som värderas i respektive kultur och i förlängningen vilka uppgifter som bjuds i ett test bestäms av den politiskt dominerande gruppen. Risken är således stor att människor från olika kulturer som arbetar utifrån olika ”baser” missgynnas eftersom andra kunskaper än de som de själva besitter värderas högst. Ett annat problem är att det sällan finns passande normgrupper för människor som kommer från andra kulturer (Kaplan s. 556-559). Vidare har amerikanska studier visat att afroamerikaner presterar sämre än vita amerikaner när testet föregås med instruktionen att det är ett intelligenstest som bjuds. Dock presterade afroa- och vita amerikaner ungefär lika när testet föregicks med instruktionen att testet inte var relaterat till begåvning (Kaplan, s. 542). Möjligen kan resultaten generaliseras till svenska förhållanden, negativt stereotypiserade utländska grupper kanske presterar sämre än etniskt svenska på grund av förväntanseffekter hos testtagaren. Det finns många problem kring detta. Dels för att språket kan ha en stor betydelse, men om man översätter testet till deltagarens hemspråk kvarstår problem. Ett exempel är ordspråk. ”Man skall inte kasta sten i ett glashus” och ”Man skall inte sätta räven till att vakta gäss” kanske ska bedömas ha ”liknande betydelse”, ”motsatt betydelse” eller ”varken liknande eller motsatt betydelse”. Det som vi menar med intelligens i västvärlden skiljer sig från andra delar av världen. I t.ex. Afrika har intelligensbegreppet handlat om färdigheter som skapar harmoniska relationer inom och mellan grupper, medan kineser menar att begåvning är ödmjukhet och förmåga att agera utifrån rättvisa principer. Många asiatiska länder ser intelligens som en social färdighet, medan vi i västvärlden kanske främst syftar på IQ som är logisk förmåga, abstrakt tänkande med mera. APU är ett begåvningstest för att mäta maximal prestation inom sju olika områden. Det är ett arbetspsykologiskt utredningstest som alltså är grundat på Thurstones sju intelligensfaktorer (se annan fråga för beskrivning av dem). APU används främst av Arbetsmarknadsinstitutet i samband med deras utredningar, det kan handla om rådgivning, rekrytering, vägledning, urval samt rehabilitering. Testbatteriet består av följande deltest: I Sverige värderas den generella intelligensen högre än t.ex. emotionell och social intelligens och det är främst denna typ av tänkande vi lär oss i skolan. En person från en annan kultur kan ha blivit tränad i ett annat tänkande, vilket gör att han/hon missgynnas i det svenska testet. Logisk förmåga: Formlogik är ett test där en red med sex figurer bildar en serie, man ska komma på regeln och markera de som följer. Sifferlogik och bokstavslogik är samma sak fast med siffror och bokstäver. Det kan även vara svårt att göra en rättvis bedömning av nya svenskar då de jämförs med svenska normgrupper ex i anställningshänseende. Verbal förståelse: Ordförståelse 1-2-3, tre delprov med vanliga ord, främmande ord och sällan använda ord. Ordförståelse 4-5 där både nyckelord och svarsmöjligheter är främmande respektive sällan använda ord. • Du skall utföra en begåvningsutredning av en vuxen person med en icke svensk kulturell och språklig bakgrund. Beskriv vilket/vilka test du kan tänka dig att använda för detta ändamål och diskutera dess styrkor och svagheter samt varför du väljer just detta/dessa test. Jag skulle använda mig av Ravens Progressiva Matriser efterson det är ett icke-verbalt begåvningstest. Testet består av olika designade geometriska figurer som grupperats i kolumner där den sista figuren saknas. Testpersonen ska utifrån givna alternativ avgöra vilken den saknade figuren är (jag skriver inte mer om Ravens eftersom det är någon annans fråga). Fördelarna med att välja Ravens är att det anses vara oberoende av kultur, kön och ålder samt just att det är icke-verbalt. Testet är i princip självinstruerande vilket underlättar administrationen till alla grupper och det går snabbt att rätta. Testet är väl underbyggt genom en mängd studier som redovisas i manualerna. En nackdel är att det egentligen bör kompletteras med andra verbala test för att ge en bild av personens totala kapacitet. Det kan kanske vara bra att göra exempelvis WAIS eller BasIQ så länge man är medveten om att språkliga svårigheter kan göra att testresultatet blir missvisande lågt. En annan eventuell nackdel med Ravens är att många hävdar att det ska betraktas enbart som ett mått på problemlösningsförmåga i mer eller mindre rätlinjiga system, om så är fallet bör ju resultatet bara ställas i relation till andra som har gjort testet och vilken percentil testpersonen hamnar på. Verbal rörlighet: Associationer 1 och 2 är parallella test, utifrån en streckteckning komma på associationer. Ordflöde 1 och 2, utifrån nyckelord bilda så många nya ord som möjligt. Perceptiv snabbhet: Distraherande perceptuellt fält med bokstäver, siffror och figurer där man ska stryka över samma kombination som är överstruken till vänster. Simultankapacitet: Den del vi fick göra på redovisningen om APU, alltså ovanstående fast men frågor samtidigt. Numerisk förmåga: Proven alfa & omega, ex 15 och 5 räkna ut med alla räknesätt. Matematisk förmåga: Vardagliga matematiska problem. Hela testbatteriet tar ca 2,5 timmar att bjuda, det är en normrelaterad skala som omvandlas till staninepoäng. När det gäller validitet har inga egentliga valideringsstudier utförts. Reliabiliteten har beräknats med en rad olika metoder och man har funnit att homogeniteten är tillräcklig till utmärkt, och stabiliteten är utmärkt. Testbatteriet är lätt att administrera och tydliga instruktioner bidrar till den höga reliabiliteten. Det kan administreras enskilt eller i grupp, man kan även välja ut vissa av deltesten vilket ger ett stort användningsområde. Nackdelar är att det inte finns någon enhetlig manual samt som sagt att det är mycket dålig dokumentation av validiteten. Ref. Häftet testbeskrivningar. • Beskriv sammanfattande den begåvningsmodell som I första hand skulle jag välja Ravens matriser eftersom det är ett helt icke-verbalt begåvningstest. Styrkan ligger i att testet ges med samma förutsättningar oavsett modersmål hos den man testar, språkliga svårigheter ska inte ha någon inverkan, däremot kan kulturella skillnader eventuellt påverka testresultatet. Testet mäter en mycket smal aspekt av begåvning, logisk problemlösning, och behöver därför kompletteras med andra test. brukar kallas flerfaktormodellen. Beskriv kortfattat ett test som bygger på denna modell. (Bläddra till s.22) • Du har fått i uppdrag att vara behjälplig vid antagning av sökande till Polishögskolan. Du ansvarar för testdelen i denna urvalsprocess. Det är ett mycket stor antal personer som sökt. Vilket/vilka begåvningstest är det lämpligt att använda? Beskriv för- och nackdelar med det/de test du väljer. WAIS skulle kunna användas för att få en bredare bild av personens kapacitet. Eftersom testet är uppdelat i två skalor kan man lägga mindre vikt vid resultaten på deltesten i den verbala skalan och koncentrera sig på performanceskalan. Även de icke-verbala deltesten kräver verbala instruktioner så en person med dåliga kunskaper i svenska kommer förmodligen få sämre resultat också i dessa delar. Även BasIQ skulle kunna användas med samma för- och nackdelar som med WAIS. (PM om BasIQ) Exempel på test för att mäta maximal prestation Jag gör det lätt för mig och väljer BasIQ som idag används för den typen av antagningar. Generellt är det lämpligt med test för vuxna som mäter generell begåvning, dvs även Ravens matriser. • Beskriv APU- testen. Fördelar med testet: Det är relativt lättadministrerat och tar kort tid, bra då det är många sökande. Det är avsett för vuxna med minst genomsnittlig begåvning, vilket passar gruppen. Det mäter generell begåvning, vilket är lämpligt då det gäller att välja ut de mest allmänt begåvade ur ett stort urval, utan att kräva speciell begåvningsstruktur. Ett yrke som polisens kan vidare lätt motiveras kräva begåvning på många områden. Det är en väl beprövat modell att mäta begåvning på, Den testade får värde på g-faktorn samt verbal, spatial och numerisk begåvning i en hierarkisk begåvningsmodell, (med inflytande från g-faktorn exkluderad). Validiteten är acceptabel. Homogeniteten är god till utmärkt. Stabiliteten tillräcklig. Nackdelar med testet: • Beskriv, kortfattat, ett test för att mäta maximal prestation som är lämpligt att använda i: - studie- eller yrkesrådgivning. Motivera ditt val och ge en kort och översiktlig beskrivning av testet. Diskutera kortfattat de styrkor och ev. brister hos det test du valt. Jag tror att APU, arbetspsykologiskt utredningstest, är ett vettigt alternativ. Det är ett maxtest som mäter Thurstones 7 intelligenser, och används till rådgivning, rekrytering, vägledning, urval och rehabilitering. En svaghet med testet är att inga valideringsstudier har gjorts. (Källa: testhäftet) Utifrån de test vi gått igenom skulle jag här välja delar av APU. Då finns nämligen möjligheten att välja ut de deltest som man tycker är relevanta för personen i fråga. Möjligheten att kombinera olika deltest ger även ett större användningsområde, dvs. testet kan användas för fler yrkesgrupper. Andra styrkor med APU är att det är lättadministrerat både i grupp och individuellt och att normgrupperna är mycket stora. Först funderade jag på BasIQ, men i och med att det används främst för urval och rekrytering valde jag bort det även fast det till skillnad från APU, gjorts validitetsstudier på BasIQ. En annan brist med APU är att det inte finns en enhetlig manual för hela testet. Det saknas normgrupper för arbetslivet i allmänhet och polisyrket i synnerhet. Normgrupper skulle ge en mer precis urvalsprocess. Å andra sidan tappas då viss bredd i gruppen som väljs ut. Frågetecken har satts för testets face validity, i detta fallet att rekryterna inte förstår/anser att det är relevanta mätmetoder för yrket. Egna reflektioner: Testet visar inte ex.omdöme, känsla för rätt och fel, social förmåga, förmåga att ta snabba och rätt beslut etc. vilka är nödvändiga egenskaper i polisyrket. Testet är helt allmänt, dvs ger inte utslag för olika bakgrunder/erfarenheter, vilket också kan vara önskvärt inom polisyrket. APU (arbetspsykologisk utredning) grundar sig på Thurstone’s sju intelligensfaktorer: Verbal förståelse, verbal rörlighet, logiskt tänkande, numerisk förmåga, minne, spatial förmåga och perception. Testet mäter följande: Logisk förmåga: Formlogik, sifferlogik, bokstavslogik Verbal förståelse: Ordförståelse 1-2-3, ordförståelse 4-5 Verbal rörlighet: Associationsflöde, ordflöde Perceptiv snabbhet, Numerisk förmåga, Matematisk förmåga och Simultankapacitet. Testet tar 5-10 min per deltest o 2,5 timme för hela batteriet. Testet måste alltså kompletteras med ex. lämplighetsintervjuer och test i social förmåga. • Beskriv testet BasIQ. Det är lämpligt att använda BasIQ eller APU-testen i denna urvalsprocess. BasIQ består av nio deltest med sammanlagt 150 uppgifter. Testet mäter framförallt en övergripande g-faktor men även verbal, spatial och numerisk begåvning (enligt en hierarkisk begåvningsmodell). Det är alltså ett brett spektrum som mäts, vilket kan vara intressant vid ett urval som detta. Ytterligare fördelar med BasIQ är att det är lätt att administrera eftersom det kan administreras i grupp, att förberedelsetiden är kort samt att det går snabbt att beräkna poängen (5 min). Manualen är även bra och tydlig. Nackdelar med testet är att det inte finns några normgrupper som egentligen har relevans för arbetslivet, eftersom testet normerats på främst studenter. Populationen är därför kanske inte helt relevant. Information om prediktiv validitet saknas också. APU-testen är ett annat alternativ att använda i denna urvalsprocess. APU-testen mäter maximal prestation inom sju olika områden. APU-testen är lätta att administrera, dvs de kan administreras i grupp, kräver ingen förberedelsetid och poängberäkningen tar endast 5 minuter, men hela testbatteriet tar 2,5 timmar totalt (jämför BasIQ som tar 1 timma). Kanske behöver man dock inte utföra alla deltesten ur testbatteriet. Man skulle kunna välja att bara använda de deltest som verkar mest relevanta för polisyrket, som t.ex. logisk förmåga, perceptiv snabbhet och simultankapacitet (stresstolerans). Det finns alltså stor flexibilitet i hur man kan använda testet. Ytterligare fördelar med testet är att det har hög reliabilitet, tack vare tydliga instruktioner till deltesten. Dock kan det vara en svår uppgift att välja vilka test som är relevanta i olika sammanhang. Hur pass viktig är t.ex. verbal förståelse i polisyrket? En annan svårighet med att använda APU-testen är att validiteten är så dåligt dokumenterad. Det kan alltså vara svårt att veta vad man egentligen mäter och vad resultaten egentligen innebär. (från Mabon sid 242 + Örjans häfte) Testet ägs och distribueras av Assessio. Det mäter g-faktor, det mäter även verbal, spatial och numerisk begåvning. Det utgår från en hierarkisk begåvningsmodell. Man får ett värde både på G och på var och en av de andra underfaktorerna i vilket g-faktor-värdet är borträknat. Man måste inte vara psykolog för att bjuda testet, men är man inte det måste man ha utbildning i basIQ. Testet är främst avsett att användas i rekrytering och urval och på minst normalbegåvade vuxna. BasIQ tar en timme att göra och det består av 9 deltest. Det utvecklades ur en rad tidigare test från PA-rådet (personaladministrativa rådet, bildat av svenska arbetsgivarföreningen) som baserades på 6 av Thurstones 7 faktorer och ett test som heter WIT III, som ungefär täcker samma underfaktorer som basIQ, men är lite väl kort. Testen finns kvar men deras prognostiska validitet har inte blivit undersökt. Ur dessa kunde man utvinna ett ganska kort test som mäter begåvning på ett tillfredsställande sätt med är tillräckligt långt för att få tillfredsställande reliabilitet. Man passade också på att utforma det efter en hierarkisk begåvningsmodell. Kriterievaliditet för generell begåvning är ok(o.6) men inga andra faktorer fick signifikant korrelation. Begreppsvaliditet för den hierarkiska modellen har i stort sett stöd, men den spatiala variabeln har inte förväntad validitet. Både kriterievaliditet och begreppsvaliditet skulle behöva utforskas mer utförligt. Vad gäller reliabilitet är homogeniteten god(0.8<r<0.85) till utmärkt(r>0.85). Stabiliteten är tillräcklig(07<r<0.8). Normeringen har dels gjorts på ekonomer dels sökande till en datautbildning och även på psykologstudenter, ingenjörer och gymnasiestudenter. Det saknas alltså normering som representerar ett bredare spektrum av arbetslivet. Källa: Testhäftet och "Arbetspsykologisk testning" av H Mabon s.242 • Beskriv sammanfattande den hierarkiska begåvningsmodellen och ett test som bygger på denna modell. (Bläddra till s.23) • Beskriv kortfattat ett test som mäter G-faktorn. föreligger en funktionsasymmetri. SRB ingår i Dureman-Sälde batteriet och består av 15 deltest, varav tre kärnkombinationer: verbal förståelse, logisk slutledningsförmåga och visuellt konstruktiv förmåga. Varför detta test? Testkonstruktionen är väl genomtänkt, tydliga instruktioner finns, manualen redogör för metodologiska problem när man jämför kliniska grupper med normalgrupper. Många Validitetsstudier har gjorts på test som ingår i dureman-sälde batteriet vilket också bidrog till att jag valde detta test. En brist är att det är svårt att sammanställa homogena kliniska grupper som är tillräckligt stora utifrån ett diagnostiskt kriterium, ex vid hjärnskada. (häftet: testbeskrivningar) Exempelvis BDI, Becks Depression Index. Detta är ett självskattningsinstrument för bedömning av grad av depression samt förändringar i depressionstillstånd. Styrka: Bra validitet. Svaghet: Saknar teoretisk grund. (Källa: testhäftet) (Bläddra till s. 21). • Beskriv AQT. • Du har fått i uppdrag att vara behjälplig vid antagning AQT (Assassment of Parietal Function) av sökande till Polishögskolan. Du ansvarar för testdelen i denna urvalsprocess. Det är ett mycket stor antal personer som sökt. Vilket/vilka begåvningstest är det lämpligt att använda? Beskriv för- och nackdelar med det/de test du väljer. (Bläddra till s. 27). * Bedömning av temporoparietala funktioner. * Benämna olika stimulus (färg och form). * 5 deltest. * Identifiera avvikelser i hjärnans funktion. Vid misstanke om demens. • Problem med att komma ihåg saker kan man ha lite till • Förutom att SRB är en ko-ras så är det även ett test. Beskriv testet. Kolla i testluntan. Roligt att svensk rödbrokig boskap fick plats på tentan. De väger ungefär 500 kilo och har en relativt hög mjölkavkastning, 7500 kilo per år och har bättre protein- och fetthalter och högre fertilitet än svensk låglandsboskap. Wikipedia och Jonas galna-ko sida. SRB – Synonymer, reasoning and blocktest. Detta är ett kliniskt begåvningstest som mäter bade allmän nivå och även skillnader mella verbal och icke-verbal förmåga. En funktionsassymetri mellan verbal och icke-verbal förmåga är förknippat med missbruksrelaterade hjärnskador. Testet består av SRB:1 – mental förståelse. 30 uppgifter som ska lösas på 7 min. Testpersonen får höra ett ord och får sedan välja en synonym till ordet bland fem alternativ. SRB:2 – logisk slutledningsförmåga. 30 uppgifter som ska lösas inom 8 min. För varje uppgift presenteras 5 geometriska figurer där fyra har logiskt samband. Testpersonen ska markera den femte, avvikande figuren. SRB:3, Kohls block test – visuellt konstruktiv förmåga. 7 uppgifter där tiden varierar med svårighetsgrad. Testledaren visar ett mönster på ett kort som ska återskapas med hjälp av olikfärgade kuber. Det är på detta del-test som missbruksrelaterade hjärnskador kan upptäckas. • Beskriv, kortfattat, ett test för att mäta maximal prestation som är lämpligt att använda i i: - klinisk verksamhet i samband med en utredning. Motivera ditt val och ge en kort och översiktlig beskrivning av testet. Diskutera kortfattat de styrkor och ev. brister hos det test du valt. Flera olika test kan användas, helt beroende på vilket funktionsområde man vill undersöka. Ett bra test som används kliniskt, främst vid misstanke om neurologiska hjärnskador är SRB (synonymer, reasoning and blocktest). SRB screenar för avvikelse i intellektuell funktionsnivå samt ger info om det mans men beskriv ett test där man bl.a. mäter minnesförmågan. • Beskriv RCTF. Rey Complex Figure Test and Recognition Trial används främst för bedömning av visuospatial konstruktionsförmåga och visuospatialt minne samt för att skilja mellan olika typer av störningar som kan påverka det visuospatiala minnet. Rey Complex Figure and Recognition Test (RCFT) är en komplex abstrakt figur som ska ritas av, först med förebild och sen ur minnet med olika fördröjningar. Testet kräver både planering och strategi samt förmåga att analysera helhet i förhållande till delar. Det är normerat men kan även användas för en kvalitativ bedömning. Det är särskilt värdefullt för att konstatera de svårigheter en person inom autismspektrum kan ha att se och minnas helhet och sammanhang. Syfte: Test för bedömning av visuospatial konstruktionsförmåga och visuospatialt minne Ålder: 6-89 år Administrering: Individuell Används inom kliniska sammanhang för att få en fördjupad bild av störningar i det visuospatial minnet. (Källa; häftet från Örjan) • Problem med att komma ihåg saker kan man ha lite till mans men beskriv ett test där man bl.a. mäter minnesförmågan. • Beskriv WAIS. Se testhäfte. • Beskriv testet Claeson-Dahl. Test för bedömning av inlärningsförmåga och minne hos vuxna 20-65 år. Designat för att kunna analyseras efter ”Lurias principer”. Claeson-Dahl ökar möjligheten att differentiera mellan olika typer av störningar. Testet baseras på en lista med ord som ska läras in och minnas för att på olika sätt återges. I den svenska versionen mäts fyra olika aspekter av inlärning och minne: 1. Den aktuella listan med 10 vanliga ord läses upp för tp. Listan läses upp högst 10 ggr, och innan varje gång ska tp uppskatta hur många ord han/hon kommer att komma ihåg. Varje gång listan läses upp, ska tp först vänta 15 sek och sen säga de ord han/hon minns. 2. Efter 30 minuter ombeds tp att återge listan ur minnet. 3. Orden presenteras nu tillsammans med 2 andra, likvärdiga ord. Tp:s uppgift är att känna igen orden från listan innan. 4. Avser att pröva minnet för ordningsföljd. Tp ombeds att numrera orden i den ordning de lästes upp. Bedömningen görs efter: Inlärning, Hur många ord man TROR att man ska minnas (anspråksnivå), Om 15 sek uppehåll följs, Yttre störning, Upprepningar, Feluttal, Felaktiga ord, sammanhanget bedöms. Föreligger det någon/några avvikelser i inlärningsförmåga och minne hos tp? Man kan m.h.a resultatet påvisa eventuella hjärnskador och differentiera mellan dem. Tex kan anspråksnivån ge ledtrådar om vissa hjärnskador. Det förekommer att en schizofren person lätt byter ordning på orden när de ska återges. Analysen av testen kan göras både kvantitativt och kvalitativt. För den kvalitativa bedömningen är testledarens kompetens av stor vikt. Testet är extra känsligt för yttre störningar vid administration. Tp:s motivation, uppmärksamhet och koncentration påverkar resultatet avsevärt. 4 likvärdiga versioner av testet finns för att undvika inlärning. Reliabilitet: Stabiliteten utmärkt för inlärningsdelen, ej acceptabel för minnesdelen. Ingen information om homogeniteten. Validitet: Kriterierelaterade validiteten är god. Ingen data på begreppsvaliditeten. • Problem med att komma ihåg saker kan man ha lite till mans men beskriv ett test där man bl.a. mäter minnesförmågan. Ett maximalprestationstest som bl a mäter minnesförmågan är Claeson- Dahl. Se kompendium ”testbeskrivningar” för finfin beskrivning. Claeson-Dahls test för bedömning av inlärning och minne. Det används vid neuropsykologiska utredningar. Testet kontrollerar om det finns några avvikelser i inlärningsförmåga och minne hos testpersonen. Testet kan påvisa eventuella hjärnskador och differentiera mellan dem. Exempelvis kan en exekutiv störning märkas genom att man byter ordföljd efter varje uppläsning (se nedan) och depression genom allmänt nedsatt minnesförmåga. Claeson-Dahls omfattar fyra aspekter av inlärning och minne. Den första är att lära in en lista med 10 vanliga ord. Testanden uppskattar först hur många av de 10 orden han/hon kommer att minnas efter uppläsningen sedan läser testledaren upp de tio orden en gång. Testanden ska efter viss fördröjning återge så många av de tio orden från listan som möjligt. Detta upprepas tills dess att testanden minns alla 10 orden men högst 10 ggr. Efter 30 minuters paus ombeds testanden återge orden listan ur minnet, detta är testets andra del. Den tredje delen av testet består av rekognition vilket testas genom att testanden ombeds känna igen de tio orden bland likvärdiga distraktorer. I testets fjärde del ombeds testanden numrera orden i den ordning de lästes upp. Claeson-Dahls bedömer följande variabler: inlärning, anspråksnivå, ej uppehåll, yttre störningar, upprepningar, feluttal, felaktiga ord (enkla ord, kontamination, konfabulationer). Om testledaren är väl förtrogen med testet behövs ingen förberedelsetid, bjudningstiden är en timme inklusive 30 minuter för pausen mellan inlärning och retention. Poängberäkningen tar 30 minuter och om testledaren har rätt kompetens kan testet även analyseras kvalitativt och inte enbart utifrån uppnådd poäng. Skalan på testet är normrelaterad, normeringarna är gjorda på universitetsstuderande samt pensionärer på ett ålderdomshem uppdelade på utbildning, ålder samt kön. Kritik mot testet är att det är känsligt för yttre störningar vid administration. Testpersonens motivation, uppmärksamhet samt koncentration påverkar också testresultatet avsevärt. Diagnosen minnesstörning bör endast ställas i kombination med andra tester. För tolkning o bedömning av resultat och eventuell skada krävs kunskap i klinisk psykologi och professionell träning. Testet finns i flera versioner för att inte inlärning ska påverka resultatet. Man bör kontrollera för utbildningsnivå då den variabel som på verkar inlärning kan vara verbal inlärningsförmåga och inte minneskapaciteten. • Beskriv Wisconsin Card Sorting testet. WCST är ett neuropsykologiskt test som har som syfte att mäta individers exekutiva funktioner, såsom abstrakt analytisk slutledningsförmåga, förmåga att skifta kognitiv strategi, strategisk planering, målinriktat beteende, organsiserad avsökning, återkoppling från omgivningen och anpassning till svarsimpulser. (Observera att testet inte mäter alla kognitiva funktioner!) WCST innehåller 4 nyckelkort med motiven; 1 röd triangel, 2 gröna stjärnor, 3 gula kors, 4 blå cirklar. Dessa kort representerar 3 stimuluskategorier (färg, symbol och antal). Tp har 64 svarskort som varierar med avseende på just färg, symbol och antal och ska para ihop dessa svarskort med rätt nyckelkort (utan att tp får några instruktioner för hur dessa ska paras ihop). Tl växlar sorteringsprincip så fort tp har fullföljt 10 rätta svar i följd. Varje svar utvärderas i 3 dimensioner: rätt eller fel, oklart eller entydigt (oklart=om svarskortet matchar stimulit på mer än en egenskap), perseverativt eller icke-perseverativt (om man håller fast vid en strategi som man fått veta är fel). Mätinstrumentet kan upptäcka olika typer av svårigheter för individer att lösa uppgifterna, som t.ex. ineffektiv initial begreppsbildning, oförmåga att bibehålla sorteringsprincip, perseveration (hålla fast vid dålig strategi) samt otillräcklig inlärning under testets olika faser. WCST används som en del i ett testbatteri vid misstanke om dysfunktion i frontalloben. Testet ger en generell bild av funktionen och måste alltid kompletteras med annan info (medicinsk, psykosocial info etc.). Det enda som testet med god sensitivitet kan urskilja är just dysfunktion i frontalloben. P. med frontala skador får generellt sämre resultat på WCST än p. med andra typer av hjärnskador. Ursprungligen användes testet på normalpopulationen, men numera används det bara kliniskt. Validitet och reliabilitet beror till stor del på testledarens erfarenhet av testet (eftersom poängräkningen är så krånglig!) samt kunskap om neuropsykologi (för att kunna avgöra om en tp ens kan utföra testningen). (från overheads i testväskan + örjans häfte) • Wisconsin Card Sorting Test innehåller något i testinstruktionen som är unikt för detta test. Vad är det för något? Beskriv kortfattat idén bakom Wisconsin Card Sorting Test och vad det avser att mäta. Första delen av frågan besvaras endast. Andra delen hänvisar jag till testluntan. Det som är unikt för WCST är att man inte berättar för testpersonen vad testet avser mäta. TP får relativt förutsättningslöst göra testet. Själva testet skulle förlora sitt syfte om denna överraskning försvann. WCST är ett neuropsykologiskt test, det avser mäta analytisk slutledningsförmåga och de högre verkställande funktioner som krävs för att utveckla och bibheålla en problemlösande strategi då stimulusförhållandena ändras. Först testar man abstrakt slutledningsförmåga och sen testar man förmågan att skifta kognitiv strategi när villkoren ändras. Exekutiva funktioner som mäts är strategisk planering, organiserad avsökning, återkoppling från omgivningen och apassninga till svarsimpusler. Det utvecklades från början för att testa ovanstående i normalpopulationen, nu används det mest kliniskt. Testet är känsligt för dysfunktioner i frontalloberna, men frontalloberna har flera funktioner som inte utvärderas av WCST, det är även så att skador som påverkar funktioner i frontalloberna men inte är lokaliserade där påverkar resultatet i WCST. MAn får alltså inte ett fullständigt mått på nedsättningen i frontalloberna och det mått man får kan bero på en nedsättning av frontallobsfunktionerna orsakade av en skada i något annat område. Det ska därför användas tillsammans med andra test som kompletterar det. Det ovanliga i instruktionerna är att man inte talar om vad testet går ut på, man ger testanden information om att den ska sortera korten som den tycker att dom passar ihop och att man kommer att tala om ifall det blev rätt eller fel. Man ger alltås feedback och man mäter hur snabbt testanden greppar den rätta strategin. När testanden kommit upp i tio efter varandra följande rätta svar så byts strategi, t.ex. från färg till form. Då ser man hur snabbt testanden acepterar att den tidigare strategin var fel och börjar söka efter den nya strategin, man ser även hur snabbt personen klurar ut den nya strategin. Strategin är antingen symbol, färg eller antal. Källa: Testhäftet • Beskriv testet BKT – Bedömning av kritiskt tänkande. BKT är en svensk version av ett amerikanskt begåvningstest. Med kritiskt tänkande menas förmågan att kunna göra en saklig och logisk analys av ex slutsatser eller en argumentering, inte att vara allmänt negativ. Även viss personlighetsmätning i form av att kunna frigöra sig från förutfattade meningar. Används ofta för att mäta intellektuell förmåga på hög nivå inom arbetslivet, kvalificerade befattningar, främst bedömning av ledarskapspotential. Mäter förmågan att objektivt och logiskt kunna analysera en problemställning utan att låta sig styras av subjektiva föreställningar och förutfattade meningar. Består av fem delstest. 1. härledning, att värdera härledningar utifrån givna fakta 2. identifiera antaganden, att utifrån olika påståenden identifiera vilka antaganden som kan eller inte kan göras 3. slutledning, att bedöma vilka slutsatser som kan eller inte kan dras utifrån viss information 4. tolkning, att bedöma vilka tolkningar som kan eller inte kan dras utifrån viss information 5. värdera argument, bedöma vilka argument som är starka och relevanta respektive svaga och icke relevanta för vissa frågeställningar. Det finns svenska normdata för BKT. • Beskriv Ravens matriser. Ett icke-verbalt begåvningstest. Mäter generell begåvning. Den mäter specifikt hur bra man uppfattar en helhet utan att ha alla delarna. Standard Progressiva Matriser (SPM):60 uppgifter fördelat på fem set (A-E). Testet består av olika geometriska figurer som grupperats i rader och kolumner, där den sista figuren saknas. Testpersonen skall avgöra utifrån ett antal givna alternativ vilken den sista figuren skall vara. Coloured Progressiva Matriser (CPM): De 24 enklaste uppgifterna från SPM samt 12 till. Skillnad är att figurerna är färgade för att behålla uppmärksamhet hos testperson. Advanced Progressiva Matriser (APM): Svårare än SPM. Avsedd för de personer som slår i taket på SPM. Består av två delar: 48 uppgifter totalt. Utöver dessa har det även gjorts ett antal parallell- och plus- versioner av Ravens. Detta för att Ravens är väl använt och om det finns risk för att en person redan gjort testet kan man använda någon av de här andra versionerna. Användning Används vid urval, del av diagnostisering av schizofreni, identifiering av demens och utv.störning, utredning i skolsammanhang samt forskning. Poäng Normrelaterad skala. Råpoäng – antal rätt. Administrering Lätt utan förberedelse. Ingen tidsgräns. Ca fem min. för poängräkning. Homogenitet: bra. Stabilitet: bra. Testet anses vara oberoende av kultur, kön och ålder. • Beskriv kortfattat ett test som mäter G-faktorn. (Se s. 21) • Du skall utföra en begåvningsutredning av en vuxen person med en icke svensk kulturell och språklig bakgrund. Beskriv vilket/vilka test du kan tänka dig att använda för detta ändamål och diskutera dess styrkor och svagheter samt varför du väljer just detta/dessa test. (Se s. 25) Välj lämpliga test • Du har nyligen använt WAIS i en utredning. Din klient klarar deltesterna i performanceskalan tillfredsställande men har överlag låga prestationsnivåer på deltesten i verbala skalan. Du nöjer dig inte med att enbart konstatera detta utan vill gå vidare med ytterligare test. Vad vill du, i det här läget, komplettera WAIS med? Vad väljer du för typ/typer av test och varför? Ge exempel! Test för att mäta typiskt utförande Allmänt om test för att mäta typiskt utförande • Vad finns det för- och nackdelar med personlighetstest? Vilka användningsområden kan vara lämpliga? Vad kan man generellt säga om testens validitet resp. reliabilitet t.ex. i jämförelse med ett begåvningstest? Ja ni pojkar. Detta är ju en svår fråga. Jag har kikat i alla häften jag har, men inte hittat något bra. Det står säkert i Kaplan, men jag hittar det inte. Jag gjorde en liten ovetenskaplig sammanställning utifrån testhäftet, för att undersöka vad man använder testen till. Såhär såg det ut. Personlighetstest (TU) Begåvningstest (MP) Urval: 4st 5st Kliniskt: 6st 6st Teambuilding etc.: 2st Detta säger ju precis ingenting! de används till i princip samma saker, förutom att vissa av personlighetstesterna egentligen inte kan användas till någonting, och därför hamnar i kategorin "teambuilding etc." (ex. Myers-Briggs). Men om jag ska slänga in lite egna antaganden så blir det så här: Ett personlighetstest kan oftast inte normeras på samma sätt som begåvningstest, eftersom det (ofta) inte rör sig om jämförelser människor emellan. Därför borde i alla fall validiteten bli lägre en för ett begåvningstest med fina normeringar. Jag vet inte. Jag får återkomma med ett bättre svar senare... Jämfört med annan individbedömning som t.ex. en djupintervju har personlighetstester fördelen att de är enkla och snabba att använda och att de är mer objektiva. En nackdel med de personlighetstest som utgörs av självskattningsskalor är att det ofta går att lista ut vad man ”borde” svara, d.v.s. vilket svar som är socialt önskvärt. Projektiva personlighetstest är svårare att manipulera svaret på, men dessa test är å andra sidan svårare att tolka. För att lösa problemet med social önskvärdhet är många personlighetstest som används i Sverige ipsativa. Detta medför dock andra problem, i och med att ipsativa test inte kan jämföras mot en normgrupp. Man kan också korrigera för social önskvärdhet genom matematiska metoder och kontrollskalor. En annan nackdel när det gäller personlighetstester som bygger på faktoranalys (t.ex. de som bygger på Big 5) är att de bara visar på samband eller frånvaro av samband, de säger ingenting om riktning eller underliggande faktorer. När det gäller urval och rekrytering har begåvningstest visat sig vara bra på att förutsäga arbetsprestation inom nästan vilket område som helst. Det räcker alltså ofta med ett mått på den generella g-faktorn. Personlighetstest kan dock vara bra för att sålla ytterligare efter att aspiranterna gjort begåvningstest. Personlighetstest har fördelen att de kan mäta egenskaper som är viktiga för ett specifikt arbete, t.ex. kanske ett jobb kräver att man är väldigt utåtriktad medan ett annat jobb passar bättre för någon som är mer inåtvänd. (Å andra sidan har vissa begåvningstest också sådana uppdelningar, t.ex. APU). Metaanalyser har visat att intelligens är den variabel som tydligast är relaterad till yrkesframgång men att personlighet också är av betydelse och svarar för ca 25% av det prognosvärde som begåvningstest ger. Eftersom begåvningstest och personlighetstest inte överlappar varandra höjs validiteten om man gör både sorterna i en testsituation. Enligt studien som tjejen från Assessio presenterade är den prediktiva validiteten för ett personlighetstest ca 0,41 medan den är 0,51 för begåvningstest. Allra bäst prediktiv förmåga har arbetsprover. När det gäller reliabiliteten brukar den ligga på över 0,90 för intelligenstest, 0,65-0,85 för personlighetsformulär och 0,40-0,80 för projektiva test. Sammanfattningsvis kan man säga att personlighetstest är ett bra komplement till intelligenstester i rekryteringssammanhang. Vissa tester, som t.ex. Gordons och MBTI, passar dock inte för urval eftersom de inte är normativa. Dessa kan exempelvis användas i teambuilding och karriärsrådgivning. Det finns också personlighetstest som används i kliniska sammanhang, t.ex. Beck Depression Inventory och KSP. De kan ge värdefull information om en patients personlighetsdrag och vara till hjälp vid diagnostisering. Man kan läsa mer i Mabon s. 247-251, häftet som heter Psykologiska testmetoder, handouts föreläsning 1&2 samt i Assessios handout och i Sjöbergs artikel s. 4-12. Reliabilitetssiffrorna har jag fått från Fhanér s. 80. • Vid användning av personlighetstest är det viktigt att ta hänsyn till hur uppriktiga och ”sanna” svaren är. Detta har man försökt lösa på olika sätt. Diskuterar hur detta problem kan hanteras med exempel från några personlighetstest. Ange minst två (2) olika metoder. Det vill säga social önskvärdhet och annan dissonans i svaren, framförallt vid test som mäter typiskt utförande. Detta kan mätas enligt Sjöberg genom responstidsmätning i dataprogrammerade test. Responstid tycks vara användbar som ett sätt att begreppsligt validera traditionella lögnskalor. I andra test kan man titta på om svarsstilarna inom samma skala korrelerar. Frågor i testet kan återkomma eller ställas på olika sätt (motsatta, dvs. ”Jag älskar glass” och ”Jag har svårt för glass”). En tredje metod finns i NEO PI-R som avslutas med en validitetskontroll i form av tre frågor som rör svarsstil. Det kontrollerar för nejsägare, instämmande svarsstil och slumpmässiga svar. Källa: Sjöbergs kompendium s. 27, Mabon s. 375, Testbeskrivningar Här pratar vi social önskvärdhet och annan dissonans i svaren, framförallt vid test som mäter typiskt utförande. Detta kan man mäta enligt Sjöberg genom responstidsmätning i dataprogrammerade test. Responstid tycks vara användbar som ett sätt at begreppsligt validera traditionella lögnskalor. I andra test kan man titta på om svarsstilarna inom samma skala korrelerar. Frågorna i testet kan komma upp igen eller ställas igen på ett annorlunda sätt(motsatta, dvs ”Jag älskar barn” och ”Jag har svårt för barn”). I NEO PI-R avslutas testet med en validitetskontroll i form av tre frågor som rör svarsstil. Här kan man titta efter nej-sägare, instämmande svarsstil och slumpmässiga svar. Källa: Sjöbergs kompendium s. 27, Mabon s. 375, Testbeskrivningar • Det finns några olika typer av personlighetstest som skiljer sig åt bl.a. avseende dess härledning dvs. vad testen grundas på (teori, modell etc.). Ge exempel på test med olika typer av grundfundament dvs. vad de bygger på och beskriv hur de skiljer sig åt. Personlighetstest kan vara lämpliga att använda i kliniska sammanhang för att exempelvis kartlägga patientens emotionella status. Personlighetstest kan också bidra till självkännedom och personlig utveckling. Personlighetstest kan vara projektiva eller bestå av självskattningsskalor. De allra vanligaste idag består av självskattningsskalor. Projektiva test Testledaren ställer inte frågor till testpersonen utan konfronterar denne med mångtydiga stimuli och ber denne tolka eller reagera på dessa. Ingen standardisering eller instruktion finns att tillgå. Resultatet bygger på testledarens subjektiva bedömning då testpersonen projicerar tankar och känslor och föreställningar om livet på det stimuli som visas. Detta är sedan upp till testledaren att tolka. Exempel på sådana personlighetstest är TAT och Rorschach. Dessa test har ofta sin grund i personlighetsteorier av klassiskt snitt såsom Jung och Kelly. Används ofta kliniskt, men även i yrkesmässiga sammanhang. Det finns en risk att man sätter för stor tilltro till testresultaten, speciellt om man inte är utbildad testledare. Man bör se resultatet som en hypotes som bör testas vidare. Alla sidor av personligheten, kanske inte kommer fram i testsituationen. - Oberoende - Självkontroll 16 PF har en god reliabilitet och validitet och sägs användas som riktmärke för andra test. Det är även lätt att administrera och ger en bra bild av personligheten på två plan genom användandet av primärfaktorer (16 st) och globalfunktioner (5 st). Testet kontrollerar även för social önskvärdhet. NEO PI-R Är ett personlighetstest för normalpersonligheten på vuxna. Det är också urtypen för femfaktorinventorier.(Big five) Testet består av 5 bipolära skalor: känslomässig instabilitet, utåtriktning, öppenhet, vänlighet och målmedvetenhet. Till dessa hör 6 stycken aspektskalor. Inventoriet är främst avsett för tillämpning i kliniska sammanhang för att få en fördjupad bild av personligheten men kan även användas i urvalssammanhang. *HPI – Hogans Personlighetsinventorium Testet är utvecklat av Robert Hogan och grundar sig på femfaktorsmodellen men med en utvecklad version med sju primära personlighetsskalor; - Anpassning - Ambition - Sällskaplighet - Sympatiskhet Självskattningstest - Ordentlighet Dessa mäter personlighetsdrag genom att tp får fylla i frågeformulär om hur den är och hur den reagerar i vissa specifika situationer. Dessa test utgår ofta från modeller som menar att den grundläggande personligheten är biologiskt betingad eftersom det finns vissa specifika personlighetsdrag som finns i alla kulturer. Man har kommit fram till dessa personlighetsfaktorer genom faktoranalys. Dessa test skiljer sig från projektiva eftersom det inte kräver någon tolkning av tl och eftersom de grundar sig på en modell istället för en teori. Tl räknar ihop svaren enligt ett bestämt sätt och får på så sätt en uppfattning tp:s personlighet. Används ofta för att mäta normalpersonlighet och i yrkessammanhang, men ibland även kliniskt. Exempel på självskattningstest är 16 PF, NEO PIR och HOGANS. - Intellektans - Studiehåg Nackdelar med självskattningsskalor förutsätter att den som skattar sig själv, tolkar frågan eller påståendet, som det ursprungligen var menat. De förutsätter också att den svarande är ärlig, samt är kapabel att skatta sig själv. Resultatet bygger på den svarades subjektiva bedömning. 16 PF – The 16 Personality Factors Questionnaire Testet bygger på Cattells sextorn personlighetsfaktorer. Cattell menade att man kunde beskriva personligheten på ett uttömmande sätt via 16 faktorer man har sedan upptäckt att dessa 16 faktorer kan sammanfattas till fem övergripande sk. globala faktorer nämligen: - Extraversion - Ångest - Hårdförhet HPI är avsett att användas enbart inom arbetslivet och innefattat då även sex delskalor som visar lämplighet för olika yrken. Testet har en bra dokumentation gällande validitet, reliabilitet, användbarhet och normer. HPI är lätt att administrera. Testet NEO PI R kategoriseras av Kaplan som ett test framtaget med s k combination strategy (att jämföra med the logical-content s 353, the criterion-group s 355, the factor analytic s 367 och the theoretical strategy s 371). Detta innebär att konstruktion av testet, det vill säga konstruktion av items och skala, baseras på faktoranalys och personlighetsteori (Kaplan s 378-379). Denna strategi kan jämföras med MBTI (Myers-Briggs TypeIndicator), vilket enligt ovanstående kategorisering skulle beskrivas som baserat på s k theoretical strategy. Testets teoretiska fundament är dock kritiserat, exempelvis menar Sjöberg (s 14) att testet ”bygger på Jungs spekulationer” och att ”Jungs egen empiri var undermålig och delvis bedräglig”. Källa: Kaplan s 378-379 och Sjöberg, Personlighetstest i arbetslivet: historik och aktuell forskning, s 14. • Ett s.k. personlighetstest eller personlighetsstörningstest bör aldrig utgöra det enda underlaget för att avge ett utlåtande om en person eller ställa en diagnos. Diskutera kortfattat varför detta inte är lämpligt. ”Agreeableness”: Godmodig – Irritabel; Oavundsjuk – Avundssjuk; Mild – Envis; Samarbetsvillig – Negativ Man vet utifrån forskningen att personlighetstest inte är så tillförlitliga att man kan basera en diagnosticering enbart på dem. När det gäller självskattningsskalor sa Örjan på sin föreläsning att det är vanligt vid kliniska test att patienter överdriver eller underdriver symptom. Han nämnde också att man aldrig bör dra en s.k. ”trait- slutsats” utifrån att en person skönmålar sig själv vid en personlighetstestning. Det skulle alltså vara att man antar att personen är en lögnare när det enda man egentligen vet om honom är hur han hanterar ett testformulär! När det gäller projektiva test som exempelvis Rorschach har forskningen visat att det inte finns några bevisade samband med psykiska sjukdomar eller symptom. Personlighetstest/personlighetsstörningstest kan vara bra för screening men är aldrig tillräckligt tillförlitliga för att användas ensamma som underlag för någon som helst slutsats. (Passer & Smith, s. 422) Personligheten är inte bestående utan beroende av situationen. Det finns t.ex. inte någon grundläggande egenskap hos en människa som gör henne tillbakadragen, hon väljer utifrån tillfälle hur hon vill uppfattas. Detta är en kritik mot personlighetstestning som framförts av bl.a. Mischel, se sida 67 Mabon. E0 EXTRAVERSION-UTÅTVÄNDHET Ytterligare kritik är att personlighetstest i hög grad kan besvaras socialt önskvärt, dvs att testpersonen förställer sig för att verka t.ex. mer/mindre utåtriktad än vad han/hon egentligen är. Denna förställning gäller förstås inte enbart social önskvärdhet utan testpersoner med önskan om att få en viss profil kan manipulera sig till ett resultat som inte står i relation till hur dennes personlighet ser ut ”på riktigt”. Egen slutsats. O0 ÖPPENHET FÖR NYA ERFARENHETER Kritik som bör framhållas är att kriterierna vilka personligheten bedöms utifrån är hypotetiska konstruktioner och bör således inte sväljas som sanningar. Utredande samtal och mer kvalitativa bedömningar av testpersoners personlighet är av stort kompletteringsvärde till dessa test. Testhäftet om GPI och egna slutsatser. • Vad ingår i Eysenck´s ”Giant Three”? I Eysenck´s trefaktor teori ingår följande biologiskt förankrade personlighetsdrag: Extraversion (E), Neuroticism (N) samt Psykoticism (P). • Vad ingår i Big Five? Big Five är en modell av personligheten som består av fem, från varandra tämligen fristående faktorer. På svenska kallas dimensionerna: Känslomässigt välanpassad, utåtriktad, empatisk, plikttrogen och öppen för nya idéer (Den positiva änden av skalorna). Big Five grundar sig inte på en i förväg fastställd teori om personlighetens struktur, utan på ett konstaterande att när människor fyller i självskattningsformulär rörarande olika sätt att uppleva och bete sig i arbetslivet så tenderar dessa fem faktorer framträda (Mabon, s. 70). ”Big Five” utkristalliserades alltså genom faktoranalys och faktorerna anses vara universella för människan. På engelska heter dimensionerna (Ung. översättning.) ”Openness”: Artistiskt känslig - Artistiskt okänslig; Intellektuell- oreflekterande; Slipad - Oslipad; Fantasirik – Enkel ”Conscientiousness”; Ordningsam - Vårdslös; Ansvarstagande – Oberoende; Samvetsgrann – Skrupelfri; Ihärdig – Ger upp lätt ”Extraversion”: Pratsam – Tyst; Öppen – Hemlighetsfull; Äventyrlig – Försiktig; Social – Tillknäppt ”Neuroticism”: Balanserad – Nervös; Lugn – Orolig; Samlad – Hetsig; Stabil – Instabil Som vi har lärt oss i tidigare kurser är ”Big five” enkel att minnas genom den förnämliga akronymen: OCEAN. BIG FIVE – PersonlighetsProfil är ett multidimensionellt personlighetstest. Detta test bygger på utveckling av tester som baseras på analys av lexikaliskt material. Man har studerat språkanvändningen inom flera språk när det gäller hur man beskriver personligheten. Denna lexikaliska analys har man bearbetat med statistiska metoder varpå fem faktorer framstår som generella faktorer. De FEM FAKTORERNA är: N0 EMOTIONELL STABILITET A0 VÄNLIGHET-BEHAGLIGHET C0 MÅLMEDVETENHET-ANSVARSKÄNSLA De fem faktorerna har vidare 6 FACETTER som redovisas tillsammans på ett profilkort. Utökad rapport ger vidare möjlighet att utvidga testresultatet till en kompetensprofil där upp till 54 vanliga kompetenser i arbetslivet sammanställs i de fall de förekommer hos testanden. • Beskriv ett test som helt eller till viss del bygger på Big Five modellen. Testet NEO PI R baseras delvis på Big Five-modellen. Se kompendium ”testbeskrivningar” för beskrivning. NEO PI-R, testet är främst avsett för tillämpning i kliniska sammanhang för att få en fördjupad bild av personligheten men kan även användas i urvalssammanhang. NEO PI-R™ omfattar de fem faktorerna: Känslomässig instabilitet (N-skalan), Utåtriktning (E-skalan), Öppenhet (O-skalan), Vänlighet (A-skalan) och Målmedvetenhet (C-skalan). Var och en av de fem faktorerna innefattar egenskaper som avgränsar varje faktor, så kallade aspektskalor. Till var och en av faktorerna hör sex sådana aspektskalor. Såväl faktor- som aspektskalor är bipolära; det vill säga att såväl höga som låga poäng tolkas. Syfte: Personlighetsinventorium Ålder: Vuxna Administrering: Grupp eller individuell (Källa:Assessio och Örjans häfte). • Beskriv Catell´s 12 faktormodell (som testet 16PF bygger på). Detta är den personlighetsteori som har flest personlighetsfaktorer av alla personlighetstest. Testet är framtaget med ett lexikalisk metod vilket innebär att man faktoranalyserat fram adjektiv ur ett lexikon. Det finns 16 stycken personlighetsfaktorer som Raymond Cattell kommit fram till genom faktoranalys. Catell menade på att dessa 16 personlighetsaktorer var de primära, i motsats till big-5 som han menade bestod av 5 globala faktorer där hans 16 gick att inplacera som mer specifika sub-grupper. Slutsatsen att dessa 16 var sub-grupper drog han då han konstaterat att samtliga 16 korrelerar med de 5 globala. De globaka faktorerna är extraversion, ångest, hårdförhet, oberoende och självkontroll. Testet innehåller också tre stycken svarsstils-skalor för att bedöma svarens validitet. Den mäter social önskvärdhet, ovanliga svar och instämmande svar. 16 pf används främst i urval och rekrytering, emn även vid karriärsplanering och yrkesrådgivning. Man kan säga att den ger en bild av personligheten på två plan då den dels uppvisar de primära faktorer, dels uppvisar de globala faktorerna. Jag har pratat med en vän i T6, dom skrev bara om 16pf på den här frågan då de ej hittat info om "12 faktorsmodellen". Jag vet faktiskt inte vad 12-faktorsmodellen skulle innebära, men jag kollar lite mer imorgon och uppdaterar på lunch om jag förstår nåt mer. Exempel på test • Beskriv 16PF testet. 16PF (16 PersonlighetsFaktorer) bygger på Cattells sexton personlighetsfaktorer och är ett internationellt välkänt personlighetstest för bedömning av olika grundläggande drag i personligheten. Lättadministrerat och finns datoriserat. Det används framför allt för urval, ledar- och medarbetarutveckling samt karriärplanering. Testet är konstruerat utifrån faktoranalys av ett stort antal personlighetsbeskrivningar. Med utgångspunkt i närmare 18 000 personlighetsbeskrivande adjektiv, utformade Raymond Cattel 16 grundläggande personlighetsdrag, vilka utgjort basen för konstruktion av skalorna. Testet har 16 primära bipolära skalor (dvs. både höga och låga poäng har betydelse): Värme (reserverad - varm) Emotionell stabilitet (reaktionsbenägen - emotionellt stabil) Dominans (undfallande dominant) Livlighet (allvarlig - livlig> Regelmedvetenhet (opportunistisk - regelmedveten) Social dristighet (blyg - socialt dristig) Känslighet (krass - känslig) Vaksamhet (tillitsfull - vaksam) Förströddhet (förankrad - förströdd) Tillbakadragenhet (rättfram - tillbakadragen) Oro (självsäker - orolig) Öppenhet för förändringar (traditionell - öppen för förändringar) Självtillit (grupporientering - självtillit) Perfektionism (tolererar oordning - perfektionistisk) Anspändhet (anspänd - avspänd) Slutledningsförmåga Oberoende (tillmötesgående - självständig) Självkontroll (ohämmad - självbehärskad) Det finns en rad svarsstilsskalor som bl.a. mäter socialönskvärdhet i svaren. Detta test anses i svenska normer mätt vara mindre validt om man tittar på metodens prognostiska värde i arbetslivet. Forskning pågår och bl.a. Assessio använder sig i nuläget av testet. Det finns dock få replikerade studier av Cattels synsätt gällande dessa personlighetsfaktorer. Källa: Testbeskrivningar, Mabon sid 256 samt Assessios hemsida • Beskriv ett test som bygger på en personlighetsmodell som innehåller fler än 5 faktorer. 16 pf (personality factors questionnaire) är ett personlighetstest som är baserat på Cattells 16 personlighetsfaktorer. Testet avser att mäta grundläggande personlighetsdrag i urval och rekrytering (mäter normal personlighet) men kan även användas vid karriärsplanering och yrkesrådgivning. Testet består av 16 primära och bipolära skalor som balnd annaat ”värma”, ”livlighet” och ”dominans”. Testet har vidare 5 globala faktorer som är extraversion, ångest, hårdfördhet, oberoende och självkontroll. I testet finn även tre svarsstilskalor som mäter social önskvärdhet, ovanliga svar och instämmande svar. Testet är lätta att administrera och ger en bild av personen på två plan genom att använda både primära och globala faktorer. 16 pf predicerar karriärsmässig kompetens, förhållningssätt gentemot andra, tankestil, arbetssätt och stresshantering. • Beskriv kortfattat ett test där faktoranalys använts vid konstruktion av testet. Ett bra expempel är Catells 16PF – Sixteen Personality Factor Questionnaire. 16PF utvecklades genom en lexikalisk metod där engelskans alla adjektiv som kan användas om människor bearbetats faktoranalytisk för att kategorisera dessa adjektiv. Syftet var att identifiera grundläggande personlighetsdrag. 16PF var bland de första testen som utvecklades med faktoranalytiska tekniker. Idag används används faktoranalys i utvecklingen eller valideringen av i stort sett alla större test. • Beskriv HPI (Hogans). HPI – Hogans Personlighetsinventorium o Beskrivning: Avsett att mäta ”normal personlighet” vid urval och rekrytering. Består av sju primära skalor; Anpassning, Ambition, Sällskaplighet, Sympatiskhet, Ordentlighet, Intellektans och Studiehåg (även en validitetsskala och sex yrkesskalor; Serviceinriktning, Stresstolerans, Integritet, Administrativ potential, Försäljarpotential och Chefspotential) o Styrkor: De 16 primära skalorna kan kombineras till 5 globala skalor som ger en mer allmän och bredare bild av personligheten i termer av: Extraversion (extravert - introvert) Ångest (oberörd - lättoroad) Hårdförhet (mottaglig - hårdför) o Lätthanterligt God reliabilitet Relativ god validitet (i jämförelse med personlighetstest i allmänhet) Svensk normgrupp (endast normalbefolkning) Svagheter: Krävs bättre bevis ang. kriterierelaterad- och begreppsvaliditet. Krävs fler svenska normeringar med gedignare normgrupper Diskussioner förs om huruvida big 5 är det lämpligaste sättet att kategorisera dimensioner av personlighet. Samt om kategorierna håller över kulturer. • Vid användning av personlighetstest är det viktigt att ta hänsyn till hur uppriktiga och ”sanna” svaren är. Detta har man försökt lösa på olika sätt. Diskuterar hur detta problem kan hanteras med exempel från några personlighetstest. Ange minst två (2) olika metoder. (Se sid 37!) • Beskriv, kortfattat, ett test för att mäta typiskt utförande som är lämpligt att använda i en rekryteringsprocess t.ex. vid chefsrekrytering? Motivera ditt val och ge en kort och översiktlig beskrivning av testet. Diskutera kortfattat de styrkor och ev. brister hos det test du valt. B) I valet mellan Hogans och Gordons valde jag Hogans, enda anledningen för att Hogan har normerad skala och därför finns möjlighet att jämföra med andra sökande eller med normeringsgrupper. Användning av Gordons ställer därmed högre krav på analysen, då det saknas normeringsgrupper. Hogans mäter "normal personlighet" i sju primära skalor och sex yrkesskalor. Homogenitet och stabilitet är tillräcklig. Kriterievaliditet är acceptabel och begreppsvaliditet är god. HPI är vidare enkelt att administrera. Dock saknas bra svenska normeringsgrupper för yrkeslivet. Vid en genomläsning av karaktäristiken verkar Gordons bättre om man inte jämför sökande med varandra. Ex Gordons dimension ascendancy förutsäger enligt test chefs- och ledarframgång. Jag stödjer mig dock på pm:et som säger att Gordons är olämpligt i rekryteringssammanhang om jämförelser ska göras. • Beskriv NEO PIR. • Beskriv ett test som helt eller till viss del bygger på Big Five modellen. (Igen!) Ett personlighetstest som baseras på självskattning av grundläggande personlighetsdrag i normalpersonligheten hos vuxna (16 år o uppåt). Det visar hur du bedömer dig själv ur olika aspekter. Testet är främst avsett för att användas i kliniska sammanhang för att få en fördjupad bild av personligheten, men kan även användas i urvalssammanhang. Baseras på big 5 och mäter: -känslomässig instabilitet -öppenhet -vänlighet -målmedvetenhet -utåtriktning Materialet består av frågehäfte och svarsblankett. Testet består av 240 items, med tre validitetsfrågor i slutet (tex: ”Har du besvarat alla frågor ärligt”?). Fem olika svarsalternativ på varje påstående, från ”stämmer mkt bra” till ”stämmer inte alls”. Hälften av alla items har vänd poängsättning. Tolkningen är icke-ipsativ. Dvs, en persons testresultat jämförs mot en vald normgrupp. Råpoängen görs om till Tpoäng som läses av i tabell. Tillgång finns till svensk normdata. • Beskriv BDI. Beck depression index är ett självskattningstest för bedömning av grad av depression. Det kan även användas för att se förändringar i depressionstillstånd. Det konstruerades utifrån observationer av deprimerade patienter och utifrån deras symtombeskrivningar. Testet mäter flera olika symtom som testpersonen ska skatta utifrån hur denne har känt sig den senaste veckan. Skuldkänsla självförakt, obeslutsamhet, aptitförlust, socialt tillbakadragande och självmordstankar är exempel på faktorer som skattas. Ju fler poäng man får totalt sett på testet, desto mer deprimerad bedöms man vara. Testet ska alltid kompletteras med en klinisk intervju. I de låga poängen finns en risk för att svaren har varit lite förskönande, alltså att personen faktiskt är mer deprimerad än den uppgett, och därför ska man vara extra uppmärksam i bedämningen av dessa resultat. Begreppsvaliditeten är god(.65<r<.75) BDI har hög inre konsistens i både kliniska(.86) och icke kliniska populationer(.81). Källa: Testhäftet. • Beskriv, kortfattat, ett test för att mäta typiskt utförande som är lämpligt att använda i klinisk verksamhet i samband med utlåtande, diagnostik och behandlingsplanering? Motivera ditt val och ge en kort och översiktlig beskrivning av testet. Diskutera kortfattat de styrkor och ev. brister hos det test du valt. A) BDI. Beck är ett av världens mest använda självskattningsinstrument för att bedöma grad av depression. (förutsätter då att man misstänker depression hos patienten) Det kan också mäta förändringar i tillstånd. Det är vältestat, tar kort tid och är lätt att administrera. Beck är därför lätt att använda flera gånger för att ex. utvärdera behandling. Testet är normerat på många personer, men borde normeras i fler grupper för bättre jämförelsematerial. Testet anger graden av depression och vilka attribut som depressionen består av, ex. aptit, självförakt, skuldkänslor etc. Testet ger därför ett underlag för ev medicinsk behandling och vilka områden som kan vara aktuella för terapeutisk/psykologisk behandling. Sammanfattningsvis är testet väl underbyggt, lätt att upprepa och ger möjlighet att diskriminera delar av attributen depressionen visar upp. depression. • Beskriv ett test som avser att mäta graden av Hur mycket har Du besvärats av: Förslagsvis BDI. Se testbeskrivning. • Beskriv BAI. Självskattningstest för att bedöma grad av ångest. Innehåller 21 påståenden/symtom vilka skattas på en fyragradig skala utifrån svårighetsgrad. BAI utvärderar fysiologiska och kognitiva ångestsymtom. Man tolkar resultatet mot framtagna gränsvärden. Måste vara leg. psykolog, leg. läkare eller leg. psykoterapeut för att få använda. • Beskriv SCL 90. The Symptom Checklist-90-R (SCL-90-R) är ett självskattningsinstrument som kan hjälpa till att utvärdera ett brett spektrum av psykologiska problem och psykopatologiska symptom. Instrumentet är också användbart för att mäta framsteg hos patienter och behandlingsresultat. SCL-90 är ett ofta använt självskattningsinstrument avsett att mäta fysiskt och psykiskt hälsotillstånd senaste veckan. Flera olika översättningar har använts och någon svensk standardisering, normering och validering har inte funnits. Skalan har i avsaknad av svensk normering vanligtvis utvärderats efter utländska normer. Vidare visar resultaten att de i SCL-90 ingående skalorna differentierar tillfredsställande mellan normal- och patientmaterial och vissa diagnosgrupper, men räcker inte till att predicera olika syndrom. Skalan kan således inte användas ensamt som diagnostiskt instrument. Testet kan vara användbart vid: Initial bedömning av patienter vid inskrivning som en metod att skatta symptom; Mätning av patientframsteg under och efter behandling för att beskriva förändring; Mätning av resultat av behandlingsprogram och hos vårdgivare genom aggreggerad patientinformation ;Kliniska försök som stöd att mäta förändringar av symptom som depression och ångest. SCL-90 kan användas för personer från ca 13 år och uppåt. Formuläret består av 90 påståenden om hur man har besvärats av psykiska och fysiska symptom de senaste 7 dagarna, som skattas på en 5gradig Likert-skala från "Inte alls" till "Väldigt mycket". Instrumentet mäter 9 primära dimensioner av symptom och det är utformat för att presentera en överblick av en patients symptom och deras intensitet vid en specifik tidpunkt. Låga värden betyder att man har god psykisk hälsa. Symptomskalor: Somatisering. Hur man upplever kroppsliga obehag (om ev eventuell hypokondri kan föreligga). Tvångssymptom. Man känner sig tvungen att tänka vissa tankar eller upprepa vissa beteenden. Interpersonell känslighet. En överdriven känslighet för andras beteenden eller förändringar i omgivningen Depression. känslor eller upplevelser av nedstämdhet. Ångest. Man har starka känslor av panik eller obehag. Aggressivitet, fientlighet. I vilken utsträckning man hyser aggressiva känslor mot andra. Fobisk ångest. Man undviker specifika situationer som man upplever som obehagliga. Paranoida föreställningar. Man känner sig förföljd eller hotad. Psykoticism. Ens förställningsvärld är förvirrad eller splittrad. Genom att instrumentet ger en överblick av symptomens svårighetsgrad kan det användas för att underlätta beslut i behandlingen och för att identifiera patienter innan problemen blir akuta.Observera att SCL90 inte är ett diagnostiskt instrument, den slutsats man kan dra är om respondenten tillhör den aktuella patientgruppen eller inte. 1. Huvudvärk Ganska Väldigt mycket mycket 3 4 2. Nervositet eller inre oro 3 4 3. Återkommande tankar, ord eller 0 4 Inte Lite Måttligt alls grand 0 1 2 0 1 2 1 2 3 1 2 3 mycket idéer som Du inte kan göra Dig fri från 4. Svimningskänsla eller yrsel? 4 0 • Beskriv KSP. KSP (Karolinska Scales of Personality) är ett personlighetstest som syftar till att kartlägga hur en person känner sig och fungerar i olika sammanhang. Användningsområde är i prekliniska och i kliniska sammanhang, dvs det är ett test som utreder personlighetsstörningar hos individer. KSP är ett formulär med 135 påståenden (med 4 svarsalternativ till varje påstående) som mäter 15 delskalor (psykisk ångest, somatisk ångest, muskelspänning, impulsivitet, monotoniundvikande, socialisation, social desirability, psykasteniskalan, distans, misstänksamhet, skuldkänslor, hämmad aggressivitet, indirekt aggressivitet, verbal aggressivitet, irritabilitet). Resultatet på formuläret kan ge info om vilka områden som kan vara viktiga att gå vidare med i en behandling. KSP kan oxå i forskningssammanhang ge info om vilka aspekter av personligheten som har ett samband med en viss problematik. Fördelar: - billigt och lättadministrerat. - det finns en skala för att mäta social önskvärdhet Brister: - bristande normering (från örjans häfte) • Beskriv SSP. (Källa Örjans häfte samt testgenomgången) Swedish University Scales of personality - SSP är en vidareutveckling av KSP (karolinska scales of personality). Det är således ett typiskt utförande test som används prekliniskt och kliniskt med syfte att kartlägga hur personen känner sig och fungerar i olika sammanhang. KSP utvecklades för att testa personlighetsstörning hos alkoholister men nu används både KSP och SSP till att mäta sårbarhetsfaktorer hos individer även i andra sammanhang. SSP har 13 skalor vilket är två mindre än KSP. Kan användas för att få information om hur man ska gå vidare med behandling. Då KSP fått kritik för bristfälligt urval vid normeringen har en ny och bättre sådan gjorts för SSP. • Beskriv MMPI-2. Det här blev ett mycket långt svar men tyckte det behövdes eftersom det inte står något om testet i testbeskrivningen och jag tror inte att så många av er kollade på det. Minnesota Multiphasic Personality Inventory är en självskattningsskala där man ska svara om påståenden stämmer eller inte stämmer. Exempel på items är ”Jag blir arg ibland”, ”Jag tycker om att flörta”, ”Jag skulle tycka om en bibliotekaries arbete”, ”För det mesta önskar jag att jag vore död”. Som ni förstår av att påståendena skiljer sig så mycket från varandra består MMPI-2 av många olika delskalor. Man kan dela upp skalorna i kontrollskalor, kliniska skalor och tilläggsskalor. Kontrollskalorna ger information om testpersonens inställning till testningen, exempelvis om han försökte fuska sig till ett sämre resultat genom att fylla i fler skalor med patologiskt innehåll än vad personens verkliga problem rättfärdigar. Man kan också få reda på om en person fuskar sig till ett bättre resultat. De kliniska skalorna skapades för att identifiera psykiska sjukdomar som depression och schizofreni. Syftet med MMPI-2 är att särskilja de som har emotionella störningar från normalpopulation (konstigt formulerat kanske, i boken står det distinguishing normal from abnormal groups), testet skapades för att hjälpa till vid diagnosticering eller utredning av psykiska sjukdomar. Testet används fortfarande mestadels i detta syfte men tydligen även vid rekrytering eftersom en av våra föreläsare pratade om det. Som kliniskt instrument ska MMPI alltid användas i kombination med andra utvärderingsmetoder, man kan inte diagnosticera enbart baserat på testresultatet. Skalorna utvecklades redan på 1940-talet genom att man utgick ifrån 1000 items som valts ut ur fallstudier, psykologiska artiklar, läroböcker etc. utifrån dessa valdes 504 items ut som bedömdes vara relativt oberoende av varandra. Skalorna skapades sedan empiriskt genom att man testade alla item på en kriterie- (psykiatriska patienter inom slutenvården) och en kontrollgrupp (patienternas anhöriga samt besökare på sjukhuset). Kriteriegruppen delades upp i åtta grupper beroende på diagnos, därifrån skapades de åtta kliniska skalorna. MMPI-2 blev klart 1989, 567 items och tar mellan 1-2 timmar att genomföra. Skillnaden är framförallt att man genomfört ny standardisering men även att man tagit bort en hel del item och lagt till nya. Nya kontrollskalor har även lagts till. Skalorna: Kliniska: Hypokondri, Depression, Hysteri, Psykopati, Maskulin- Feminin, Paranoia, Psykasteni, Schizofreni, Hypomani samt Social Introversion (las till senare). Kontrollskalor: L- skalan, K-skalan, F-skalan,?-skalan, VRIN-skalan, TRIN-skalan, Fb-skalan. Jag tror det är överkurs att veta vad alla de här betyder men om ni vill: http://psychology.about.com/od/psychologicaltesting/a/mmpi_3.htm Reliabiliteten är helt ok men det finns vissa problem man inte tog itu med när MMPI-2 skapades. Skalorna överlappar varandra i väldigt hög grad varför de korrelerar med varandra, något som inte är bra för testets validitet (kan man verkligen utläsa olika mönster hos testpersoner?) Ändå varierar reliabiliteten mellan skalorna väldigt mycket, alpha mellan.32-.90. Begreppsvaliditeten är hög, man har genomfört fler studier på MMPI än på något annat personlighetstest, exempelvis har många studier visat att testresultat kan kopplas till alkohol- och drogmissbruk, det verkar alltså som att man kan hitta personer som löper risk att bli alkoholister med detta test. • Beskriv MBTI (Myers-Briggs). Blir ganska mycket repetering från häftet om testen, men i en lite kortare version. Testet bygger på C-G Jungs teori om psykologiska typer och kategoriserar människor till en av de två polerna i dessa fyra motsatspar: Extroversion-Introversion (EI), Sinnesförnimmelse-Inuition (SN), Tanke-Känsla (TF) och Bedömning-Perception (JP). Det kan då bli 16 olika preferensprofiler, vilken profil man blir beror på hur man svarar på olika påståenden. Man menar att kombinationen visar personliga preferenser, att det är vägledande i hur man utformar sitt liv i stort och att testet är bra för självkännedom. MBTI används vid förändringsarbete i organisationer och företag, t.ex. teambuilding, ledarutveckling och karriärplanering. Kan användas både enskilt och i grupp. Försöker besvara frågeställningar som t.ex. hur man uppfattar sin omvärld, hur man löser problem och hur man kan förväntas reagera under stress. MBTI har i vissa delar en ipsativ itemkonstruktion och i vissa delar en normativ konstruktion. MBTI är inte ett normativt test. Som ni säkert alla har läst i häftet så skriver Örjan där att MBTI kanske inte kan fungera som något mer än ett ”underhållande sällskapsspel”. Han skriver att om det nu utger sig för att bidra till självkännedom så måste begreppsvaliditetet förbättras för det finns inga vetenskapliga belägg för detta. Eftersom testet inte är normrelaterat så bör det inte användas i rekrytering och urval, eftersom man då jämför individer och det kan man inte göra med detta test. • Beskriv GPI (Gordons). Gordons personlighetsinventorium mäter egenskaper och värderingar hos normalbefolkningen. Det var ett av de första allmänna personlighetstesten inom det arbetspsykologiska området och har varit ett av de mest använda personlighetstesten i Sverige. Inventoriet består av tre delar: GP:A, GP:B och GP:C som man kan använda var för sig om man vill. GP:A mäter åtta personlighetsegenskaper som t.ex. ansvar, känslomässig stabilitet, försiktighet och originellt tänkande. GP:B mäter sex nyckelvärderingar i arbetslivet så som praktiskt sinnelag (värderar att få ”valuta för pengarna”) och ordentlighet (värderar att saker och ting är på rätt plats). GP:C mäter sex mellanmänskliga värderingar, t.ex. stöd (värderar att bli vänligt och hänsynsfullt bemött) och självständighet (värderar att kunna göra saker och ting på sitt sätt). Gordon utgick från studier av bland andra Cattell när han utformade del A. När del B & C utarbetades baserades de på andra forskares arbete om vad som anses karakteriskt i olika sammanhang. Eftersom det som alltid med självskattningar finns en risk att testpersoner väljer det svar som är mest önskvärt, ville Gordon se hur individer värderade olika alternativ relativt varandra. GPI är därför indelat i olika block med antingen negativa eller positiva svarsalternativ. Svaren är av s.k. forced-choicekaraktär, exempelvis kan individen tvingas välja vad den värderar mest/minst av några alternativ, som alla egentligen är positiva egenskaper. När ett test på detta sätt har ett fast antal poäng som fördelas över olika dimensioner, är testet ipsativt. Vid ipsativa tester kan man inte göra normativa jämförelser, det enda resultatet säger är hur en viss person har rangordnat sina preferenser. Gordon har ändå försökt göra så att testet går att jämföra mellan individer, varför det heter att GPI är kvasi-ipsativt. Det innebär att Gordon försökt lösa problemet med ipsativitet genom att i varje block om fyra ange två positivia och två negativa egenskaper, då finns det flera alternativ och därmed olika tänkbara poängsummor. Detta gör enligt Mabon att man kan tillämpa statistisk analys på ett helt annat sätt än vid ipsativa tester. Örjan verkar mer kritisk och säger att eftersom GPI är ipsativt ska det inte användas i situationer där man jämför individer, alltså t.ex. ska det inte användas i urvals- och rekryteringssammanhang. Kriterievaliditeten för flera av GPI:s variabler är utmärkt (>0,55). Ingen information finns gällande begreppsvaliditeten. Homogeniteten är OK (0,7 – 0,8). Det finns ingen information om stabiliten. Man kan läsa mer i häftet Testbeskrivningar och i Mabon s. 251-253. Barntest Allmänt om barntest • I Smedlers bok diskuteras tre olika tillvägagångssätt för individualdiagnostiska utredningar av barn: a. metodorienterad utredning, b. problemorienterad utredning, c. utredning mot befintlig behandling. Beskriv arbetsgången i dessa tre. a) Smedler (1993, s. 25) skriver följande: ”Vid en metodorienterad utredning har man ett standardbatteri med test som man administrerar vid i stort sett alla individualdiagnostiska utredningar. Man gör sällan några ändringar eller tillägg. Att ha ett standardbatteri har förstås fördelen att psykologen är väl bekant med de ingående testen. Det förbättrar reliabiliteten och gör det möjligt att göra finstämda observationer i testsituationen. Testresultaten kan också tolkas på ett nyanserat sätt, då psykologen har en rik klinisk erfarenhet med dessa test att utgå ifrån. En metodorienterad utredning riskerar dock att bli något mekanisk, och de ingående testen kanske inte är särskilt väl ägnade att spegla just det här barnets centrala problematik. Metodiken har på förhand begränsat vilka diagnostiska frågeställningar som kan formuleras. Kopplingen till behandling är inte heller given.” b) Smedler (s. 25-26) fortsätter så här: ”Vid en problemorienterad utredning använder man ingen förutbestämd metod, utan utgår från den preliminära bild av problemet man skaffat sig i utredningens inledande skede. Med denna som utgångspunkt formulerar man hypoteser om vad kärnproblematiken kan tänkas vara. Detta bör göras så brett och förutsättningslöst som möjligt. Kanske inställer sig frågor kring barnets allmänna mognad (sensorimotoriskt, kognitivt, emotionellt, socialt). Man kan komma att uppmärksamma tecken på avgränsade förseningar eller funktionsstörningar. Frågor kring tidiga relationsstörningar kan väckas. Kanske uppstår frågor kring barnets kommunikativa förmåga, språkutveckling, uppmärksamhet och koncentrationsförmåga. Ibland finns det somatiska inslag i problembilden, och man kan behöva utreda om det rör sig om ett psykosomatiskt uttryck. Andra gånger vill man få undersökt om det finns en somatisk grund för det psykiska symtomet. Listan på tänkbara arbetshypoteser kan göras lång, men själva poängen är att den knappast kan göras heltäckande. Man utgår från vad man hittills vet om just detta barn, och formulerar sina arbetshypoteser så förutsättningslöst som möjligt. Dessa prövas sedan stegvis under utredningen, och till sin hjälp tar psykologen bland annat test.” c) Slutligen skriver Smedler (s. 27) detta: I en ”utredning riktad mot befintlig behandling vill man få klarhet i om barnet kan tänkas vara hjälpt av det man har att erbjuda. Arbetssättet kan dock slå snett, som i följande exempel: man ’hittar’ ett barn som erbjuds en obesatt plats i en nedläggningshotad specialförskola. Utredningen har varit ganska ensidigt inriktad på att få stöd för att just detta barn skulle behöva den speciella förskoleplaceringen, istället för att mera förutsättningslöst undersöka barnets behov”. • I barnkliniskt utredningsarbete kan man använda sig av bl.a. en metodinriktad arbetsgång, eller göra en mer probleminriktad utredning. Beskriv och jämför skillnader och likheter. Vid metodinriktat utredningsarbete har man ett standardbatteri med test som man administrerar vid i princip alla utredningar. Man gör sällan några ändringar eller tillägg. En fördel med detta arbetssätt är att psykologen är van att använda dessa test, vilket förbättrar reliabiliteten i bedömningarna. Om psykologen är bekant med testen behöver heller inte lika mycket fokus läggas på att koncentrera sig på att administrera på rätt sätt, utan det finns möjlighet att göra nyanserade observationer under testningen. Även tolkningen av testresultatet blir mer nyanserad när psykologen har stor erfarenhet av testet. Det som talar emot en metodinriktad arbetsgång är bland annat att man på förhand begränsar de diagnostiska frågeställningar som kan formuleras. Det testbatteri man valt att använda kanske inte passar ett visst barns problematik. Det metodinriktade arbetssättet riskerar alltså att bli allför mekaniskt. Vid problemorienterad utredning har man ingen förutbestämd metod utan utgår från den preliminära bild av problemet man skaffat sig under utredningens första del. Med denna problembild som utgångspunkt formulerar man hypoteser om vad kärnproblematiken kan tänkas vara. Man utgår från det specifika barn man vill utreda och försöker vara så öppen och förutsättningslös som möjligt för att inte snäva in sig. Hypoteserna kan t.ex. handla om ifall det finns somatiska inslag i problembilden, ifall det finns relationsstörningar eller kommunikationsstörningar. Dessa hypoteser testas sedan under utredningens gång och utefter vilka frågeställningar som bekräftas gör man upp en plan för behandling. Nackdelen med detta arbetssätt är att ingen psykolog kan behärska alla sorters test och det är svårt att vara helt objektiv i en utredning. Tar man emellertid modellen med en nypa salt och inser att man inte kan kunna allt, så är det enligt Smedler ett bra sätt att arbeta på. Det finns också något som heter utredning riktad mot befintlig behandling, vilket går ut på att få klarhet i ifall barnet kan dra nytta av någon av de behandlingsformer man har att erbjuda. Denna metod kan dock vara riskfylld, som i Smedlers exempel där man har en plats över på särskolan och ”hittar” ett barn som man erbjuder denna plats. Utredningen kan i detta fall ha varit ensidigt inriktad på att få stöd för att barnet skulle dra nytta av särskoleplats, istället för att mer förutsättningslöst titta på barnets behov. Läs mer om detta i Smedler s. 25-28. • Jämför testning av barn med testning av vuxna, framförallt med avseende på själva testsituationen och på de slutsatser man kan dra av resultaten på testet. Hjärnan är plastisk. Barn befinner sig i ständig och dynamisk utveckling. Ju yngre barn desto mera uttalat blir detta. Eftersom testteoretiska begrepp som är gängse vid testning av vuxna bygger på ett antagande om relativ stabilitet finns här omedelbara implikationer för testning av barn. För att kunna dra slutsatser utifrån resultaten måste därför hänsyn tas till detta. Ju yngre barn som testas desto svårare blir det att hitta exempel på egenskaper som är stabila ens i ett kortare perspektiv. För att kunna använda sig av resultaten på testningen krävs det att många barn inom alla åldersintervall som man har för avsikt att täcka prövas. Testningen kräver också utvecklingspsykologiska överväganden i utformandet av testmaterialet. Den slutgiltiga normeringen kräver alltså ett oftast långt mer omfattande standardiseringsarbete än vad fallet är inom vuxenområdet. Eftersom kraven för att ett barntest ska bli bra är större finns det få barntest som är av god psykometrisk kvalitet (Smedler s. 1517). av vuxna också men är kanske än mer viktigt när man testar barn. Om barnets förälder är med ska denne informeras om hans/hennes roll under testningen. Enligt Smedler är det rimligt att uttala sig om vad barnet kan må väl av och ha för behov under det närmaste året. Hon skriver också att tidiga tecken på utvecklingsavvikelser i allmänhet är ganska diffusa. Och det som hos ett barn var ett tidigt tecken kan hos ett annat spontant försvinna. Det går alltså inte att tvärsäkert uttala sig om den individuella utvecklingen (Smedler sid128-130). Sammanfattningsvis krävs kanske en större försiktighet när testledaren drar slutsatser om barnets resultat än vad som är fallet vid vuxentestning. Under tiden när testet bjuds ska testledaren vara uppmärksam på kontakten med barnet för att barnet ska känna sig trygg i situationen och kunna kommunicera vid behov. Det är också bra att vara uppmärksam på om barnet tröttnar, tappar koncentrationen eller verkar känna sig obekväm. En god kontakt ger även större möjligheter till andra observationer under testningen. Trots detta är testning av barn vid utredningar faktiskt mer vanligt än vad testning vid vuxenutredningar är. Anledningen är enligt Smedler att intervju som är det vanligaste sättet att utreda vuxna på inte passar lika bra för barn. Barnet blir ofta stelt i en intervjusituation. Om man istället leker med barnet är det mycket vanligare att barnet spontant väljer att på sitt sätt berätta om dagens händelser. Ett test kan fungera som ett kontaktmedel och ge viktig information av en förutbestämd art. En testsituation med barn blir oftast mindre stram men också mer rik på information än när vuxna testas. Detta kan bero på att barnet ofta uttrycker sig mera spontant, och utöver det namngivna innehållet i testet får man i regel en vidare inblick i barnets sätt att vara. Enligt Smedler uttrycker barnet sin personlighet i sättet att relatera till testledaren och hur han/hon handskas med materialet och frågorna. Även omvänt framskymtar ofta barnets intellektuella mognad även i en personlighetstestning (Smedler, s. 11-12). Barn är inte lika förutsägbara som vuxna och kan inte inhibera sina impulser såsom "normala" vuxna kan, detta ställer högre krav på testledaren. Det är mycket viktigt att etablera en god kontakt med barnet och vidare att hålla barnet intresserad och motiverad att göra sitt bästa på en specifik uppgift, det har visat sig att kontakten/personkemin med testledaren spelar stor roll för prestationen hos barn. Detta gäller framförallt under ett begåvningstest. Det är självklart extra viktigt att vara bekant med materialet och testet som sådant så att man kan koncentrera sig till fullo under testets gång, observation är nämligen extra viktig under barntester. Tänk på att testsituationen med all sannolikhet är mycket konstig för barnet. Vid tolkning av testresultatet måste man vara försiktig då barnet ju hela tiden förändras och att resultatet som man fått fram kanske inte är representativt om en vecka. Barn utvecklas ofta i etapper och avvikanden från det "normativa" resultatet kan vara helt i sin ordning, man bör alltså komma ihåg att en ojämn testprofil kan vara helt ok nån vecka senare. Man skall även vara försiktig med att "stämpla" barnet då en diagnos kan resultera i att barnet blir bemött på ett annat (inte alltid positivt) sätt av både vuxna och andra barn. Dagsformen hos ett barn är dessutom mer ombytligt och fragilt än för den "normativa vuxne", barn är även känsligare för faktorer så som sömn, mat och allmänt psykiskt tillstånd. • Att testa barn ställer speciella krav både på testledaren och på själva testsituationen. Beskriv och motivera varför, samt vad man som testledare speciellt bör tänka på. Smedler s. 65. Eftersom barn inte har samma förståelse som en vuxen inför en testsituation är det viktigt att testledaren etablerar en bra kontakt med barnet innan testningen påbörjas. Det finns ingen standardiserad procedur för detta men det man vill uppnå är en samarbetssituation, barnet bör vara informerat om att man ska arbeta tillsammans en stund och att testledaren håller i tyglarna. För att det inte ska bli onödiga störningar i testningen ska man se till att sitta ostört, gäller visserligen vid testning • Vad bör du enligt Smedler vara extra uppmärksam på i själva testsituationen, när du ska testa ett barn? Det är viktigt att vara uppmärksam på kontakten med barnet under hela testningen. Den bör inte vara nära och påträngande, men man bör ha koll på hur bekvämt barnet känner sig i situationen, och om han/hon känner sig fri att kommunicera med dig. Man observerar inte bara själva testresultaten utan också hur barnet handskas med uppgiften och situationen i sin helhet. Smedler listar en lång rad faktorer som man ska vara observant på i testsituationen. De övergripande rubrikerna är: kontakt, barnets attityd till testningen, förhållande till testsituationens krav (tex uppmärksamhet), arbetssätt, språk, visuomotorik (barnets motorik) och yttre faktorer. (smedler, s 66-69) • Ett problem med barntest gäller den s.k. prediktiva validiteten. Ge exempel på hur det visar sig, och resonera kring varför den prediktiva validiteten ofta är låg. (Se sid. 4) • Ange fördelar och nackdelar med mer eller mindre strukturerade testsituationer vid testning av barn. Beskriv gärna med exempel. Mer strukturerade testsituationer har sina fördelar i att reliabiliteten blir hög. Om allt är ordningsställt likadant och manualer följs till punkt och pricka kan man också försäkra sig om att mätsäkerheten blir hög. Andra fördelar är att man som testledare för strukturerade test bara behöver lära sig följa ”körschemat”, som Smedler uttrycker det. När man känner sig hemmastadd med materialet är det bara att testa på. Förberedelserna kan sägas vara av handfast karaktär. Problemen uppstår när man inser att barn inte är robotar och reagerar väldigt annorlunda på testsituationer. Vissa kanske tycker att det är helt ok att sitta med en vuxen som pratar konstigt och inte svarar på frågor man som barn ställer, medan andra upplever det konstigt och olustigt och därav presterar sämre. Projektiva test, som är ostrukturerade, bereder problem av en lite annan karaktär. De är så fria och öppna att det ibland kan kännas som att det inte går att skapa en testsituation - och om det går- var går gränserna för denna? Vidare kan barnet kan bli ganska berört av materialet och situationen, därför kan det kännas svårt att utföra testet utanför en klinisk situation eftersom man då inte får möjlighet att följa upp kontakten. Fördelar med ostrukturerade test är just framsidan av problemen. Den fria situationen främjar ett aktivt och ohämmat beteende hos barnet som inte behöver förställa sig eller känna sig obekvämt. På så sätt är ostrukturerade mätningar att föredra. Exempel får ni fundera ut på egen hand. Smedler sida 79-80. Jag hittade inte det här så jätteklart någonstans, men plockar lite varstans för att få ihop en bild. Nackdelar: Man får räkna med mindre tålamod och är mer oberäknelighet än de flesta vuxna. Situationer man inte räknat med kan dyka upp (som kisspaus, vägran, prat om annat etc.) under testsituationen. Man bör också vara medveten om att testsituationen kan göra så att barnet beter sig helt annorlunda än vad hon egentligen gör. Resultaten kan därmed bli missvisande många gånger. Därför är det viktigt att titta på barnets beteenden från många olika synvinklar (observationer av olika slag eller andra tester). Barn förstår inte alltid testsituationen och kan t.ex. fråga testledaren om svaren vilket man bör undvika att svara på, både pga. övningseffekt och för att inte göra situationen prestationsladdad. Fördelar: Strukturerad testing ger svar på många frågor som man ev. har. Om testet har hög validitet så kan det ge mycket för barnets skolgång och allmänna leverne. Exempel på barntest • Beskriv testet Griffith. (Test för barn som är 0-2 år) Systematiska observationer av små barns beteenden och beteendeförändringar över tid. Två versioner finns: 0-2 år samt 2-8 år. Oftast testas barnet i hemmiljön med en förälder närvarande. Testsituationen tillåts vara väldigt flexibel. De olika momenten: Testuppgifter, observationer samt information från föräldrarna sker på ett väldigt fritt sätt. Detta gör att individuella skillnader även hos testledaren i hög grad kan påverka resultatet. Friheten gör också att testsituationen blir föga standardiserad. Man mäter 5-6 olika aspekter av ett barns utveckling. Antalet delskalor är beroende av barnets ålder. (0-2 5st, 2-8 6st) -Motorik -Personligt och socialt beteende -Hörsel och tal -Samordning av öga och hand -Performance (handskas med föremål, klossar och pussel) -Praktiskt resonerande (2-8år, kunna klockan, veckans dagar, upprepa sifferserier mm) Bjudningstid: 15-60 min beroende på ålder. Testet används tex vid misstanke om cp-skada Griffiths är utformat efter systematiskt genomförda observationer och testet vilar följaktligen inte på ngn särskild utvecklingsteoretisk modell. Eftersom testet saknar teoretisk grund, är därav en begreppsmässig validitetsbedömning omöjlig. Reliabilitet: Korrelationer mellan deltesten är höga (0.60 – 0.90), men genom detta kan man inte heller säga att delskalorna faktiskt mäter olika aspekter av ett barns utveckling. Validiteten är ofullständigt redovisad. Begreppsvaliditet är inte möjlig, eftersom ingen prövbar teori ligger till grund för testet. • Beskriv ett test som kan användas för att studera utvecklingen hos en 1-åring. Motivera ditt val och diskutera kortfattat de styrkor och ev. brister hos det test du valt. Jag tror att Griffiths utvecklingsskala I fungerar ganska bra. Det är det enda testet i testhäftet som används för att bedöma utvecklingen hos så pass unga barn som ett år, och därför finns det inte så mycket att välja på. Styrkor: Vokalt beteende mäts redan i tidig spädbarnsålder. Svensk normering finns. Ger möjlighet till flexibel utformning av testningen (kanske är detta samtidigt en svaghet?). Svagheter: Vilar inte på någon teoretisk modell. Gammal normering. Inga bevis på validitet eller reliabilitet. (Källa: testhäftet) Griffiths utvecklingsskala I passar till att testa så här pass små barn, det är Sveriges mest använda test för bedömning av barn i förskoleåldern. Testet administreras oftast i hemmamiljö och inleds med en intervju med föräldrarna. I manualen betonas det att det är viktigt att etablera en god relation till både föräldrar och barn. Det kan t.ex vara bra att ta små lekpauser om barnet verkar trött på uppgiften. Utifrån barnets beteende och attityd i testrummet avgör psykologen vilken av delskalorna som är lämplig att börja med. Man kan även hoppa vidare från en skala till en annan om barnet verkar ha lessnat på den föregående. Samma uppgifter och material återkommer på olika åldersnivåer med ökad svårighetsgrad. Griffiths skala I som ju är den vi använder på så här små barn är uppdelad i 5 delskalor (A-E) Den består av 226 uppgifter, 156 för de första 12 månaderna och 104 för åldrarna 1224 månader. Testet är en vidareutveckling på Gesell och Buhler-Hetzers tester. Griffih har utformat testet vidare genom sina systematiskt utförda observationer och testet vilar följdaktligen inte på någon särskild utvecklingsteoretisk modell. Detta är det enda testet som har med vokalt beteende från tidig spädbarnsålder. Varje delskala är avsedd att belysa en speciell aspekt av ett barns utveckling. Delskalorna är de följande; A-Motorik B-Personlighet och socialt beteende C-Hörsel coh tal D-Samordning av öga och hand E-Performance Om man t.ex. misstänker att barnet har en CP-skada så studerar på vilken utvecklingsnivå barnet befinner sig i de fem delskalorna. Skalan är normrelaterad. Antalet rätta uppgifter summeras och en månadsnivå räknas ut för var och en av de fem delskalorna. Utvecklingsåldern för varje delskala får man genom att summera månadspoängen i varje kolumn i sammanfattningstabellen. Resultaten räknas om till staninepoäng och prickas in i ett profilschema, vilket visualiserar "toppar och dalar". Griffith´s är ett test som är tidskrävande att lära sig och kräver omfattande material. En van användare behöver dock bara förberedelsetid för intervjun men föräldrarna. Griffiths har ganska svag dokumentation av psykometriska egenskaper och inga eller svaga bevis för reliabilitet, validitet. En del talar för att man som erfaren barnpsykolog skulle kunna göra en likvärdig bedömnin utan att administrera testet. En av styrkorna med testet är just att den mäter verbalt beteende från tidig ålder. Testets flexibilitet då det anbelangar testlokal är å ena sidan positivt, å andra sidan negativt. Testet ger en ram och måttstock för testledaren i dennes bedömning och underlättar kommunikationen kring resultaten över tid. Den prediktiva validiteten är.40 vilket kan tyckas lågt, men liknande reultat är vanliga inom barntester. Testet saknar också teoretisk grund och därav är en begrppsmässig mätning av validiteten omöjlig. • Vilket/vilka test kan du använda för att bedöma utvecklingen hos ett 15 månader gammalt barn? Beskriv kortfattat. Vad kan du närmare studera och vilka slutsatser kan du dra? Ett alternativ är Griffiths utvecklingsskala I som används för barn i åldrarna 0-2 år (Griffiths skala II är för barn i åldrarna 2-8 år). Testet för ett 15 månader gammalt barn består av 104 uppgifter fördelade på fem delskalor (A-E). A – motorik, B – personligt och socialt beteende, C – Hörsel och tal, D – samordning av öga och hand, E – Performance. Testet ger en uppfattning om barnets utvecklingsnivå inom de olika områdena och används t ex vid misstanke om cp-skada. En stor fördel med detta test är att det är flexibelt då det gäller administreringen, det är exempelvis valfritt vilken skala man börjar med och det är tillåtet att hoppa mellan skalorna om barnet blir uttröttat och okoncentrerat. En annan styrka med Griffiths är att det mäter verbalt beteende från tidig ålder. Enligt testbeskrivningshäftet ger det huvudsakligen en ram och måttstock för testledaren i bedömningen samt möjlighet till jämförelser över tid. Det underlättar också kommunikationen kring resultaten. Den prediktiva validiteten mellan Griffiths skala I och II är dock relativt låg och bevisen för reliabilitet och validitet är för övrigt få. Detta gör förstås att slutsatser om utvecklingsnivån inom olika färdighetsområden bör dras med stor försiktighet. I övrigt är det svårt att hitta test för barn under tre år. Möjligtvis skulle Bayles utvecklingsskalor kunna användas. En student som tidigare läst kursen skriver: ”Alternativet är att använda Bayles utvecklingsskalor som består av tre delar : mental scale, motor scale och infant behavior record. En styrka är att färdighetstesterna kompletteras med en personlighetsbedömning och att testet har god reliabilitet och validitet och därför är ett bra instrument i forskningssammanhang. Tyvärr är inte skalan normerad i Sverige.” • Beskriv Griffiths utvecklingsskala II kortfattat. (Test för barn som är 2-8 år) Är ett instrument för utvecklingsbedömning för barn 2-8 år. Det är det i Sverige mest använda testet för utvecklingsbedömningar av barn i förskoleåldern. Griffiths utvecklingsskala II består av sex delskalor A-F som alla avser att belysa en speciell aspekt av ett barns utveckling. Dessa delskalor är motorik, personligt och socialt beteende, hörsel och tal, samordning av öga och hand, performance och praktiskt resonerande. Bedömningen görs ofta i hemmiljö med en förälder närvarande. Först görs en intervju av föräldern och i manualen betonas hur viktigt det är att skapa en god relation till både förälder och barn. Testledaren väljer själv i vilken ordning delskalorna administreras grundat på bedömningen av barnets attityd och beteende i testrummet. Man kan även hoppa mellan skalorna t.ex. om barnet blir trött. Samma uppgifter och material återkommer på olika åldersnivåer med ökad svårighetsgrad. Har svaga bevis rörande validitet, reliabilitet, användbarhet och normer men skapar goda förutsättningar för kontakt med barnet och tillfällen till allsidig observation och bedömning. • Jämför Griffiths med WISC när det gäller själva testsituationen och testledarens roll. Griffiths´Developmental scale är en utvecklingsskala som bygger på systematiska observationer av små barns beteenden och beteendeförändringar över tid. Det finns två delar, en för åldrarna 0-2 år och en för åldrarna 2-8 år. Bedömningarna görs oftast i hemmiljö med en förälder närvarande. Turordningen på uppgifterna är flexibel och man varvar testuppgifter, observationer och information från föräldrarna på ett mycket fritt sätt. Smedler skriver att flertalet barnpsykologer tycker att den ”mjuka” testsituationen är tilltalande och fungerar bra (Smedler s. 30). Som beskrivningen ovan antyder är testsituationen inte särskilt standardiserad (Smedler s. 34). Wechsler Intelligence Scale for Children är ett allmänintelligenstest för barn. WISC täcker åldrarna 6-15 år. WISC består av en verbal del med sex deltest och en perfomancedel också med sex deltest. Varje deltest består av uppgifter i stigande svårighetsgrad och man avbryter deltestet då barnet med relativt stor säkerhet nått sitt tak på deltestet. (Smedler, s. 38). Jag hittar det inte skrivet någonstans i litteraturen men något som vi har blivit smärtsamt medvetna om är att WISC ställer höga krav på testledaren som strikt förväntas följa det som står skrivet i manualen. Utan referenser vågar jag påstå att WISC är, till skillnad från Griffiths, väl administrativt standardiserat. Vid Griffiths görs bedömningarna oftast i hemmiljö med förälder närvarande. Dessutom görs alltid en intervju med förälder som inledning av testningen. Testsituationen ska utformas stödjande för barnet. Det är tillåtet att bryta standardsituationen bara för att ha roligt med barnet. Testledaren avgör utifrån barnets attityd och beteende i testrummet vilken av delskalorna det är lämpligt att börja med. Man kan även hoppa från den ena skalan till den andra om barnet exempelvis blir trött. Det är alltså en s.k. mjuk testsituation till skillnad från WISC. Testledareffekten har visat sig vara betydande eftersom testsituationen tillåts vara så pass flexibel. Smedler skriver att just det att man har så stor frihet som testledare skapar goda förutsättningar för kontakt med barnet och tillfällen till allsidig information och bedömning. Testsituationen blir å andra sidan inte alls standardiserad. När man administrerar WISC är den administrativa standardiseringen på ett helt annat sätt säkerhetsställd, den muntliga presentationen inför varje uppgift är exakt formulerad i manualen, även tidsramen är preciserad i vissa deltest (jag går inte in så mycket på WISC eftersom jag antar att alla har ganska bra koll på hur det går till). • Beskriv NEPSY. (Neuropsykologiskt test) NEPSY är ett testbatteri för neuropsykologisk undersökning av barn i åldern 3:0-12:11 år. Det är det enda som finns på detta område och det används väldigt mycket! Det tillämpas inte bara för neuropsykologisk bedömning (svårigheterna kartläggs) utan även för planering av behandling och uppföljning (svårigheterna analyseras). Testet är en viktig del i grunden för planering av habiliteringsåtgärder för barn med utvecklingsavvikelser, dysfunktion, epilepsi eller andra neurologiska sjukdomar. Testet är mycket omfattande i sin helhet (27 deltest), men ofta räcker det att till en början använda ett par deltest (ett "startbatteri") ur varje domän för att få sig en allmän bild av barnets neuropsykologiska status. Sedan kan man utifrån resultatet på dessa deltest gå vidare med lämpliga deltest (ett utvidgat batteri). Testet 5 domäner (delar) är: "Uppmärksamhet och exekutiva funktioner", "Språkliga funktioner", "Sensomotoriska funktioner", "Visuo-motoriska funktioner" och "Minnes- och inlärningsfunktioner". Ofta används NEPSY i kombination med ett begåvningstest - t.ex. med WISC. (från örjans häfte) • Problem med att komma ihåg saker kan man ha lite till mans men beskriv ett test där man bl.a. mäter minnesförmågan. • Du arbetar på Barnhabiliteringen och skall utreda en 6årig pojke vars förskollärare tycker att han har blivit mer okoncentrerad och fumlig efter en trafikolycka ett halvt år tidigare. Vilket/vilka test vill du använda. Beskriv kortfattat. Ref. Häftet testbeskrivningar. Leiter-R, NEPSY & WISC kan alla användas för att kartlägga pojkens funktion inom olika områden. I Leiter kan uppmärksamhets/minnes-batteriet användas och NEPSYS deltest som fokuserar på uppmärksamhet, sensomotoriska och visuomotoriska funktioner bör ge intressant information. Performanceskalan i WISC är också relevant. Testerna kan givetvis ges i sin helhet om man så vill. Leiter-R; Deltest som är uppdelade på två batterier; ett visuellt-logiskt batteri och ett uppmärksamhets-minnes batteri. Lämpar sig tex för barn med hjärnskada. Används för att identifiera brister i uppmärksamhet och minne vilka kan indikera inlärningssvårigheter. Deltesten kan även användas för att udnersöka olika frågeställningar som har med ovan att göra. – Psykiska färdigheter hos individen, färdigheter, talanger och begåvning. Psykiskt välmående t.ex. psykisk stabilitet, styrka och ångest. – Individens relationer till andra i omgivningen, föräldrar, familj, lärare, kamrater. Testet används för forskning samt i skola, psykisk utredning av barn och ungdomar, diagnostisering samt som hjälp och underlag för terapisamtal. • Du arbetar som skolpsykolog på en central förvaltning och kan få vara med och påverka uppläggningen av en riksomfattande undersökning av hur svenska skolbarn mår idag. Beskriv ett test som skulle kunna vara användbart för detta syfte. (Se BUS) NEPSY; Neuropsykologiskt test. Deltest som är uppdelat på fem domänder och där man kan analysera exakt vart svårigheterna finns. Man kan även använda enbart några deltest. Ex på deltest är uppmärksamhet och exekutiva funktioner samt minnes-och inlärningssvårigheter, språkliga funktioner, sensomotoriska funktioner, viuo-motoriska funktioner • I ett forskningsprojekt inom skolhälsovården vill man bl.a. relatera barnens prestationer (enligt betyg) till ett mått på hur barnen ser på sig själva, inklusive sina kamratkontakter. Finns det något lämpligt test för detta ändamål? Föreslå, motivera och beskriv kortfattat. • Beskriv ett test som man kan använda sig av för att försöka få svar på frågeställningen om ett förskolebarn har en neuropsykologiskt normal utveckling eller ej. Redogör för styrkor och svagheter hos testet. För detta ändamål skulle NEPSY vara ett lämpligt test. Det riktar sig mot barn i åldern 3:0 – 12:11 år. NEPSY är en barnneuropsykologisk undersökningsmetod som bygger på Lurias teori. Testet innehåller 27 deltest uppdelade på fem områden: uppmärksamhet och exekutiva funktioner, språkliga funktioner, sensomotoriska funktioner, visuomotoriska funktioner och minnes- och inlärningsfunktioner. Testet används för bedömning, åtgärdsplanering och uppföljning. ”Jag tycker jag är…” vore lämpligt. Det stämmer överens med projektets syfte genom att det mäter självvärdering. NEPSY har visat sig ha god validitet, vilket är en styrka hos testet. En svaghet är att det är verbalt, vilket försvårar utredningen av barn som inte behärskar svenska språket. En annan svaghet skulle kunna vara att det krävs att testledaren har omfattande specialkunskaper. Det är ett väldigt omfattande test som kan ge en gedigen bild av den neuropsykologiska utvecklingen hos ett barn, men för mindre utredningar kan man välja ut några av deltesten. NEPSY ska kombineras med begåvningstest, då det är viktigt att veta barnets utvecklingsnivå, när man tolkar resultaten från NEPSY. Sedan hittar jag inget mer om NEPSY, men säg gärna till om ni gör det. Psykiska egenskaper (delområde två: färdigheter, begåvning, talanger; delområde tre: psykiskt välmående: psykisk stabilitet, styrka och ångest) För en repetition av ovan nämnda Lurias teori handlar den om tre block. Block I svarar för graden av vakenhet, medvetandegrad och ämnesomsättningsprocesser. Block II fungerar med hjälp av hjäss-, tinning- och nackloberna och spelar roll för mottagande av alla sorters sinnesintryck. Block III utgörs av frontalloberna och har avgörande betydelse för planering och styrning av våra handlingar. Källa: Häftet Testbeskrivningar. • Beskriv testet Jag tycker jag är. (Källa Örjans häfte samt testgenomgången) Detta är ett personlighetstest för barn, testet syftar till att mäta barns självvärdering/självuppfattning som ett utryck för den allmänna psykiska hälsan. Jag tycker jag är visar på allmänt välbefinnande och mäter själskattningen i tre delar. Testet gör det i form av tre huvudkomponenter som fördelar sig på fem underliggande delområden: Fysiska egenskaper hos individen (delområde ett: kroppsupplevelse, utseende) Individens relationer till andra i sin omgivning (delområde fyra: relationer till föräldrar och familj; delområde fem: relationer till kamrater och lärare) Alla barn i grundskoleåldern kan delta eftersom testet finns i två olika versioner, ett för barn i lågstadieålder och ett för barn som går på mellan- och högstadiet. Lågstadieversionen: 32 påståenden med svarsalternativen ”ja” och ”nej”, mellan- och högstadieversionen: 72 påståenden med fyra svarsalternativ från ”stämmer inte alls” till ”stämmer precis”. En nackdel med två test är svårigheten att jämföra lågstadiet med övriga stadier. Om många barn ska ingå i studien är ”Jag tycker jag är…” bra eftersom det kan administreras i grupp. Att det finns som dataversion gör det ännu mer lättadministrerat. Ett annat argument för användning av detta test är att det har hög validitet. Jag skulle föreslå barntestet ”Jag tycker jag är…” för ett sådant projekt. ”Jag tycker jag är…” stämmer överens med projektets syfte genom att det mäter självvärdering i form av tre huvudkomponenter som fördelar sig på fem underliggande delområden: - Fysiska egenskaper hos individen (delområde ett: kroppsupplevelse, utseende) - Psykiska egenskaper (delområde två: färdigheter, begåvning, talanger; delområde tre: psykiskt välmående: psykisk stabilitet, styrka och ångest) - Individens relationer till andra i sin omgivning (delområde fyra: relationer till föräldrar och familj; delområde fem: relationer till kamrater och lärare) – Fysiska egenskaper hos individen, kroppsupplevelse och utseende Dessutom kan alla barn i grundskoleåldern delta eftersom testet finns i två olika versioner, ett för barn i lågstadieålder och ett för barn som går på mellan- och högstadiet. Om många barn ska ingå i studien är ”Jag tycker jag är…” också praktiskt eftersom det kan administreras i grupp. Det gör även testet ekonomiskt motiverat för en större studie. Ett annat argument för användning av detta test är att det mäter det som det avser att mäta, det har hög validitet (enligt testbeskrivningshäftet). Övriga egenskaper: - Självskattningsformulär - Bygger på traitteorin - Lågstadieversionen: 32 påståenden med svarsalternativen ”ja” och ”nej”, mellan- och högstadieversionen: 72 påståenden med fyra svarsalternativ från ”stämmer inte alls” till ”stämmer precis” - Kan administreras individuellt eller i grupp - Papper och penna eller datorversion • Du arbetar som skolpsykolog och skolsköterskan vill att du skall ta kontakt med en 11- årig tystlåten pojke som vid flera tillfällen har varit hos henne och klagat över ont i magen. Finns det någon/några testmetoder som du kan ha nytta av i en sådan kontakt? Beskriv och motivera ditt val. Om pojken vill träffas skulle jag inleda kontakten genom att bjuda Jag tycker jag är, under förutsättning att pojken inte självmant börjar prata om sina besvär. Jag utgår dock ifrån att han inte gör det. • Beskriv C.A.T. Childrens apperception test. Det är ett projektivt barntest, dvs det bygger på tolkning. Det innebär även att testet utgår ifrån spykisk determinism, dvs att individen styrs inifrån av sin personlighet och av omedvetna processer. Komplexa stimuli tolkas utifrån personlighet och omedvetnaprocesser och dessa blir då synliga genom denna tolkning. Det inre projiceras på så vis ut på omgivningen, och behov och konflikter blir synliga. Testet utgår från psykoanalytisk teori(Smedler s. 49). Det ska kunna nå barnets inre drifter, försvar och konflikter. Barnet får se bilder och utifrån bilderna berätta historier som sedan tolkas. Barnets kroppsspråk och kommentarer som inte direkt rör bilderna ska också noteras. Bildernas innehåll rör kända psykoanalytiska utvecklingsteman som matsituationer och orala problem, aggressivitet, den oidiala triangeln, primalscenen, kastrationsångest, syskonrivalitet, toalettsituationen, mörkerrädsla, onanai och sexuella lekar. Bilderna tolkas sen och man tar 10 variabler i beaktning: huvudtema, hjälten, hjltens behov och drifter, hur den närmaste omgivningen beskrivs, reaktioner inför föräldrafigurer, jämnåriga och yngre, signifikanta konflikter(adekvata el. patologiska?), ångest för att bli skadad straffadlämnad e.d., ådersadekvata försvar, överjagsfunktioner, jagstyrka. Man uppmärksammar också om det finns något återkommande tema. Det finns 10 bilder, i två versioner med antingen djur eller människor(för lite äldre barn. Det finns också 10 mindre djurfigurer som kan användas som komplement till djurbilderna. Det finns inte några uppgifter om validitet eller reliabilitet. Men Smedler hävdar att det finns validitet för klinisk användning i syfte att ta fram hypoteser som sedan kan prövas med andra metoder. Kliniker* säger att testet är ett bra samtalsunderlag. källa: testhäftet, "att testa barn", A-C smedler s. 49, 54-58 och *kommentar från Monica Östberg. • Beskriv ett personlighetstest för barn och de frågeställningar testet försöker besvara. Jag tycker jag är beskrivs vara ett ”personlighetstest för att mäta barns självvärdering som ett uttryck för den allmänna psykiska hälsan” (se testbeskrivning). Eftersom pojken, låt oss kalla honom för Kalle, är 11 år fyllda skulle jag använda den version som är avsett för elever på mellan- och högstadiet. Motivet till att jag väljer att bjuda Jag tycker jag är beror främst på att Kalle, enligt uppgift, är tystlåten av sig och därför ter sig en intervju som direkt opassande. Machovertestet är ett projektivt test där barns människoteckningar och frågor om teckningarna används för kliniska bedömningar. Barn anses uttrycka sina kroppsupplevelser symboliskt i de människortecknigar de ritar vid testsituationen. Testet kan ge ”värdefulla pusselbitar” om självbild, kroppsuppfattning, önskningar och konflikter. Enligt Smedler (1993, s. 11) verkar det inte vara särskilt lyckat att försöka intervjua barn. Hon menar att intervjun ligger ”för långt från barns spontana uttryckssätt” och att ”även trygga barn med god verbal förmåga blir fåmälda och stela i en intervju”. Vidare skriver Smedler (s. 12) att ”ett test erbjuder barnet ett konkret material att arbeta och uttrycka sig med. Testet fungerar alltså som kontaktmedel, och kan ge viktig information av en förutbestämd art”. Visserligen skriver Smedler (s. 11) att man kan göra det möjligt för barnet att spontant berätta om dagens händelser ifall man är med barnet ”i lek eller parallell samvaro”, men eftersom Kalle är 11 år och inte tidigare varit i kontakt med skolpsykologen skulle jag tippa att lek förmodligen inte är en framkomlig väg. ”Jag tycker jag är” är ett objektivt personlighetstest i form av ett självskattningsformulär som avser mäta barns självvärdering. Det kan användas i en utredning för att ge en bild av barnets medvetet uttryckta självvärdering, som har visat sig ha samband med psykisk hälsa. • Du arbetar inom barnpsykiatrin och ska utreda en 7- åring där det finns vaga misstankar om att han/hon har varit utsatt för sexuella övergrepp. Beskriv några testmetoder som kan bli aktuella i en sådan utredning. (Se CAT) CAT är ett annat projektivt test bestående av en uppsättning bilder med djurfigurer på. Barnet uppmanas att berätta historier utifrån bilderna och historierna analyseras och tolkas. Testet används vid barnutredningar för att få förståelse för barnets relationer, konflikter och försvar. • Nämn minst ett projektivt test för barn och beskriv en klinisk situation/frågeställning där detta test kan vara användbart. Machovertestet är det mest använda projektiva teckningstestet. Man antar i testet att egna kroppsupplevelser uttrycks symboliskt i de människofigurer man ritar och att man i teckningarna också visar sin bild av människor i sin omgivning. Det går till så att barnet uppmuntras att rita en människa och sedan en till fast av motsatt kön. Psykologen tittar på hur barnet väljer att rita, om det missar någon viktig del etc. Sedan frågar psykologen om figurerna enligt ett frågeschema. T.ex. Vad säger folk om honom?, Har hon många kompisar? etc. I manualen finns förslag på hur man kan tolka bilderna, stora öron kan t.ex. betyda att man är auktoritetsbunden, framträdande knappar kan tyda på modersbundenhet (naveln då alltså, om ni mot förmodan inte fattade det:) De flesta psykologer använder sig dock av testet på ett mjukt sätt för att få en helhetsbild av barnet och man kan då, enligt Smedler, få en insikt i barnets självbild, kroppsuppfattning, önskningar och konflikter. Man kan också använda sig av testet för att se barnets utvecklingsnivå, man observerar då hur barnet ritar teckningen. Det används vid barnpsykologiska utredningar där det är aktuellt med utvecklings- och personlighetsbedömningar (häftet). Man använder alltid andra barntest tillsammans med Machovertestet. Ett annat projektivt barntest är CAT-Children’s Apperception Test. Här visar man bilder på djur som ser ut som människor med psykoanalytiska utvecklingsteman för barnet och så får barnet berätta om bilderna. Man tolkar sedan svaren och antar att de speglar barnets inre drifter, försvar och konflikter. Man kan använda testet vid utredningar för att generera psykoanalytiska hypoteser eller för att förstå barns relationer, konflikter och försvar. relationer till familj, föräldrar och andra vuxna vara (Se Smedler s 62-64 eller kompendium ”testbeskrivningar” för utförlig beskrivning.). Källa: Smedler s 49, 50-53, 54-57, 58-61 och 63-64 och kompendium ”testbeskrivningar”. • Beskriv Machover-testet. Machover är ett projektivt, expressivt test, där man använder sig av fria uttryck i form av teckningar. Man antar att egna kroppsupplevelser uttrycks symboliskt i de figurer man ritar, men även bilden man har av sin omgivning. Machover bör aldrig användas som det enda testet om man utreder ett barn utan är framförallt en komplettering när man söker svar på barnets självbild, kroppsuppfattning, önskningar, konflikter och kognitiv och känslomässig utveckling. En klinisk frågeställning där man kan använda sig av Machover kan vara när man gör en större utredning av ett barn. Om psykologen gjort ett testbatteri, men ännu inte kunnat bilda sig en helhetsbild av problematiken kan Machover hjälpa till att lägga sista pusselbiten eftersom det är ganska ostrukturerat och bjuder till observation av många av barnets beteenden. Smedler sida 52. • Beskriv ett personlighetstest för barn och de frågeställningar testet försöker besvara. (Se s. 59) Läs kap 8 i Smedler för bättre förståelse, där finns trevliga fallbeskrivningar! • Du arbetar inom barnpsykiatrin och ska utreda en 7åring där det finns vaga misstankar om att han/hon har varit utsatt för sexuella övergrepp. Beskriv några testmetoder som kan bli aktuella i en sådan utredning. Ett övergrepp är något väldigt traumatisk och det är därför otroligt viktigt att klargöra vad som hänt. Franz undrar om det i detta fall skulle vara möjligt att använda någon testmetod, jag har sökt i litteraturen men inte hittat något stöd för någon specifik metod men gissar att Frans syftar på de s k projektiva testen. Om dessa kan allmänt sägas att de är förankrade i psykoanalytisk teori och syftar till att undersöka individers personlighet utifrån den s k projektiva hypotesen, vilket innebär att individens beskrivningar reflekterar dess inre drifter, försvar och konflikter (Smedler s 49). Min tanke är dessa test, p g a sin karaktär, skulle kunna fungera som verktyg för att nå detta traumatiska och känsliga ämne. I testet CAT får barnet beskriva bilder vilka illustrerar etablerade psykoanalytiska utvecklingsteman (se Smedler s 54-57 eller kompendium ”testbeskrivningar” för utförlig beskrivning.), i detta fall tänker jag att bilderna kring sexualitet och förhållande till vuxna skulle kunna ge särskilt viktig information. Ett enligt mig likvärdig alternativ är Machover Draw-a-Person Test (se Smedler s 50-53). Smedler (se s 58-61 för utförlig beskrivning) beskriver Family Relations Test (FRT), vilket är ett test präglat av projektiva såväl som objektiva principer. Testet ger barnet tillfälle att uttrycka sina medvetna känslor gentemot olika familjemedlemmar. Inledningsvis konstruerar barnet sin familj utifrån testmaterialets figurer (projektivprincip) och parar ihop dessa med kort uttryckande positiva och negativa känslor, beroende och liknande (enligt objektivprincip i den mening att barnet ska ta ställning till olika påstående med ett begränsat antal svarsalternativ). Genom detta test skapas en förståelse för hur barnet upplever relationerna till sin familj. Det är även möjligt att det objektiva personlighetstestet ”jag tycker jag är” vilket ger uttryck för psykisk hälsa och självvärdering kan vara relevant. Särskilt intressant i detta test skulle frågorna kring • Nämn minst ett projektivt test för barn och beskriv en klinisk situation/frågeställning där detta test kan vara användbart. (Se s. 59) • Beskriv Leiter testet. (Icke-verbalt begåvningstest, 2-21 år, håller på att konkurrera ut WISC?) Ett icke-verbalt begåvningstest för åldrarna 2-21 år. 20 deltest, två batterier: ett visuellt-logiskt och ett uppmärksamhets-minnes. Ett bra sätt att göra en snabb IK-screening. Speciellt lämpat för barn och ungdomar med försenad kognitiv utveckling, bristande verbal förmåga, inlärningssvårigheter, ADHD, autism eller hjärnskada. Finns tre protokoll: ett för det visuellt-logiska, ett för uppmärksamhets-minnesdelen och ett för utvecklingspoäng och skattningsskalornas profiler. För uppmärksamhets-minnesdelen finns tre häften: lärarens, förälderns och testledarens uppskattning. Bygger på Horn och Cattells ”fluid” och ”crystallized” intelligens, Spearmans g-faktor och Gustavssons hierarkiska modell. Överst generell intelligens och därunder åtta faktorer: formad begåvning, formbar begåvning, spatial begåvning, minnes- och inlärningsförmåga, snabbhet i bearbetning och beslutsfattande. Under detta finns ett stort antal specifika förmågor. Poäng Norm- eller kriterierelaterade jämförelser. Ex IK-poäng eller utvecklingsålder (utvecklingspoäng). Administrering Alla instruktioner sker icke-verbalt. Tid ca 90 min. Poängberäkning ca 20 min. Kriterievaliditet och begreppsvaliditet – goda. Homogenitet – god, stabilitet – acceptabel för uppmärksamhet-minne och utmärkt för visuellt-logiska. • Du arbetar som psykolog inom barnhabiliteringen, och får en remiss på en 5-årig pojke som man vill att du ska utreda. Enligt remissen förefaller pojken kunna vara försenad/ha svårigheter både med sin verbala och sin motoriska utveckling. Vilket/vilka test kan du använda i utredningen? Motivera valet och beskriv kortfattat. Eftersom pojken har verbala svårigheter är kognitiva mått givna i utredningen. Pojkens motoriska svårigheter motiverar en neuropsykologisk utredning. Jag skulle inleda utredningen med ett samtal med pojkens familj men också med pojken själv. Vid det andra tillfället skulle pojken få göra Leiter-R för att få en uppfattning om pojkens begåvningsprofil. Testet är särskilt lämpligt bla för barn med försenad kognitiv förmåga, bristande verbal förmåga, inlärningssvårigheter, ADHD och autism (Testbeskrivningar). instrument, utan kan användas vid inledning av en kontakt som samtalsunderlag. Dessa frågeformulär kan ge indikationer på problemområden ex familj, skola, vänner mm. De består av: Depression (BUS-D), innefattar påståenden om ledsenhet och depression, negativa tankar om sig själv, livet och framtiden och fysiska symptom som associeras med depression. Ångest (BUS-Å), påståenden som berör oro för olika saker, ex skolan, hälsa och kroppsliga symptom som kan associeras med ångest. Ilska ((BUS-I), påståenden som berör ilska på olika sätt, ex orättvis behandling, negativa tankar om andra mm Normbrytande beteende (BUS-NB), påståenden som associeras med uppförandestörning ex att man är elak mot djur. Självbild (BUS-S), hur barnet upplever sig själv, sin kompetens och färdigheter • Du arbetar som skolpsykolog på en central förvaltning och kan få vara med och påverka uppläggningen av en riksomfattande undersökning av hur svenska skolbarn mår idag. Beskriv ett test som skulle kunna vara användbart för detta syfte. Pojken får sedan utföra Bender Visual Motor Gestalt Test (BVMGT) för att jag ska få ytterligare information om pojkens uppmärksamhetsförmåga och förmåga att formulera och följa en strategi (Smedler s. 108-109). BVMGT är ett visiografiskt test vilket innebär att försökspersonen får till uppgift att kopiera en uppsättning objekt. Den här typen av test har en central position inom neuropsykologisk testning pga av deras känslighet gentemot olika typer av hjärnskador (Kaplan, s. 303). Trail Making Test är ett tidsmässigt kort test men kan ändå ge värdefull information om koncentration, ”sekvensering” och kognitiv bearbetning. Barnet får till uppgift att dra linjer genom ett antal spridda punkter på ett papper (Kaplan, s. 482). För att få veta mer om pojkens kommunikativa utveckling kan Illinois Test of Psycholingvistic Abilities (ITPA) vara ett alternativ. ITPA är bra för att resultatet bidrar till att kartlägga viktiga drag och kännetecken i kommunikationen och samtidigt uppmärksamma starka och svaga sidor i språket. Testet testar tre processer: 1) den receptiva, de färdigheter som är nödvändiga för att känna igen och/eller förstå vad man sett eller hört 2) den organiserade, dvs. den inre bearbetningen av perception, begrepp och språkliga symboler. 3) Den expressiva dvs. färdigheter nödvändiga för att uttrycka sig vokalt eller motoriskt. Det kan också finnas anledning att komplettera ovan nämnda test med NEPSY. NEPSY är en barnneurologisk undersökningsmetod som består av 27 deltest som tillsammans genererar en uttömmande neuropsykologisk utvärdering av barnet. Frostigs rörelseprov kan vara ett komplement för att pröva pojkens motoriska rörelseförmåga (Testbeskrivningar). • Du arbetar på Barnhabiliteringen och skall utreda en 6årig pojke vars förskollärare tycker att han har blivit mer okoncentrerad och fumlig efter en trafikolycka ett halvt år tidigare. Vilket/vilka test vill du använda. Beskriv kortfattat. (Se s. 56) • Beskriv Becks ungdomsskalor. Becks ungdomsskalor är ett självskattningsinstrument för bedömning av emotionell och social problematik. Den kan ges till ungdomar mellan 9-18 år (Sverige). Dessa skattningsskalor är uppdelade i 5 delar och kan användas tillsammans eller var för sig. De är inte i sig ett diagnostiskt (Källa Örjans häfte samt redovisningar) Jag väljer Becks barn- och ungdomsskalor (så vitt jag kan se skulle Jag tycker jag är också lämpa sig). Den svenska versionen av Beck ungdomsskalor är ett lättadministrerat självskattningstest för barn och ungdomar 9-18 år som kan identifiera depressiva symtom, ångest, självskattning, aggressivitet samt normbrytande beteende. Testet används alltså inte diagnostiskt utan för att få förståelse för barnets situation. Testet kan administreras i grupp vilket är praktiskt vid en omfattande undersökning, det tar 25-60 minuter att utföra. Vid testning tar barnet ställning till färdiga påståenden vilket är lämpligt då barn och ungdomar kan ha svårt att lämna muntlig information. Testet består av ett formulär med fem skalor (20 items poäng per skala) vilka bedömer emotionell och social problematik. Skalorna är: – Depression (BUS-D) Skalan innehåller spåstånden som speglar olika symtom på ledsamhet och depression, exempelvis barn och ungdomars negativa tankar om sig själv, sina liv, sin framtid samt kroppsliga symtom som associeras med depression. – Ångest (BUS-Å) Denna skala innefattar påståenden som avser spegla barns och ungdomars oro och ängslan, exempelvis avseende skola, hälsa, att bli skadad samt kroppsliga symtom associerade med ångest – Ilska (BUS-I) Här söker man finna upplevelser av ilska, att ha blivit orättvist behandlad, kroppsliga tecken på ilska samt negativa tankar om andra. – Normbrytande beteende (BUS-NB) Skalan innefattar påståenden som innefattar attityder och beteenden som associeras med uppförandestörning och trotssyndrom – Självbild (BUS-S) Denna skala speglar barns och ungdomars upplevelse av sig själva exempelvis vad gäller kompetens, färdigheter och positiv självvärdering. Becks barn och ungdomsskalor är välundersökt och har väldokumenterade psykometriska egenskaper. Den kriterierelaterade validiteten är utmärkt och reliabiliteten är också mycket tillfredsställande. Den svenska normgruppen består av 2358 barn och ungdomar. • Du arbetar som skolpsykolog och skolsköterskan vill att du skall ta kontakt med en 11- årig tystlåten pojke som vid flera tillfällen har varit hos henne och klagat över ont i magen. Finns det någon/några testmetoder som du kan ha nytta av i en sådan kontakt? Beskriv och motivera ditt val. (Se s. 58) Välj lämpligt test • Du arbetar som skolpsykolog och blir kontaktad av en förälder som är orolig för sin son – 8 år – som är ledsen och inte vill gå till skolan. Klassläraren har inte lagt märke till annat än att pojken är tystlåten och tycks ha vissa svårigheter (dock ej så stora) med läs- och skrivinlärning. Hur kan du angripa problemet? Vilket/vilka test kan eventuellt bli aktuella att använda? Beskriv kortfattat. Problemet kan angripas genom att pojken får göra ett begåvningstest, förslagsvis WISC, som mäter hans begåvningsmässiga förutsättningar att prestera bra i skolan, samt ett test som mäter barns psykiska tillstånd, förslagsvis "Becks ungdomsskalor" eller "Jag tycker att jag är". WISC-testet mäter generell intelligens och är i detta fall bättre att använda än t.ex. Leiter-R, eftersom det är just verbal intelligens som verkar behöva utredas (och Leiter-R mäter ju inte detta). Resultatet från WISCtestningen ger information om både huruvida och isåfall hur mycket pojkens generella verbala intelligens är nedsatt. Om pojken får ett anmärkningsvärt lågt testresultat på WISC, t.ex. på den verbala delskalan, kan man gå vidare med detta genom att t.ex. använda NEPSY, och då framförallt de deltest som är kopplade till språkliga funktioner. "Becks ungdomsskalor" och "Jag tycker att jag är" är två självskattningstest som kan användas för att utreda pojkens psykiska tillstånd. "Becks ungdomsskalor" används egentligen från 9 år i Sverige, men skulle eventuellt kunna användas även i detta fall. De skalor som främst bör användas är depressionsskalan (BUS-D), ångestskalan (BUS-Å) samt självbildsskalan (BUS-S). Resultatet på självskattningen kan ge en tydligare bild av pojkens emotionella och sociala problematik och kan bidra till att initialt identifiera depressiva symtom, ångest, låg självskattning etc. Ett alternativ till BUS är att använda "Jag tycker att jag är". "Jag tycker att jag är" mäter barns självvärdering och detta anses vara ett uttryck för den psykiska hälsan. Testet passar bättre åldersmässigt än BUS eftersom det används från 7 års ålder. Det finns ett formulär med påståenden att ta ställning till för lågstadieelever och ett annat för mellanstadieelever. De områden som undersöks med dessa påståenden är hur barnet ser på sina fysiska och psykiska egenskaper samt hur barnets relation till familj och andra är. "Jag tycker jag är" kan alltså skulle alltså kunna vara till hjälp i utredningen av pojken. Alla dessa test måste givetvis kompletteras med intervjuer och samtal med pojken och hans föräldrar. (från Smedler exempelfallet sid 100ff + sid 40-41 + örjans häfte) • Beskriv en klinisk frågeställning där det kan vara befogat att använda sig av barntest. Motivera vilket/vilka test du skulle vilja använda och beskriv kort hur du skulle gå till väga. Om man trots insatser i skola, hem och familj inte kommer tillrätta med ett barns problematik kan det vara aktuellt med individualdiagnostik. Denna ger en ökad förståelse för barnets intrapsykiska värld och vägleder i frågor om åtgärder. Viktigt är dock att man inte ska diagnostisera utan att veta att man kan täcka behandlingsbehovet. Smedler, sida 13. Emil, är en liten pojke med problem i skolan. Trots omfattande åtgärder med bl.a. stödpersonal i skolan och läxhjälp kvarstår problemen, han halkar efter i snart sagt alla ämnen. Psykologen som familjen har kontakt med på BUP väljer att jobba med en problemorienterad utredning där man utgår från föräldrarnas beskrivning av problemen och formar hypoteser och väljer testmetoder därefter. Psykologen i detta fall ställer sig frågor om Emils mognad och beslutar sig för att göra Griffiths för att kunna se om det finns förseningar eller funktionsstörningar hos Emil. Efter detta måste Emil även genomlida WISC för att få en bättre bild av hans allmänna begåvningsnivå. CAT görs också, ganska oberoende av dess psykodynamiska grund, mest för att få en bild av Emils fantasiförmåga och hur han upplver sig själv och familjen. Resultatet är sekretessbelagt, men Emil fick börja i specialklass där han trivs mycket bättre och får glass på fredagar. Ullrik 9 år är väldigt lugn, långsam i tal och rörelser, samt ligger efter en hel del i skolan jämfört med sina kamrater. Hans mor hade en svår förlossning med Ullrik och han föddes 2,5 månader för tidigt. Här är det ganska uppenbart att Ullrik kan lida av allmän nedsättning av kognitiva funktioner i och med den svåra förlossningen. Vi kan här testa Ullriks begåvningsnivå och utvecklingsnivå med hjälp av Wisc III och Leiter-R alt NEPSY. Sen kanske det kan vara befogat att testa för depressiva symtom som också de kan inverka på Ullriks skolresultat samt aktivitetsnivå. Beck ungdomsskalor skulle lämpa sig för att titta närmare på detta. Först och främst skulle jag skaffa mig all nödvändig bakgrundsfakta om Ullrik vad gäller förlossning, uppväxt, trauman etc. När det kommer till testningen skulle jag börja med Leiter-R eller NEPSY för att ta reda på vilken utvecklingsålder Ullrik ligger på. Därefter skulle jag testa hans begåvningsnivå med exempelvis Wisc III. Testningen skulle kunna hjälpa skolan att tillgodose eventuella behov av stöd som Ullrik kan ha. Det är viktigt att Ullrik får ut så mycket som möjligt av sin skolgång. (I Smedlers Att testa barn står det att man sällan gör den här typen av test utan att man istället försöker lösa problematik genom familj och miljö i första hand? Men i exemplet ovan tar vi för givet att skolproblematiken är så pass allvarlig att en utredning är behövlig =))