De mindste kvadraters metode
Transcription
De mindste kvadraters metode
De mindste kvadraters metode Jens Carstensen, Frederiksberg I LMFK–Bladet nr. 1 og 2 er lineær regression behandlet. Forfatterne gjorde sig overvejelser om, hvordan ligningen for den bedste rette linje, der tilnærmer n datapunkter i koordinatsystemet, kan bestemmes ved hjælp af de mindste kvadraters metode. Vi kan skrive denne på formen For læserne virker det måske noget tungt, men matematikken bag fastlæggelsen af den bedste rette linje kræver i virkeligheden intet andet end kendskab til formlen for andengradspolynomiets toppunkt. Teorien for ekstremumspunkter for funktioner af to variable er ganske overflødig. Vi betegner de lodrette afstande fra de tre punkter til linjen med d1, d2 og d3, dvs. y = a + b( x − x ) ved at sætte b = p og q = a − b x , dvs. a = q + b x . di = yi – a – b(xi – x ) Vi ønsker at finde konstanterne a og b, så kvadratsummen Vi viser her hvordan sagen kan gribes an. Det er ikke nogen væsentlig indskrænkning at gennemføre regningerne med 3 punkter i stedet for med n punkter. Det letter skrivearbejdet og øger gennemskueligheden. Antag derfor, at vi har forelagt tre punkter (x1, y1) , (x2, y2) , (x3, y3) bliver så lille som mulig. i koordinatsystemet. Vi ønsker ved hjælp af de mindste kvadraters metode at bestemme den bedste rette linje, der tilnærmer de tre punkter. Bestemmelse af a Ved udregning får vi s = d12 + d 2 2 + d 33 ( x = 13 ( x1 + x2 + x3 ) , y = 13 ( y1 + y2 + y3 ) 2 ( + y 3 − a − b ( x3 s = ( y1 − a ) 2 + ( y2 − a ) 2 + ( y3 − a ) 2 ( + b2 ( x1 − x ) 2 + ( x2 − x ) 2 + ( x3 − x ) 2 Vi indfører koordinaternes middeltal ved skrivemåden ) ( ) − x)) = y1 − a − b( x1 − x ) + y2 − a − b( x2 − x ) ( 2 2 ) − 2b ⋅ ( x1 − x )( y1 − a ) + ( x2 − x )( y2 − a ) + ( x3 − x )( y3 − a ) I sidste led udregner vi koefficienten til a: ) Først viser vi ( x − x1 ) + ( x − x2 ) + ( x − x3 ) = 3x − ( x1 + x2 + x3 ) = 0 Sætning. Kvadratsummen Q(a) = (y1 – a)2 + (y2 – a)2 + (y3 – a)2 er mindst, hvis a vælges som middeltallet af y1, y2 og y3, dvs. hvis a = y . Bevis. Ved udregning får vi, at Vi betragter s som et andengradspolynomium i a. Den variable a, som vi ønsker at finde, optræder kun i de tre første led. Da s skal gøres så lille som muligt, skal summen af de tre første led altså gøres så lille som mulig. Efter ovenstående sætning sker dette ved at vælge a = y . Bestemmelse af b Vi har nu, at Q(a) = y12 + y22 + y32 – 2a·(y1 + y2 + y3) + 3a2 = 3a2 – 2a·⋅3y + y12 + y22 + y32 Dette er et andengradspolynomium i a, og efter formlen for andengradspolynomiets toppunkt antages mindsteværdien for Matematik Matematik a= 6y = y. 2⋅3 s = ( y1 − y ) 2 + ( y2 − y ) 2 + ( y3 − y ) 2 ( + b2 ( x1 − x ) 2 + ( x2 − x ) 2 + ( x3 − x ) 2 ( − 2b ⋅ ( x1 − x )( y1 − y ) + ( x2 − x )( y2 − y ) + ( x3 − x )( y3 − y ) For overskuelighedens skyld udregner vi delene i denne formel særskilt: ( y1 − y ) 2 + ( y2 − y ) 2 + ( y3 − y ) 2 Den bedste rette linje Den bedste rette linje, der tilnærmer de tre punkter, har ligningen = y12 + y2 2 + y32 − 2 y ⋅ ( y1 + y2 + y3 ) + 3 y 2 y = px + q 20 LMFK-bladet 3/2015 ) 2 = y12 + y2 2 + y32 − 2 y ⋅ 3 y + 3 y = y12 + y2 2 + y32 − 3 y 2 ) og tilsvarende får vi ( x1 − x ) 2 + ( x2 − x ) 2 + ( x3 − x ) 2 = x12 + x2 2 + x32 − 3x 2 13 1 x = 13 ( 2 + 5 + 7 ) = 14 3 , y = a = 3 ( 3 + 4 + 6) = 3 hvoraf Endelig er ( x1 − x )( y1 − y ) + ( x2 − x )( y2 − y ) + ( x3 − x )( y3 − y ) b= = x1 y1 + x2 y2 + x3 y3 − y( x1 + x2 + x3 ) − x ( y1 + y2 + y3 ) + 3x ⋅ y 13 6 + 20 + 42 − 3 ⋅ 14 3 ⋅ 3 4 + 25 + 49 − 3 ⋅ ( 14 3 ) 2 = 68 − 14 ⋅ 13 3 = 11 19 78 − 196 3 = x1 y1 + x2 y2 + x3 y3 − y ⋅ 3x − x ⋅ 3 y + 3x ⋅ y = x1 y1 + x2 y2 + x3 y3 − 3x ⋅ y Dermed har vi fundet følgende udtryk for kvadratsummen s: 8 2 s = ( x12 + x2 2 + x32 − 3x )b2 − 2( x1 y1 + x2 y2 + x3 y3 − 3x y )b + y12 + y2 2 + y32 − 3yy 2 6 b= 2( x1 y1 + x2 y2 + x3 y3 − 3 x y ) 2 2( x1 2 2 2 + x 2 + x3 − 3 x ) = 4 x1 y1 + x2 y2 + x3 y3 − 3 x y 2 2 2 x1 + x2 + x3 − 3 x (7, 6) y = 0,579 x + 1,631 Dette er et andengradspolynomium i b, og efter formlen for andengradspolynomiets toppunkt antages den mindste værdi for 2 (5, 4) (2, 3) 2 Dermed er både a og b fundet. Den linje, der tilnærmer de tre punkter bedst (nemlig ved, at summen af kvadraterne på de lodrette afstande fra linjen til punkterne er mindst) har altså ligningen 2 y = a + b( x − x ) 4 6 med de fundne værdier for a og b. Læg her mærke til, at linjen går gennem punktet med koordinaterne ( x , y ). Dette koordinatsæt passer nemlig i linjens ligning. Altså får den bedste rette linje (regressionslinjen) ligningen Hvis vi i stedet for 3 punkter har forelagt n punkter med koordinaterne Hvis man indtaster de tre punkters koordinater i et matematikprogram, får man netop dette (i decimaltal). y = 13 + 11 x − 14 ⇔ y = 11 x + 31 3 19 3 19 19 (x1, y1) , (x2, y2) , . . . , (xn, yn) Henvisninger a=y= b= 1 n ( y1 + y2 + ⋅⋅⋅ + yn ) x1 y1 + x2 y2 + ⋅ ⋅ ⋅ + xn yn − n x y 2 2 2 x1 + x2 + ⋅ ⋅ ⋅ + xn − n x 2 Eksempel. Hvis de tre punkter har koordinaterne (x1, y1) = (2, 3) , (x2, y2) = (5, 4) , (x3, y3) = (7, 6) Jens Carstensen: Matematisk statistik (Systime, 1983) Douglas Downing & Jeff Clark: Statistics the Easy Way (Barron’s Educational Series, 1989) Carl Winsløw: Fodgængerversion af lineær regression (LMFK– Bladet 1, 2015) Svend Erik Morsing: Mere om lineær regression (LMFK– Bladet 2, 2015) Ann E. Watkins, Richard L. Scheaffer & George W. Cobb: Statistics in Action (Key Curriculum Press, 2004) LMFK-bladet 3/2015 21 Matematik Matematik får vi åbenbart følgende formler for a og b: