MTTTA1 Tilastomenetelmien perusteet Luento 28.4.2015 4.2

Transcription

MTTTA1 Tilastomenetelmien perusteet Luento 28.4.2015 4.2
28.4.2015/1
MTTTA1 Tilastomenetelmien perusteet
Luento 28.4.2015
4.2 Useampi selittävä muuttuja (kertausta)
Selittäjien lukumäärä k (k-RA)
𝑌 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ + 𝛽𝑘 𝑥𝑘 + 𝜀
Malliin liittyvät oletukset
 i ~ N(0, 2) ja
 i:t ovat riippumattomia
28.4.2015/2
Regressioanalyysin taulukko
2
R = SSR/SST
SSR
SSE
SST
k
n-k-1
n-1
MSR
MSE
𝛽̂0
𝑠(𝛽̂0 )
𝑡=
𝛽̂1
𝑠(𝛽̂1 )
𝑡=
…
𝛽̂𝑘
𝑠(𝛽̂𝑘 )
𝑡=
F=MSR/MSE
~F(k, n-k-1), kun H0 tosi
H0: 𝛽1 = …= 𝛽k =0
̂0
𝛽
̂0 ) ~𝑡𝑛−𝑘−1 , 𝑘𝑢𝑛
𝑠(𝛽
̂1
𝛽
̂1 ) ~𝑡𝑛−𝑘−1 , 𝑘𝑢𝑛
𝑠(𝛽
̂𝑘
𝛽
̂𝑘 ) ~𝑡𝑛−𝑘−1 , 𝑘𝑢𝑛
𝑠(𝛽
𝐻0 : 𝛽0 = 0 𝑡𝑜𝑠𝑖
𝐻0 : 𝛽1 = 0 𝑡𝑜𝑠𝑖
𝐻0 : 𝛽𝑘 = 0 𝑡𝑜𝑠𝑖
28.4.2015/3
Esim. 1
Ilmansaasteille altistumisen vaikutus
kuolleisuuteen suurkaupungeissa
(Devore&Peck)
http://www.sis.uta.fi/tilasto/mttta1/kevat2015
/esim_5_RA.pdf
Ks. myös
http://repository.cmu.edu/cgi/viewcontent.cgi
?article=2152&context=tepper
28.4.2015/4
4.3
Selittävien muuttujien valinnasta ja mallin
oletuksista (jatkoa)
Esim. 2
Polynomiregressio
y = viinin hinta
x = valmistusvuosi
Aineisto VIINI sivulla
http://www.uta.fi/sis/mtt/mttta1/kevat_2015/aineis
toja.html
Malli Y = 0 + 1 x + 2 x2 + 
28.4.2015/5
Regressioanalyysin tuloksia
http://www.sis.uta.fi/tilasto/mttta1/kevat2015
/polynomiregressio.pdf
Esim. 3
Autoregressio, Tampereen asukasluku 1954 2005
Malli Yt = 0 + 1 yt-1+ t
Autokorreloituneet residuaalit
Regressioanalyysin tuloksia
http://www.sis.uta.fi/tilasto/mttta1/kevat2015
/autoreg_tre.pdf
28.4.2015/6
Esim. 4
Autoregressio
Tutkitaan vaikuttaako TV-mainonta
tavaratalon myyntiin. Tarkastellaan
viikoittaista myyntiä 20 viikon ajan, aineisto
myynti_mainonta.sav sivulla
http://www.uta.fi/sis/mtt/mttta1/kevat_2015/
aineistoja.html
y = myynti
x = mainonta
Malli I
Malli II
Yt = 0 + 1 xt+ t
Yt = 0 + 1 xt+ 2 yt-1+ t
28.4.2015/7
Regressioanalyysin tuloksia
http://www.sis.uta.fi/tilasto/mttta1/kevat2015
/autoregressio.pdf
Esim. 4.3.3
Dummy-muuttuja selittäjänä mallissa
y = Salary
x = Years
z = Sex (0 = nainen, 1 = mies)
Malli Y = 0 + 1 x + 2 z + 
E(Y) = 0 + 1 x, kun Sex=0 (naiset)
E(Y) = 0 + 1 x + 2, kun Sex = 1 (miehet)
28.4.2015/8
4.4 Varianssianalyysimalli
Luentorunko s. 50
http://www.sis.uta.fi/tilasto/mttta1/kevat2015/luentorun
ko.pdf#page=51
28.4.2015/9
Luku 5
Epäparametrisista menetelmistä (ei tenttiin)
Ei oletuksia populaatiosta, esim.
normaalijakaumaoletusta.
 Mann-Witneyn testi
Kahden riippumattoman otoksen t-testin
epäparametrinen vastine (normaalijakaumaoletus ei
voimassa)
 Kruskal-Wallisin testi
Epäparametrinen vastine yksisuuntaiselle
varianssianalyysille (normaalijakaumaoletusta ei
28.4.2015/10
tehdä, selitettävä muuttuja voi olla
järjestysasteikollinen)
 Welchin tai Brown-Forsythen testi
Yksisuuntainen varianssianalyysi, kun oletus
varianssien yhtäsuuruudesta ei voimassa
Ks. luentorunko s. 51,
http://www.sis.uta.fi/tilasto/mttta1/kevat2015/luentorun
ko.pdf#page=52
28.4.2015/11
Tentit
 ti 5.5.2015 klo 8.30-11.00 ls. A1, voi osallistua, jos on
tehnyt vähintään 30 % laskuharjoituksista
 to 28.5.2015
 to 11.6.2015
 syksyllä yksi tentti
28.4.2015/12
Mitä jatkoksi?
Matematiikan ja tilastotieteen tutkinto-ohjelman
opiskelijat
Matematiikan ja tilastotieteen perusopinnot
https://www10.uta.fi/opas/opintoKokonaisuus.htm?
rid=6909&lang=fi&uiLang=fi&lvv=2014 (Opintoopas 2014 - 2015)
 MTTTP4 Todennäköisyyslaskenta (S2015)
28.4.2015/13
Tilastotieteen aineopinnot (pakolliset)
https://www10.uta.fi/opas/opintoKokonaisuus.htm?
rid=9190&lang=fi&uiLang=fi&lvv=2015 (Opintoopas 2015 - 2016)
 MTTTA2
 MTTTA4
 MTTTA14
Matemaattisen tilastotieteen
perusteet, (S2015)
Tilastollinen päättely 1, (K2015)
Tilastotieteen matriisilaskenta ja
laskennalliset menetelmät, (S2016)
28.4.2015/14
Tilastotieteen perusopintokokonaisuus valinnaisina
opintoina
https://www10.uta.fi/opas/opintoKokonaisuus.htm?rid=6
964&lang=fi&uiLang=fi&lvv=2014 (Opinto-opas 2014 2015)
 MTTTA13
Empiirinen projekti
28.4.2015/15
Tilastotieteen aineopintokokonaisuus valinnaisina
opintoina
https://www10.uta.fi/opas/opintoKokonaisuus.htm?rid=9
173&lang=fi&uiLang=fi&lvv=2015 (Opinto-opas 2015 2016)
Pakolliset
 MTTTP4
 MTTTA2
 MTTTA4
 MTTTA14
Todennäköisyyslaskenta, (S2015)
Matemaattisen tilastotieteen
perusteet (S2015)
Tilastollinen päättely 1, (K2016)
Tilastotieteen matriisilaskenta ja
laskennalliset menetelmät, (S2015)
28.4.2015/16
Muut (valitaan 3)
 MTTTA5
 MTTTA6
 MTTTA7
 MTTTA9
 MTTTA10
 MTTTA11
 MTTA2
Monimuuttujamenetelmät
Regressioanalyysi
Yleistetyt lineaariset mallit 1
Tilastollinen ennustaminen
Sekamallit
Tilastolliset ohjelmistot
*esitietona MTTTA1
Muu erikseen sovittava opintojakso