003bis Appendice alla Dispensa n.3:Ulteriori metodi per la stima di
Transcription
003bis Appendice alla Dispensa n.3:Ulteriori metodi per la stima di
1 Materiali didattici: ANALISI E PREVISIONI NEI MERCATI FINANZIARI a.a. 2014-2015 DISPENSA N.3bis (APPENDICE alla dispensa n.3) Ulteriori metodi per la stima di una singola equazione (Prof. Giovanni Verga) 1. Variabili limitate: p.2 2. Code molto alte delle distribuzioni dei residui: LAD e regressione quantile: p.9 3. Una o più variabile indipendente influenzata dalla dipendete (problema della mancanza di esogeneità debole): variabili strumentali, il GMM: p. 12. 1 Ulteriori metodi per la stima di una singola equazione Il metodo più tradizionale di stima (i minimi quadrati ordinari) in alcuni casi risultato inappropriati, nel senso che danno risultati distorti o inefficienti. Per quanto ci riguarda, i casi principali in cui questo si verifica sono i seguenti: - Variabili limitate - Code molto alte delle distribuzioni - Una o più variabile indipendente che può essere influenzata dalla dipendete (problema della mancanza di esogeneità debole). 1. Variabili limitate I principali casi di variabili limitate che ci possono interessare sono due: - La dipendente può assumere solo alcuni valori (es. 0 e 1) - La dipendente non può oltrepassare certi valori (es. non può assumere valori negativi) 1a. Dipendente Dicotomica Un esempio è il seguente: Una volta aperto con GRETL il file banche_2007_08.wf1, che contiene alcuni dati delle banche dell’Eurozona del 2007 e 2008 (alla domanda che appare all’apertura del file rispondere di no), tra le variabili vi è la variabile PERDITE2008, i cui valori sono 0 se nel 2008 la banca non ha avuto perdite, 1 se nel ha avuto perdite. Può essere interessante stimare la probabilità che nel 2008 una banca abbia avuto una perdita conoscendo il ROE e il ROA dell’anno precedente (ROE2007 e ROA2007). Si tratta quindi di stimare PERDITE2008 in funzione di ROE2007 e ROA2007 sapendo che la dipendente può assumere solo i valori 0 e 1 e che la stima della probabilità non può essere né negativa né superare l’unità. Vi sono due tecniche di stima appropriate per questo problema: Probit e Logit. Il primo suppone che la relazione tra la dipendente e i regressori segua la distribuzione cumulata di una normale, il secondo che segua una logistica. Con GRETL si procede in questo modo: - Cliccare su Modello - Variabile dipendente limitata - Probit - Binario… Poi mettere PERDITE2008 come dipendente e ROE2007 e ROA2007 come indipendenti, Cliccare su Imposta come predefinito, Errori standard robusti, Mostra i p-value. Togliere invece Mostra i dettagli per le iterazioni perché non servono Cliccare su OK per vedere la stima 2 Toglierlo !!!!! Ecco il risultato: 3 Dalla stima risulta che la probabilità che una banca abbia avuto delle perdite nel 2008 era tanto maggiore quanto peggiori erano stati gli indici di redditività ROE e ROA del 2007. Dei due indici, però, solo il ROE è significativo. Nel complesso la regressione prevede correttamente la posizione della banca del 2008 (“in perdita” o “non in perdita”) nell’89.9% dei casi Nel caso del metodo Logit si precede allo stesso modo. Il risultato sarebbe stato il seguente: 4 I risultati sono coerenti con quelli ottenuti col modello Probit, ma in questo caso risulta significativo anche il ROA del 2007. 1.b La dipendente non può oltrepassare certi valori (Tobit) Il metodo di stima usato per questo caso è detto anche Tobit. Un caso interessante è quello già visto per la stima del tasso ufficiale mediante le variabili economiche. Il tasso ufficiale in un certo periodo non poteva scendere sotto l’1%. Abbiamo già visto il metodo degli OLS non lineari, ma in alternativa si può usare anche il Tobit imponendo 1 come “limite sinistro” (cioè inferiore). Nel nostro caso non c’è invece alcun “limite destro” (superiore) che non va quindi indicato. Il procedimento con GRETL è il seguente: 5 Aprire il file Repo_e_variabili_economiche_2015.wf1: Cliccare su Modello - Variabile dipendente limitata - Tobit Mettere 1 come limite sinistro, poi cliccare su imposta come predefinito e errori standard robusti. Mettere poi REPOB come dipendente e mettere le variabili indipendenti, più la ritardata di REPOB esattamente come fatto in precedenza per questa equazione Dare l’OK per avere il risultato 6 I segni sono tutti quelli attesi e i coefficienti sono tutti significativi. Il grafico dei residui e dei valori effettivi e stimati si ottengono cliccando su Grafici in alto nella schermata del risultato. Va però osservato che il grafico dei residui mostra i residui stimati tenendo conto della condizione imposta, mentre il grafico dei valori stimati mostra quale sarebbe il grafico della stima non tenendo conto della restrizione imposta. Nel grafico, infatti, il valore di REPOB scende infatti sotto 1. 7 Lo stesso vale per quanto riguarda i valori effettivi, stime, residui, che si ottengono cliccando su Analisi in alto nella schermata del risultato. Intervallo di stima del modello: 1999:02 - 2009:12 Errore standard dei residui = 1,79769e+308 REPOB Stime Residuo 1999:02 1999:03 …… 2009:04 2009:05 2009:06 2009:07 2009:08 2009:09 2009:10 2009:11 2009:12 3,00 3,00 ….. 1,25 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 2,86 2,89 …. 1,13 0,95 0,71 0,67 0,67 0,70 0,70 0,70 0,71 8 0,13 0,10 …. 0,12 -0,08 -0,01 -0,00 -0,00 -0,00 -0,00 -0,00 -0,00 2. Code molto alte delle distribuzioni dei residui: LAD e regressione quantile Un caso in cui i minimi quadrati non danno buoni risultati è quello di distribuzioni dei residui con code particolarmente elevate. Questo capita spesso utilizzando dati dei bilanci delle banche e delle imprese. Riapriamo con GRETL il file banche_2007_08.wf1, che contiene alcuni dati delle banche dell’Eurozona del 2007 e 2008 (alla domanda che appare all’apertura del file rispondere di no), Questa volta vogliamo stimare il ROA del 2008 (ROA2008) in funzione del leverage del 2007 (LEV2007) e del rapporto tra prestiti e totale attivo del 2007 (PRESTAT2007). Come si rileva chiaramente dal grafico dei residui, la distribuzione è ben lontana dalla normale e fortissimamente lepotocurtica; In queste condizioni l’impiego degli OLS è improponibile. 9 Stime migliori si ottengono con i metodi delle stime robuste. In particolare con LAD e Regressione Quantile. A differenza dei minimi quadrati, che stimano i parametri minimizzando la somma dei quadrati degli scarti, i LAD stimano i parametri minimizzadno la somma dei valori assoluti degli scarti, che è una misura molto meno sensibile ai valori estremi. La regressione quantile è analoga alla stima LAD se come quantile si prende la mediana (quantile = 0,50). Ha però il vantaggio che il quantile può essere scelto a piacere. Per esempio, nel caso in esame, se l’attenzione di chi fa l’analisi è soprattutto dedicata alle banche con cattivi risultati economici si può prendere un quantile più basso della mediana, per esempio il primo 20% (quantile=0,20). Poiché i coefficienti della regressione risultano molto piccoli dato che i regressori sono molto grandi, abbiamo diviso i due regressori per 1000000 e abbiamo così definito LEV2007A=LEV2007/1000000 e PRESTAT2007A=PRESTAT2007/1000000. Il calcolo delle nuove variabili (effettuato come già visto in precedenza mediante le istruzioni Aggiungi e Definisci nuova variabile), pur non necessario, è utile per avere dei coefficienti con contrassegnati da numeri con l’esponenziale che sono di scarsa comprensione. Per la stima LAD si procede cliccando su Modello, Stima robusta, LAD. Quando si apre la finestra introduciamo la variabile dipendente e le indipendenti, poi clicchiamo su imposta come predefinito 10 E infine diamo l’OK per avere la stima (attenzione: l’eleaborazione richiede qualche secondo) Risulta che sia il leverage che il rapporto prestiti/attivo del 2007 hanno esercitato un effetto negativo sul ROA del 2008. Purtroppo i p-value non sono probabilmente corretti perché i coefficienti non risultano significativi, mentre l’analisi condotta con un altro programma (Eviews) dà gli stessi coefficienti ma con pvalue fortemente significativi Il calcolo con la regressione quantile va condotta in modo del tutto analogo. 11 Mantenendo a 0,5 il quantile, dopo aver premuto su OK si ottiene il seguente risultato (anche qui attendere qualche secondo per l’elaborazione): Avendo scelto la mediana (quantile desiderato=0,5) i risultati sono gli stessi ottenuti col metodo precedente. Purtroppo anche qui i p-value non sono probabilmente corretti perché i coefficienti non risultano significativi, mentre l’analisi condotta con un altro programma (Eviews) dà gli stessi coefficienti ma con pvalue fortemente significativi 3. Una o più variabile indipendente influenzata dalla dipendete (problema della mancanza di esogeneità debole): variabili strumentali, il GMM In una regressione del tipo (1) Yt = f(Xt, Zt, Yt-1, Xt-1, Zt-1, ….) Può succedere che Xt o Zt, o entrambi, non siano esogeni, cioè che esista una relazione del tipo (2) Xt = g(Yt, Zt, Yt-1, Xt-1, Zt-1, ….) che non permette di stabilire se la relazione (1) sia veramente tale o non piuttosto una stima della (2), o ancora un miscuglio di entrambe. Un esempio classico è la funzione keynesiana del consumo, dove (1) Ct = a + b Yt, ma, nel contempo, (2) Yt = Ct + It + Gt : il consumo dipende dal reddito, ma a sua volta il reddito è legato al consumo. 12 Si dimostra che quando questo avviene la variabile indipendente in t diventa correlata con l’errore della regressione e questo fatto può rendere completamente distorte le stime ottenute con i minimi quadrati ordinari. I metodi per affrontare questo problema sono detti delle “variabili strumentali” e uno dei più usato è il “metodo dei momenti generalizzati” GMM. Per poter utilizzare questi metodi occorre però avere a disposizione degli “strumenti”, cioè delle variabili che sono legate alla variabile indipendente influenzata dalla dipendente, ma non sono legate ai residui della regressione (in poche parole; occorre che gli strumenti non siano influenzati dalla dipendente). Spesso come strumenti si prendono i valori passati delle variabili, mentre per la scelta degli strumenti in t si fa spesso affidamento sulle nostre conoscenze delle relazioni economiche che intercorrono tra le variabili. Una volta decisi gli strumenti, nella regressione GMM andranno indicati tali strumenti, cui vanno aggiunti tutti gli altri regressori. Il numero degli strumenti non deve comunque essere minore di quello dei regressori e lo stesso strumento non può essere introdotto due volte. Sia riconsideri la precedente equazione (1) Yt = f(Xt, Zt, Yt-1, Xt-1, Zt-1, ….) dove per la (2) il regressore Xt è a sua volta influenzato da Yt. Si supponga che gli strumenti di Xt siano Wt, Xt-1 e Yt-1. Il complesso degli strumenti da introdurre nella regressione saranno quindi Wt, Xt-1 e Yt-1, cui si aggiungono i regressori Zt e Zt-1. I regressori Yt-1 e Xt-1 sono già presenti tra gli strumenti di Xt e quindi non vanno più aggiunti. E’ opportuno osservare che i metodi delle variabili strumentali danno, a differenza dei minimi quadrati, risultati non distorti (un-biased) che però sono meno efficienti. In particolare la loro efficienza è sensibile a quanto a loro volta gli strumenti siano legati al rispettivo regressore. Nell’esempio è quindi opportuno controllare se la regressione Xt = h(Wt, Xt-1, Yt-1) (calcolata con gli OLS) sia “soddisfacente” (se qualche coefficiente è significativo e l’R2 sembra accettabile). Se questa regressione è considerata soddisfacente, allora si può passare a una seconda prova che consiste (1) nel calcolare i residui Ut dell’equazione Xt = h(Wt, Xt-1, Yt-1) (cioè Ut = Xt – h(Wt, Xt-1, Yt-1), (2) stimare con i minimi quadrati ordinari la relazione (1) con aggiunto Ut tra i regressori, cioè: (1bis) Yt = f(Xt, Zt, Yt-1, Xt-1, Zt-1, …, Ut) Se Ut è significativo i coefficienti dei minimi quadrati sono distorti (biased) e si deve passare alla stima con le variabili strumentali GMM. Se Ut non è significativo significa invece che la variabile Xt non è significativamente influenzata dalla Yt dell’equazione (2) (è esogena) e i minimi quadrati non sono distorti (unbiased) e quindi non è necessario utilizzare i GMM. Va però osservato che alcuni utilizzano direttamente le variabili strumentali senza prima fare questi due test (bontà degli strumenti e distorsione dei minimi quadrati). Alcuni programmi (per es, Eviews) eseguono però automaticamente questi due test quando si effettua una stima GMM, così che l’utente possa valutarne l’affidabilità e decidere se usare la stima GMM o quella dei minimi quadrati. Utilizzano un programma che calcola i GMM senza verificarne la loro affidabilità è però molto pericoloso. Facciamo un paio di esempi. 13 3.1 Legame tra inflazione e crescita della moneta Aprire il file dati_annuali_wf1. Il file contiene i dati annui italiani dal 1861 al 1994 di: - LP: logaritmo dei prezzi) - LM2A: logaritmo della moneta M2 divisa per il numero degli abitanti) - FINMON: finanziamento monetario del tesoro - FINMONM2: finanziamento monetario del tesoro in percentuale della moneta esistente nell’anno precedente. L’ipotesi è che una crescita eccessiva della moneta provochi inflazione. Nel contempo, però, l’aumento dei prezzi fa aumentare il fabbisogno di moneta e quindi la relazione (1) ΔLP = a + b ΔLM2A è probabilmente spuria, nel senso che potreberre essere mischiata con (2) ΔLM2A = a’ + b’ ΔLP Per eseguire la stima della (1) generiamo innanzitutto le variazioni di LP e LM2A. Come strumenti per ΔLM2A possiamo prendere i suoi valori dell’anno precedente, i valori della variazione ΔLP dell’anno precedente, i due indici della liquidità creata dal tesoro in t (il cui andamento era esogenamente deciso da tesoro e Banca d’Italia e non dalle famiglie e dalle imprese cui invece compete la domanda di moneta). Controlliamo la bontà dei nostri strumenti. Usiamo i minimi quadrati dove, come dipendente, c’è d_LM2A: 14 15 La regressione è buona, sia in termini di significatività dei coefficienti, sia in termini dell’R2. Però alcuni coefficienti non sono significativi. Possiamo cominciare a eliminare FINMON che è la variabile meno significativa. Eliminiamo poi anche l’inflazione in t.1 che non è significativa. Si arriva così a: Da cui risulta che gli strumenti utili per d:LM2A sono solo il suo valore ritardato d:LM2A_1 e FINMONM2. A questo punto salviamo il residuo della regressione cliccando su Salva e Residui. Quando si apre la finestra mettiamo a piacimento un nome come nome della variabile (es. pippo) Ora verifichiamo la distorsione degli OLS, ovvero l’esogeneità della variazione della moneta, introducendo nella regressione (1), calcolata con i minimi quadrati ordinari, anche il residuo pippo. 16 Il coefficiente di pippo è signifiativo, quindi d_LM2A non è esogeno e quindi la stima ottenuta con i minimi quadrati è distorta. 17 Stimiamo allora la nostra equazione (1) con i GMM, uno dei principali metodi delle variabili strumentali. Gli strumenti saranno d_LM2A dell’anno precedente e FINMONM2. Il procedimento è questo: Cliccare su Modello, Variabili strumentali, GMM: Mettere d_LP come dipendente, d_LM2A come indipendente e FINMONM2 come strumento. Poi cliccare su Ritardi per mettere il ritardo di d_LM2A tra gli strumenti 18 Diamo l’OK 19 Diamo ancora l’OK e otteniamo la stima GMM: Il coefficiente corretto della variazione della moneta è 1,15715, significativo all’1%. Nel periodo considerato, quindi, a una forte incremento della moneta ha corrisposto un forte incremento dell’inflazione. Ecco il grafico: 20 3.2 Legame tra i tassi forward a 7-10 anni in euro e in dollari. Apriamo il file rigobon_zforward.wf1. Il file contiene la variazione del forward a 7-10 anni dell’Eurirs (DEY7_10) e dell’Irs in dollari (DUY7_10) del giorno della riunione della Fed e del giorno successivo. Si vuole stimare la relazione (1) DE7_10 = a + b DU7_10 sapendo che potrebbe anche esiste una relazione (2) DU7_10 = a’ + b’ DE7_10 che va dall’Europa agli Stati Uniti. In questo caso particolare l’analisi di Rigobon suggerisce come determinare lo strumento per DU7_10 che è già stato calcolato e è stato chiamanto WU. A questo punto procediamo come nel caso precedente: Controlliamo la bontà dello strumento effettuando la regressione di DU7_10 su WU: 21 Il coefficiente di WU è altamente significativo, quindi possiamo proseguire. Calcoliamo il residui di quest’equazione. Questa volta lo chiamiamo RES. Stimiamo con i minimi quadrati ordinari l’equazione (1) con aggiunto RES come ulteriore variabile indipendente. Questa volta il coefficiente del residuo RES non è significativo. Ne consegure che la variabile DUY7_10 si può considerare esogena e i minumi quadrati ordinari (OLS) non distorti. Usiamo allora gli OLS; ecco la stima: 22 A un aumento del forward sull’Irs in dollari corrisponde un aumento dell’Euris di 0,24: il tasso americano influenza il tasso europeo. Vediamo che cosa avremmo ottenuto con i GMM: Il coefficiente sarebbe stato un po’ più piccolo (0.185) e la sua significatività un po’ minore. FINE 23