Nel mondo di oggi, Eteroschedasticità è diventato un argomento rilevante e importante che attira l'attenzione di molte persone. Che sia per il suo impatto sulla società, la sua rilevanza nella storia, la sua influenza sulla cultura o la sua importanza nel campo scientifico, Eteroschedasticità ha catturato l'interesse di molti. Nel corso degli anni, Eteroschedasticità ha svolto un ruolo significativo in vari settori e la sua presenza continua ad essere rilevante nel mondo di oggi. In questo articolo esploreremo diversi aspetti legati a Eteroschedasticità, esaminando la sua importanza, il suo impatto e la sua rilevanza nel contesto attuale.
In statistica, un campione di variabili casuali è eteroschedastico (dal Greco antico hetero “differente” e skedasis “dispersione”) se al suo interno esistono sotto-popolazioni che hanno diverse varianze.
La caratteristica dell'eteroschedasticità è particolarmente rilevante nell'ambito dell'analisi di regressione, in quanto fa venir meno alcune delle ipotesi classiche del modello di regressione lineare.
Nel 2003 l'econometrista Robert Engle ha vinto il Premio Nobel per l'economia per i suoi studi sull'analisi di regressione in presenza di eteroschedasticità, alla base della sua formulazione dei modelli della classe ARCH (dall'inglese Autoregressive Conditional Heteroschedasticity, eteroschedasticità condizionale autoregressiva).
In generale il problema dell'eteroschedasticità influisce sui termini d'errore di un qualsiasi modello quantitativo. I residui in questi modelli (regressivi o autoregressivi) sono detti omoschedastici quando sono statisticamente indipendenti da tutte le variabili esplicative, quando invece mostrano una propensione a co-variare con anche soltanto una di esse vengono definiti eteroschedastici.
L'eteroschedasticità comporta una serie di complicazioni nella stima e nell'interpretazione di un modello quantitativo. Per quanto riguarda la stima essa implica l'inefficienza dei parametri della regressione calcolati con il metodo minimi quadrati ordinari (OLS), e di conseguenza la necessità di ri-stimare questi parametri con tecniche più precise, per esempio i minimi quadrati generalizzati (GLS). Dal punto di vista dell'interpretazione l'eteroschedasticità può suggerire errori nella fase di specificazione del modello. Prendiamo per esempio un modello a una sola variabile esplicativa che voglia descrivere l'andamento dell'Inflazione Y al variare del costo delle automobili X. Esso andrebbe formalizzato così:
Dove e rappresenta il termine d'errore per ogni livello delle variabili. Se in seguito a un test di eteroschedasticità (per esempio Test di White) viene evidenziata una correlazione tra gli errori e la variabile X allora è molto probabile che il parametro b non solo sia inefficiente ma anche distorto, in quanto recante il peso sulla variabile dipendente di una o più eventuali variabili esplicative omesse. Concettualmente si può affermare che la variabile X e la costante a rappresentino il modello quantitativo, ovvero quanto esso riesce a spiegare della realtà osservata. Il termine d'errore e rappresenta invece la distanza tra il modello e la realtà, la differenza fra le stime ottenute e le osservazioni realmente effettuate. Va da sé che un forte legame fra variabili e termini d'errore evidenzia quanto in quest'ultimo possa celarsi una componente rilevante del fenomeno osservato, il quale sarebbe meglio descritto con una specificazione diversa del modello quantitativo. Nell'esempio riportato potremmo dover specificare che l'inflazione non aumenta solo a causa del prezzo delle automobili X ma anche a causa del prezzo al barile del greggio Z, allora:
E di qui procedere a nuovi test di specificazione e significatività per saggiare la bontà delle nuove stime dei parametri e dei residui.
Uno stimatore ricavato con il metodo dei minimi quadrati ordinari (Ordinary Least Squares o OLS in inglese) mantiene le proprietà di correttezza, consistenza e distribuzione normale asintotica anche in caso di eteroschedasticità degli errori. Tuttavia non è più asintoticamente efficiente, cioè la sua varianza non è più la minima possibile[1] nemmeno utilizzando un ipotetico campione con un numero praticamente infinito di osservazioni.
Per provare l'inefficienza, basta mostrare che, in caso di eteroschedasticità, la effettiva varianza asintotica dello stimatore non corrisponde alla varianza minima possibile. Si consideri il seguente modello di regressione lineare:
Il metodo dei minimi quadrati ordinari assume la omoschedasticità degli errori. Supponendo che anche le altre ipotesi dei minimi quadrati ordinari siano valide, la matrice varianza-covarianza degli errori sarà
e lo stimatore OLS sarà
con distribuzione asintotica
la cui varianza asintotica è la minima possibile.
Si supponga che gli errori siano in realtà eteroschedastici, ossia che abbiano forma:
In questo caso utilizzando il metodo dei minimi quadrati ordinari la vera varianza asintotica dello stimatore sarebbe
e dato che gli errori sono eteroschedastici, si otterrà
Questa nuova varianza è diversa da quella (la minima possibile) ottenuta quando gli errori sono effettivamente omoschedastici. Quindi lo stimatore non è più asintoticamente efficiente nel caso in cui gli errori sono eteroschedastici ma vengano erroneamente considerati come omoschedastici.
Una interpretazione del risultato è che la matrice V funga da peso per la matrice dei regressori X. Si consideri per semplicità un modello con un unico regressore e l'intercetta: la parte centrale della varianza dello stimatore sarà
Da cui si deduce che le osservazioni a cui corrisponde una varianza dell'errore più grande hanno un maggior peso nel calcolo della varianza dello stimatore. Al contrario, il metodo dei minimi quadrati ordinari assegna un peso pari a 1 a tutte le osservazioni. Un ragionamento simile può essere applicato ad un modello con più di un regressore.
Il problema dell'eteroschedasticità può insorgere sotto una grande varietà di ipotesi, al punto che nei libri di testo più comunemente utilizzati di solito il trattamento del problema è condotto tramite una serie di esempi.