In questo articolo ci addentreremo nell'entusiasmante mondo di Mediana (statistica), esplorandone i vari aspetti, caratteristiche e possibili applicazioni nella vita di tutti i giorni. Mediana (statistica) è un argomento che ha suscitato l'interesse di ricercatori, esperti e appassionati, per la sua rilevanza in diversi ambiti e per la sua capacità di influenzare il nostro modo di pensare, sentire e agire. In questa direzione analizzeremo Mediana (statistica) da diverse prospettive, con l'obiettivo di offrire una visione completa e arricchente che permetta al lettore di comprenderne meglio l'importanza e le potenzialità. Dalle sue origini alle sue proiezioni future, Mediana (statistica) si rivela un argomento appassionante che suscita curiosità e invita a riflettere sul suo impatto sul mondo di oggi.
In statistica, in particolare in statistica descrittiva, data una distribuzione di un carattere quantitativo oppure qualitativo ordinabile (ovvero le cui modalità possano essere ordinate in base a qualche criterio), si definisce la mediana (o valore mediano) come il valore/modalità (o l'insieme di valori/modalità) assunto dalle unità statistiche che si trovano nel mezzo della distribuzione. La mediana è un indice di posizione[1] e rientra nell'insieme delle statistiche d'ordine.
Il termine mediano venne introdotto da Antoine Augustin Cournot e adottato da Francis Galton. Gustav Theodor Fechner sviluppò l'uso della mediana come sostituto della media in quanto riteneva che il calcolo della media fosse troppo laborioso rispetto al vantaggio in termini di precisioni che offriva.
Se si procede al riordinamento delle unità in base ai valori crescenti del carattere da esse detenuto, in sostanza la mediana bipartisce la distribuzione in due sotto-distribuzioni: la prima (da un lato, ad esempio a sinistra della mediana) costituita dalla metà delle unità la cui modalità è minore o uguale alla mediana, e la seconda (dall'altro lato, ad esempio a destra della mediana) costituita dalla metà delle unità la cui modalità è maggiore o uguale alla mediana. Tecnicamente si afferma che la mediana è il valore/modalità per il quale la frequenza relativa cumulata vale (o supera) 0,5, cioè il secondo quartile, ossia il 50º percentile. Usualmente si indica la mediana con Me.
Per calcolare la mediana di dati:[2]
Se le modalità sono raggruppate in classi non si definisce un valore univoco, ma una classe mediana . La determinazione di tale classe avviene considerando le frequenze cumulate; indicando con la generica frequenza cumulata relativa dell'osservazione -esima sarà e . Pur essendo corretto considerare un qualsiasi elemento dell'intervallo un valore mediano si è soliti procedere, al fine di avere una misura unica del valore, a un'approssimazione della mediana con la seguente formula:
se si assume che la distribuzione dei dati all'interno della classe sia uniforme, che corrisponde ad un processo di interpolazione.
Una proprietà della mediana è di rendere minima la somma dei valori assoluti degli scarti delle da un generico valore
Infatti, sia la variabile aleatoria alla quale si riferiscono le osservazioni . Per la linearità del valore atteso e dell'operatore di derivazione si ha
dove è la funzione segno di . Per la definizione di valore atteso
dove indica la probabilità che sia minore di e quella che sia maggiore di . Per le proprietà di normalizzazione della probabilità, cioè , l'equazione diventa
Quindi
cioè è la mediana.
In un sondaggio fatto all'interno di una facoltà composta da 250 studenti (la popolazione statistica), si intende rilevare il carattere "Gradimento dei professori", secondo le cinque modalità "molto deluso", "insoddisfatto", "parzialmente soddisfatto", "soddisfatto", "entusiasta". Risulta che 10 studenti si dicono entusiasti dell'operato dei professori, 51 si dicono soddisfatti, 63 parzialmente soddisfatti, 90 insoddisfatti, 36 molto delusi.
La distribuzione di frequenza viene rappresentata con una tabella come la seguente:
Gradimento dei professori | Frequenze assolute | Frequenze relative | Frequenze percentuali | Frequenze cumulate assolute | Frequenze cumulate relative | Frequenze cumulate percentuali |
---|---|---|---|---|---|---|
molto deluso | 36 | 0,144 | 14,4 | 36 | 0,144 | 14,4 |
insoddisfatto | 90 | 0,360 | 36 | 126 | 0,504 | 50,4 |
parzialmente soddisfatto | 63 | 0,252 | 25,2 | 189 | 0,756 | 75,6 |
soddisfatto | 51 | 0,204 | 20,4 | 240 | 0,960 | 96 |
entusiasta | 10 | 0,040 | 4 | 250 | 1,000 | 100 |
Totali | 250 | 1,000 | 100 |
Nel caso ipotizzato, la mediana è rappresentata dalla modalità "insoddisfatto". Questo significa che almeno la metà degli studenti non è soddisfatta dei professori.