In questo articolo esploreremo l'affascinante mondo di Valore p. Dalle sue origini fino al suo impatto sulla società odierna, ci immergeremo in un'analisi dettagliata che ci permetterà di comprenderne l'importanza in diversi ambiti. Valore p è stato oggetto di interesse e dibattito nel tempo, le sue implicazioni hanno trasceso le barriere culturali e generazionali. Attraverso questo viaggio cercheremo di svelare i misteri e le curiosità che circondano Valore p, nel tentativo di far luce sulla sua rilevanza nel contesto attuale.
In statistica inferenziale, in particolare nei test di verifica d'ipotesi, il valore p, o p-dei-dati[1] (dall'inglese p-value),[2] o anche livello di significatività osservato,[3] è la probabilità, per una ipotesi supposta vera (detta ipotesi nulla), di ottenere risultati ugualmente o meno compatibili di quelli osservati durante il test, con la suddetta ipotesi.[4][5] In altri termini, il valore p aiuta a capire se la differenza tra il risultato osservato e quello ipotizzato è dovuta alla casualità introdotta dal campionamento, oppure se tale differenza è statisticamente significativa, cioè difficilmente spiegabile mediante la casualità dovuta al campionamento. L'utilizzo del valore p nei test di ipotesi è comune in molti campi di ricerca[6] come fisica, economia, finanza, scienze politiche, medicina, psicologia,[7] biologia, criminologia e sociologia.[8]
Quando si effettua un test d'ipotesi si fissa un'ipotesi nulla e un valore soglia α (per convenzione di solito 0,05) che indica il livello di significatività del test. Calcolato il p-value relativo ai dati osservati è possibile comportarsi come segue:
Tuttavia se valore p ≈ α, cioè è vicino al valore soglia, è necessaria attenzione. Il valore p viene utilizzato per fornire maggiori informazioni su un test rispetto all'accettazione o al rifiuto per un certo livello di significatività. Per questo le analisi statistiche devono sempre riportare il valore del p-value osservato permettendo ai lettori di trarre le proprie conclusioni.
Per condurre un test statistico è importante fissare il livello di significatività (indicato di solito con la lettera greca α, alfa) prima di calcolare il valore p. Se il valore p venisse calcolato per primo, lo sperimentatore saprebbe quali valori per quel livello di significatività conducono ad accettare o rigettare l'ipotesi nulla, e potrebbe scegliere il livello in funzione del risultato desiderato.
Sia l'ipotesi che il valore dei dati osservati sia estratto da una certa variabile aleatoria nota. Il p-value è definito come la probabilità, supposta l'ipotesi , di ottenere un risultato (dai dati osservati) uguale o "più estremo" di quello effettivamente osservato. Cosa si intende con "più estremo" precisamente, dipende dal tipo di test che si intende effettuare. Se il test è bilaterale allora i risultati più estremi sono i valori di per cui oppure . Se il test è unilaterale destro allora i risultati più estremi sono i valori di per cui . Se il test è unilaterale sinistro allora i risultati più estremi sono i valori di per cui . Quindi il p-value è dato da:
Più il valore del p-value è piccolo, più è grande la significatività poiché il risultato ci dice che l'ipotesi considerata non spiega adeguatamente i dati osservati, cioè è poco credibile che il valore osservato sia stato effettivamente estratto dalla variabile aleatoria .
Sia, ad esempio, 0,03 il valore p di un test. Il test condotto con un livello di significatività di 0,05 induce allora a rifiutare l'ipotesi nulla, mentre lo stesso test condotto con un rischio di errore di 0,02 induce a non rifiutare l'ipotesi nulla. La conclusione "il valore p è 0,03" contiene più informazioni delle sole "ipotesi rifiutata con significatività 0,05" o "non rifiutata con significatività 0,02".
Ci sono diversi errori comuni riguardanti l'uso del p-value.
Controllo di autorità | GND (DE) 4605821-7 |
---|