Valore p

In questo articolo esploreremo l'affascinante mondo di Valore p. Dalle sue origini fino al suo impatto sulla società odierna, ci immergeremo in un'analisi dettagliata che ci permetterà di comprenderne l'importanza in diversi ambiti. Valore p è stato oggetto di interesse e dibattito nel tempo, le sue implicazioni hanno trasceso le barriere culturali e generazionali. Attraverso questo viaggio cercheremo di svelare i misteri e le curiosità che circondano Valore p, nel tentativo di far luce sulla sua rilevanza nel contesto attuale.

In statistica inferenziale, in particolare nei test di verifica d'ipotesi, il valore p, o p-dei-dati[1] (dall'inglese p-value),[2] o anche livello di significatività osservato,[3] è la probabilità, per una ipotesi supposta vera (detta ipotesi nulla), di ottenere risultati ugualmente o meno compatibili di quelli osservati durante il test, con la suddetta ipotesi.[4][5] In altri termini, il valore p aiuta a capire se la differenza tra il risultato osservato e quello ipotizzato è dovuta alla casualità introdotta dal campionamento, oppure se tale differenza è statisticamente significativa, cioè difficilmente spiegabile mediante la casualità dovuta al campionamento. L'utilizzo del valore p nei test di ipotesi è comune in molti campi di ricerca[6] come fisica, economia, finanza, scienze politiche, medicina, psicologia,[7] biologia, criminologia e sociologia.[8]

Livello di significatività

La coordinata verticale è la densità di probabilità di ciascun risultato, calcolata supponendo vera l'ipotesi nulla. Il valore p è l'area sottesa dalla curva a partire dal dato osservato.
Lo stesso argomento in dettaglio: Livello di significatività.

Quando si effettua un test d'ipotesi si fissa un'ipotesi nulla e un valore soglia α (per convenzione di solito 0,05) che indica il livello di significatività del test. Calcolato il p-value relativo ai dati osservati è possibile comportarsi come segue:

  • se valore p > α l'evidenza empirica non è sufficientemente contraria all'ipotesi nulla che quindi non può essere rifiutata;
  • se valore p ≤ α l'evidenza empirica è fortemente contraria all'ipotesi nulla che quindi va rifiutata. In tal caso si dice che i dati osservati sono statisticamente significativi.

Tuttavia se valore p ≈ α, cioè è vicino al valore soglia, è necessaria attenzione. Il valore p viene utilizzato per fornire maggiori informazioni su un test rispetto all'accettazione o al rifiuto per un certo livello di significatività. Per questo le analisi statistiche devono sempre riportare il valore del p-value osservato permettendo ai lettori di trarre le proprie conclusioni.

Per condurre un test statistico è importante fissare il livello di significatività (indicato di solito con la lettera greca α, alfa) prima di calcolare il valore p. Se il valore p venisse calcolato per primo, lo sperimentatore saprebbe quali valori per quel livello di significatività conducono ad accettare o rigettare l'ipotesi nulla, e potrebbe scegliere il livello in funzione del risultato desiderato.

Definizione

Sia l'ipotesi che il valore dei dati osservati sia estratto da una certa variabile aleatoria nota. Il p-value è definito come la probabilità, supposta l'ipotesi , di ottenere un risultato (dai dati osservati) uguale o "più estremo" di quello effettivamente osservato. Cosa si intende con "più estremo" precisamente, dipende dal tipo di test che si intende effettuare. Se il test è bilaterale allora i risultati più estremi sono i valori di per cui oppure . Se il test è unilaterale destro allora i risultati più estremi sono i valori di per cui . Se il test è unilaterale sinistro allora i risultati più estremi sono i valori di per cui . Quindi il p-value è dato da:

  • per test unilaterali destri;
  • per test unilaterali sinistri;
  • per test bilaterali.

Più il valore del p-value è piccolo, più è grande la significatività poiché il risultato ci dice che l'ipotesi considerata non spiega adeguatamente i dati osservati, cioè è poco credibile che il valore osservato sia stato effettivamente estratto dalla variabile aleatoria .

Esempio

Sia, ad esempio, 0,03 il valore p di un test. Il test condotto con un livello di significatività di 0,05 induce allora a rifiutare l'ipotesi nulla, mentre lo stesso test condotto con un rischio di errore di 0,02 induce a non rifiutare l'ipotesi nulla. La conclusione "il valore p è 0,03" contiene più informazioni delle sole "ipotesi rifiutata con significatività 0,05" o "non rifiutata con significatività 0,02".

Errori comuni

Ci sono diversi errori comuni riguardanti l'uso del p-value.

  • Il p-value non è la probabilità che l'ipotesi nulla sia vera o la probabilità che l'ipotesi nulla sia falsa. Non è connesso con nessuna delle due.
  • Il p-value non è la probabilità che un'osservazione sia un caso. Il calcolo del p-value è basato sull'ipotesi che ogni osservazione è un caso, un risultato aleatorio. Con la frase "il risultato è dovuto al caso" si intende di solito che l'ipotesi nulla è probabilmente corretta, ma ricordiamo che il p-value non può essere usato per rappresentare la probabilità che un'ipotesi sia vera.
  • Il p-value non è la probabilità di rifiutare l'ipotesi nulla quando questa è vera.
  • Il p-value non è la probabilità che replicando l'esperimento si otterrebbe la stessa conclusione. Per quantificare la replicabilità di un esperimento è stato introdotto il concetto di p-rep.
  • Il livello di significatività α non è determinato dal p-value. Il livello di significatività è deciso dalla persona che conduce l'esperimento prima di vedere i dati.

Note

  1. ^ Ross (2015), pp. 310-311.
  2. ^ p-value in "Enciclopedia della Matematica", su treccani.it. URL consultato il 24 marzo 2022.
  3. ^ TEST DI SIGNIFICATIVITA', su web.archive.org, 27 luglio 2017. URL consultato il 24 marzo 2022 (archiviato dall'url originale il 27 luglio 2017).
  4. ^ Christie Aschwanden, Not Even Scientists Can Easily Explain P-values, su FiveThirtyEight, 24 novembre 2015. URL consultato l'11 ottobre 2019 (archiviato dall'url originale il 25 settembre 2019).
  5. ^ Ronald L. Wasserstein e Nicole A. Lazar, The ASA's Statement on p-Values: Context, Process, and Purpose, in The American Statistician, vol. 70, n. 2, 7 marzo 2016, pp. 129-133, DOI:10.1080/00031305.2016.1154108.
  6. ^ Bhaskar Bhattacharya e DeSale Habtzghi, Median of the p value under the alternative hypothesis, in The American Statistician, vol. 56, n. 3, 2002, pp. 202-6, DOI:10.1198/000313002146.
  7. ^ R. Wetzels, D. Matzke, M. D. Lee, J. N. Rouder, G. J. Iverson e E. -J. Wagenmakers, Statistical Evidence in Experimental Psychology: An Empirical Comparison Using 855 t Tests, in Perspectives on Psychological Science, vol. 6, n. 3, 2011, pp. 291-298, DOI:10.1177/1745691611406923, PMID 26168519.
  8. ^ E. Babble, The practice of social research, 11ª ed., Belmont, Thomson Wadsworth, 2007.

Bibliografia

Voci correlate

Altri progetti

Collegamenti esterni

Controllo di autoritàGND (DE4605821-7