Come Calcolare il Valore P

Il valore P, o valore della probabilità, è una misura statistica che aiuta gli scienziati a determinare la correttezza delle loro ipotesi. P è utilizzato per capire se i risultati di un esperimento rientrano nel normale range di valori per l'evento in osservazione. Di solito, se il valore di P di un determinato insieme di dati cade al di sotto di un certo livello prefissato (ad esempio 0,05) allora gli scienziati respingono "l'ipotesi nulla"[1] del loro esperimento, in altre parole escludono l'ipotesi la cui variabile non è significativa per i risultati. È possibile usare una tabella per trovare il valore p, dopo aver calcolato altri valori statistici. Uno dei valori statistici da determinare per primi è il chi quadro.

Passaggi

  1. 1
    Determina i risultati attesi dal tuo esperimento. Di solito, quando gli scienziati conducono dei test e osservano i risultati, hanno già in anticipo un'idea di ciò che è "normale" o "tipico". Questa idea può basarsi su esperimenti precedenti, su una serie di dati certi, sulla letteratura scientifica e/o su altre fonti. Quindi, nel tuo esperimento, determina quali potrebbero essere i risultati attesi ed esprimili in forma numerica.
    • Per esempio: diciamo che studi precedenti hanno dimostrato che, a livello nazionale, i conducenti di auto rosse hanno preso più multe per eccesso di velocità rispetto ai conducenti di auto blu, in un rapporto di 2:1. Vuoi capire se la polizia della tua città "rispetta" questa statistica e predilige multare le auto rosse. Se prendi un campione casuale di 150 multe per eccesso di velocità assegnate ad auto rosse e blu, dovresti aspettarti che 100 siano per le rosse e 50 per le blu, se la polizia della tua città rispetta la tendenza nazionale.
  2. 2
    Determina i risultati osservati del tuo esperimento. Ora che sai cosa aspettarti, devi condurre il test per trovare il valore reale (o "osservato"). Anche in questo caso i risultati vanno espressi in forma numerica. Se manipoliamo alcune condizioni esterne e notiamo che i risultati differiscono da quelli attesi, ci sono due possibilità: si tratta di una casualità, oppure il nostro intervento ha causato lo scostamento. Lo scopo di calcolare il valore P è quello di capire se i dati risultanti si discostano tanto da quelli attesi da rendere "l'ipotesi nulla" (cioè l'ipotesi che non ci sia alcuna correlazione fra la variabile sperimentale e i risultati osservati) abbastanza improbabile da essere rifiutata.
    • Ad esempio: nella tua città, le 150 multe casuali per eccesso di velocità che hai preso in considerazione risultano essere suddivise in 90 per le auto rosse e 60 per le blu. Questi dati si scostano dalla media nazionale (e prevista) 100 e 50. La nostra manipolazione dell'esperimento (in questo caso abbiamo cambiato il campione da nazionale a locale) è stata la causa di questa differenza, oppure è la polizia della città che non segue la media nazionale? Stiamo osservando un comportamento diverso o abbiamo introdotto una variabile significativa? Il valore P ci dice proprio questo.
  3. 3
    Determina il grado di libertà del tuo esperimento. I gradi di libertà sono la misura della quantità di variabilità che l'esperimento prevede e che è determinato dal numero di categorie che stai esaminando. L'equazione per i gradi di libertà è: Gradi di libertà= n-1, dove "n" è il numero delle categorie, o variabili che stai analizzando.
    • Esempio: il tuo esperimento ha due categorie, una per le auto rosse e l'altra per le blu. Quindi hai 2-1= 1 grado di libertà. Se avessi preso in considerazione le auto rosse, blu e verdi, avresti avuto 2 gradi di libertà e così via.
  4. 4
    Compara i risultati attesi con quelli osservati usando il chi quadro. Il chi quadrato (scritto "x2") è un valore numerico che misura la differenza fra i dati attesi e osservati di un test. L'equazione per il chi quadrato è: x2 = Σ((o-e)2/e), dove "o" è il valore osservato ed "e" è quello atteso. Somma i risultati di questa equazione per tutti i possibili esiti (vedi sotto).
    • Nota che l'equazione include il simbolo Σ (sigma). In altre parole devi calcolare ((|o-e|-,05)2/e) per ogni possibile esito e poi sommare fra loro i risultati per ottenere il chi quadro. Nell'esempio che stiamo considerando abbiamo due esiti: l'auto che ha preso la multa è blu o rossa. Quindi calcoliamo ((o-e)2/e) due volte, una per le rosse e l'altra per le blu.
    • Ad esempio: inseriamo i valori attesi e osservati nell'equazione x2 = Σ((o-e)2/e). Ricorda che, poiché c'è il simbolo sigma, devi svolgere il calcolo due volte, una per le auto rosse e l'altra per quelle blu. Ecco come devi fare:
      • x2 = ((90-100)2/100) + (60-50)2/50)
      • x2 = ((-10)2/100) + (10)2/50)
      • x2 = (100/100) + (100/50) = 1 + 2 = 3 .
  5. 5
    Scegli un livello di significatività[2]. Ora che hai i gradi di libertà e il chi quadro, c'è un ultimo valore che ti serve per trovare il valore P, devi decidere il livello di significatività. In pratica si tratta di un valore che misura quanto desideri essere certo del tuo risultato: un basso livello di significatività corrisponde ad una bassa probabilità che l'esperimento abbia prodotto dati casuali e viceversa. Questo valore si esprime in decimali (come 0.01) e corrisponde alla percentuale di possibilità che i dati risultanti siano casuali (in questo caso l'1%).
    • Per convenzione, gli scienziati determinano il loro livello di significatività a 0,05 o 5%. Ciò significa che i dati sperimentali hanno, al massimo, il 5% di possibilità di essere casuali. In altri termini c'è il 95% di possibilità che i risultati siano stati influenzati dalla manipolazione delle variabili del test da parte degli scienziati. Per la maggior parte degli esperimenti, la sicurezza al 95% che esista una correlazione fra due variabili dimostra in maniera "soddisfacente" che la correlazione esista davvero.
    • Per esempio: nel tuo test delle auto rosse e blu, segui la convenzione della comunità scientifica e imposti il tuo livello di significatività a 0,05.
  6. 6
    Usa una tabella di distribuzione del chi quadrato per trovare in approssimazione il tuo valore P. Gli scienziati e gli statistici usano delle grandi tabelle per calcolare P nei loro test. Queste tabelle di solito hanno sulla colonna verticale a sinistra i vari gradi di libertà e sulla riga orizzontale in alto il corrispondente valore P. Prima trova i gradi di libertà e poi scorri lungo la tabella da sinistra a destra per trovare il primo numero più grande del tuo chi quadro. Ora vai verso l'alto per trovare a quale valore P corrisponde (di solito il valore di P si trova fra questo numero che hai individuato e il successivo più grande).
    • Le tabelle di distribuzione del chi quadro sono disponibili un po' ovunque, puoi trovarle online o nei testi di scienza e statistica. Se non riesci a procurartele, usa quella nella foto sopra oppure usa questo link.
    • Per esempio: il tuo chi quadro è 3. Quindi usa la tabella di distribuzione nella foto sopra e trova il valore approssimato di P. Dato che sai che il tuo esperimento ha solo 1 grado di libertà, comincerai dalla riga più alta. Muoviti da sinistra verso destra nella tabella finché trovi un valore più grande di 3 (il tuo chi quadro). Il primo numero che incontri è 3.84. Risali verso l'alto sulla colonna e noti che corrisponde ad un valore pari a 0,05. Ciò significa che il nostro valore di P è compreso fra 0,05 e 0,1 (il numero più grande successivo nella tabella).
  7. 7
    Decidi se rifiutare o mantenere la tua ipotesi nulla. Poiché hai trovato un valore approssimato di P per il tuo esperimento, puoi decidere se rifiutare o no l'ipotesi nulla (ti ricordo che l'ipotesi nulla è quella che presuppone che non ci sia correlazione fra la variabile e i risultati dell'esperimento). Se P è inferiore al tuo livello di significatività, complimenti: hai dimostrato che c'è un'alta probabilità di correlazione fra la variabile e i risultati osservati. Se P è maggiore del tuo livello di significatività allora i risultati osservati potrebbero essere con maggior probabilità frutto del caso.
    • Per esempio: il valore di P è compreso fra 0,05 e 0,1, quindi non è certamente inferiore di 0,05. Ciò significa che non puoi rifiutare la tua ipotesi nulla e che non hai raggiunto la soglia minima di sicurezza del 95% per decidere se la polizia della tua città dà le multe alle auto rosse e blu con una proporzione significativamente diversa rispetto alla media nazionale.
    • In altri termini, c'è un 5-10% di possibilità che i dati ottenuti siano stati frutto del caso e non del fatto che hai modificato il campione (da nazionale a locale). Poiché ti sei imposto un limite massimo di insicurezza del 5% non puoi affermare sicuramente che la polizia della tua città sia meno "prevenuta" nei confronti degli automobilisti alla guida di un'auto rossa.

Consigli

  • L'uso di una calcolatrice scientifica renderà i calcoli molto più facili. Puoi trovare delle calcolatrici anche online.
  • È possibile calcolare il valore p usando diversi programmi, come i comuni software di foglio di calcolo o quelli più specializzati per il calcolo statistico.

Informazioni sull'Articolo

Categorie: Scienze

In altre lingue:

English: Calculate P Value, Español: calcular el p valor, Русский: посчитать величину P или значение вероятности, Français: calculer la valeur P, 中文: 计算P值, Nederlands: Een P waarde berekenen, Deutsch: Den P Wert berechnen, Português: Calcular o Valor P, Bahasa Indonesia: Menghitung Nilai P, العربية: حساب القيمة الاحتمالية, 한국어: P값을 계산하는 방법, Tiếng Việt: Tính Trị số p, 日本語: p値を計算する

Questa pagina è stata letta 71 993 volte.

Hai trovato utile questo articolo?