test di ipotesi con la distribuzione binomiale II parte

 

Nell’ultima lezione abbiamo preso in considerazione test di ipotesi con di LIVELLO DI SIGNIFICATIVITA’  5%  (o il valore quanto più vicino possibile al  5% senza superarlo). cerchiamo ora di spiegare meglio il concetto di LIVELLO DI SIGNIFICATIVITA’ usando come esempio la distribuzione binomiale per il lancio di una moneta.

 

Lanciamo una moneta 25 volte.

 

la distribuzione binomiale delle probabilità di 25 lanci di una moneta equa e’ riportata nella tabella dove I valori delle probabilità sono calcolati a 9 decimali:

 

 

 

 

 

 

Numero Teste

Probabilita'

Probab. Cumulativa

0

2,98023E-08

2,98023E-08

1

7,45058E-07

7,7486E-07

2

8,9407E-06

9,71556E-06

3

6,85453E-05

7,82609E-05

4

0,000376999

0,00045526

5

0,001583397

0,002038658

6

0,005277991

0,007316649

7

0,014325976

0,021642625

8

0,032233447

0,053876072

9

0,0608854

0,114761472

10

0,097416639

0,212178111

11

0,132840872

0,345018983

12

0,154981017

0,5

13

0,154981017

0,654981017

14

0,132840872

0,787821889

15

0,097416639

0,885238528

16

0,0608854

0,946123928

17

0,032233447

0,978357375

18

0,014325976

0,992683351

19

0,005277991

0,997961342

20

0,001583397

0,99954474

21

0,000376999

0,999921739

22

6,85453E-05

0,999990284

23

8,9407E-06

0,999999225

24

7,45058E-07

0,99999997

25

2,98023E-08

1

 

 

 

il corrispondente istogramma della distribuzione delle probabilità e’ riportato in figura

 

 

 

 


 

 

 

 

 

 

 


Diamo uno sguardo ad una piccola porzione della distribuzione di probabilità cumulativa

 

 

 

6

0.005277991

0.007316649

7

0.014325976

0.021642625

8

0.032233447

0.053876072

 

 

La probabilità cumulativa si trova nella terza colonna e mostra che abbiamo una probabilità di 0.021642625 di avere, per caso, 7 teste (o meno) su 25 lanci di una moneta equa.

arrotondiamo questo valore a 0.022.

Poiché la distribuzione è simmetrica, c’è anche una probabilità di 0.022 di avere 18 (o più) teste su 25 lanci.

La somma delle due probabilità è 0.044 oppure 4.4%.

 

Possiamo sostituire il nostro livello di significativita’ del 5% con 4.4% poiché in questa situazione esso rappresenta il livello più vicino possibile al nostro 5%

 

 

 

Il grafico evidenzia con linee verticali i valori  a 7 e 18 TEste:


 

 

 

 

 


Includendo le linee verticali, ci troviamo nella

 zona di accettazione

accettiamo la nostra ipotesi nulla che la moneta è equa.

 

Se si eseguono ripetutamente gruppi di 25 lanci di una moneta equa nota per un numero infinito di volte, il 95.6% del numero di teste in questi gruppi di 25 lanci

(100% - 4.4%) dovrebbe cadere nell’intervallo compreso tra 8 e 17 teste.

 

Nel caso in cui il numero delle teste su 25 lanci include le linee verticali e la zona al di là di esse, ci troviamo nella zona critica o di rigetto e quindi rigettiamo la nostra ipotesi nulla.

 

 

 

 

 

 

verifichiamo ora l’ipotesi alternativa secondo cui la moneta non è equa.

 

C’è una possibilità del 4.4% che una moneta equa dia un numero di teste compreso tra 7 (o meno) e 18 (o più) su 25 lanci.

 

Quindi, con il livello di significativita’ che abbiamo scelto, c’è una probabilità del 4.4% di rigettare un’ipotesi nulla che in realtà è corretta.

 

Un errore commesso nel rigettare un’ipotesi nulla corretta è un errore di tipo I.

 

Allo stesso tempo una moneta truccata(biased) potrebbe dare un numero di teste che ricade all’interno della nostra zona di accettazione entro le linee verticali.

 

 

 

Un errore commesso accettando un’ipotesi nulla errata è un

errore di tipo II

 

Tutto questo viene riassunto nella tabella:

 

 

ipotesi nulla rigettata

ipotesi nulla accettata

ipotesi nulla vera

errore tipo i

decisione corretta

ipotesi nulla falsa

decisione corretta

errore tipo ii

 

 

Il rischio di commettere un errore di tipo I viene denotato dalla lettera greca a.

La zona di accettazione è 1-a

 

Le zone critiche su ciascun lato della distribuzione binomiale sono: ½ alfa

 

 

i valori per 25 lanci di una moneta sono dati da:

a = 0.044

1- a = 0.956

½ a = 0.022

 

Se volessimo ridurre il rischio di commettere un errore di tipo I, potremmo ridurre la ampiezza delle nostre zone critiche ed aumentare la ampiezza delle zone di accettazione.

 

Questo vorrebbe dire ridurre il livello di significativita’.

 

Il livello di significativita’ è semplicemente la probabilità di un errore di tipo I espresso come percentuale.

supponiamo di vloer avere solo una probabilità dello 0.4% di commettere un errore di tipo I invece del 4.4%

In questo caso dovremmo rigettare l’ipotesi nulla solo se avessimo 5 (o meno) o 20 (o più) teste su 25 lanci. Nella tabella  è possibile notare che il livello di probabilità cumulativa a 5 teste è 0.002038658 – due volte questo è circa 0.004 o 0.4%.

 

Numero Teste

Probabilita'

Probab. Cumulativa

0

2,98023E-08

2,98023E-08

1

7,45058E-07

7,7486E-07

2

8,9407E-06

9,71556E-06

3

6,85453E-05

7,82609E-05

4

0,000376999

0,00045526

5

0,001583397

0,002038658

6

0,005277991

0,007316649

7

0,014325976

0,021642625

8

0,032233447

0,053876072

9

0,0608854

0,114761472

10

0,097416639

0,212178111

11

0,132840872

0,345018983

12

0,154981017

0,5

13

0,154981017

0,654981017

14

0,132840872

0,787821889

15

0,097416639

0,885238528

16

0,0608854

0,946123928

17

0,032233447

0,978357375

18

0,014325976

0,992683351

19

0,005277991

0,997961342

20

0,001583397

0,99954474

21

0,000376999

0,999921739

22

6,85453E-05

0,999990284

23

8,9407E-06

0,999999225

24

7,45058E-07

0,99999997

25

2,98023E-08

1

 

 

Il prezzo da pagare quando si cerca di ridurre il rischio di commettere un errore di tipo I è quello di aumentare il rischio di commettere un errore di tipo II.

 

ammettiamo che il livello di significativita’ per l’esperimento di 25 lanci di moneta sia fissato a 4.4%

Se la moneta fosse veramente biased e si avessero 6 teste – rigetteremmo l’ipotesi nulla al livello di significativita’di 4.4% e arriveremmo alla decisione giusta.

Ma se scegliessimo il livello di significativita’ 0.4%, accetteremmo l’ipotesi nulla e commetteremmo un errore di II tipo.

 

 

 

 

 

 

 

 

 


 


Abbiamo visto che con 25 lanci di moneta, la zona di accettazione per un livello di significativita’ di 4.4% è compresa tra le linee verticali avendo ipotizzato che

la moneta sia equa. Ma cosa succederebbe se usassimo una moneta biased con una probabilità dello 0.75 di avere testa senza saperlo?

 

Quale sarebbe la probabilità di rigettare l’ipotesi nulla quando, infatti, essa è falsa?

Questa probabilità viene definita potenza del test.

 

 

Per poter determinare questa probabilità dobbiamo sapere il vero bias della moneta

I due grafici seguenti mostrano le distribuzioni binomiali per il numero di teste su 25 lanci di una moneta equa (p=0.5) e una moneta biased (p =0.75).


La zona tra le linee verdi è la zona di accettazione della nostra ipotesi nulla (da 8 a 17 teste) basandoci sull’ipotesi che usiamo una moneta equa.

 


La zona nella parte bassa del grafico indicata dalla lettera b ha una probabilità cumulativa uguale alla probabilità di commettere un errore di II tipo.

Il secondo grafico (in basso) è un modello di comportamento della moneta “reale” – ma accetteremmo ancora l’ipotesi nulla (poiché non saremmo a conoscenza ordinariamente delle proprietà della moneta reale sulla base della zona di accettazione del grafico superiore. Accettare un’ipotesi nulla falsa/errata è un errore di II tipo.

Conoscendo il vero bias della moneta, la probabilità di rigettare l’ipotesi nulla falsa sarebbe la probabilità cumulativa nel grafico inferiore che include le linee verdi e le regioni esterne ad esse.

 

La probabilità cumulativa è 1-b.

Quindi la potenza del test è 1-b.

 

Quanto più ampia è la zona di accettazione nel grafico superiore, tanto meno è il livello di significativita’ e tanto più bassa la potenza del test poiché le linee verdi sarebbero più distanti.

 

Una moneta maggiormente biased (per es. p = 0.95) farà spostare il grafico inferiore sulla destra ed aumentare la potenza del test.

 

in sintesi

 

 

ipotesi nulla rigettata

ipotesi nulla accettata

ipotesi nulla vera

errore tipo i

a

decisione corretta

1-a

ipotesi nulla falsa

decisione corretta

1-b

errore tipo ii

b

 

 

 

 

COMPITI

1.  Quali sono le zone di rigetto su 35 lanci di una moneta equa con un valore a di 0.05? E con un valore di 0.10? Non vogliamo commettere un errore di tipo I.

 

2.  Quali sono le zone di rigetto al 5% di livello di significativita’ per un modello basato su 35 lanci di una moneta che sappiamo essere biased in modo che c’è una probabilità del 30% di avere testa e una probabilità del 70% di avere croce. Non vogliamo commettere un errore di tipo I.

 

3.  Calcolate la potenza del test su 25 lanci di una moneta se la vera probabilità di avere testa fosse:

 

Probabilità di avere testa

potenza su

25 lanci

0.6

 

0.75

 

0.95

 

 

Scegliete un livello di significativita’ quanto piu’ vicino possibile al 5% senza superarlo

 

Cosa accadrebbe se la moneta venisse lanciata 100 volte?

 

 

Probabilità di avere testa

potenza su

100 lanci

0.6

 

 

La grandezza del campione ha un’influenza sulla potenza del test? Se si, perché questo sarebbe importante per un biologo?

 

4.  date due esempi biologici specifici dove sarebbe possibile usare la distribuzione binomiale in un test di ipotesi.