test di ipotesi con la distribuzione binomiale II
parte
Nell’ultima
lezione abbiamo preso in considerazione test di ipotesi con di LIVELLO DI
SIGNIFICATIVITA’ 5% (o il valore quanto più vicino possibile al 5% senza superarlo). cerchiamo ora di
spiegare meglio il concetto di LIVELLO DI SIGNIFICATIVITA’ usando come esempio
la distribuzione binomiale per il lancio di una moneta.
Lanciamo
una moneta 25 volte.
la
distribuzione binomiale delle probabilità di 25 lanci di una moneta equa e’
riportata nella tabella dove I valori delle probabilità sono calcolati a 9 decimali:
Numero Teste |
Probabilita' |
Probab.
Cumulativa |
|
0 |
2,98023E-08 |
2,98023E-08 |
|
1 |
7,45058E-07 |
7,7486E-07 |
|
2 |
8,9407E-06 |
9,71556E-06 |
|
3 |
6,85453E-05 |
7,82609E-05 |
|
4 |
0,000376999 |
0,00045526 |
|
5 |
0,001583397 |
0,002038658 |
|
6 |
0,005277991 |
0,007316649 |
|
7 |
0,014325976 |
0,021642625 |
|
8 |
0,032233447 |
0,053876072 |
|
9 |
0,0608854 |
0,114761472 |
|
10 |
0,097416639 |
0,212178111 |
|
11 |
0,132840872 |
0,345018983 |
|
12 |
0,154981017 |
0,5 |
|
13 |
0,154981017 |
0,654981017 |
|
14 |
0,132840872 |
0,787821889 |
|
15 |
0,097416639 |
0,885238528 |
|
16 |
0,0608854 |
0,946123928 |
|
17 |
0,032233447 |
0,978357375 |
|
18 |
0,014325976 |
0,992683351 |
|
19 |
0,005277991 |
0,997961342 |
|
20 |
0,001583397 |
0,99954474 |
|
21 |
0,000376999 |
0,999921739 |
|
22 |
6,85453E-05 |
0,999990284 |
|
23 |
8,9407E-06 |
0,999999225 |
|
24 |
7,45058E-07 |
0,99999997 |
|
25 |
2,98023E-08 |
1 |
il
corrispondente istogramma della distribuzione delle probabilità e’ riportato in
figura

Diamo
uno sguardo ad una piccola porzione della distribuzione di probabilità
cumulativa
|
6 |
0.005277991 |
0.007316649 |
|
7 |
0.014325976 |
0.021642625 |
|
8 |
0.032233447 |
0.053876072 |
La
probabilità cumulativa si trova nella terza colonna e mostra che abbiamo una
probabilità di 0.021642625 di avere, per caso, 7 teste (o meno) su 25 lanci di
una moneta equa.
arrotondiamo
questo valore a 0.022.
Poiché
la distribuzione è simmetrica, c’è anche una probabilità di 0.022 di avere 18
(o più) teste su 25 lanci.
La
somma delle due probabilità è 0.044 oppure 4.4%.
Possiamo
sostituire il nostro livello di significativita’ del 5% con 4.4% poiché in
questa situazione esso rappresenta il livello più vicino possibile al nostro 5%
Il
grafico evidenzia con linee verticali i valori a 7 e 18 TEste:

Includendo
le linee verticali, ci troviamo nella
zona di accettazione
accettiamo
la nostra ipotesi nulla che la moneta è equa.
Se
si eseguono ripetutamente gruppi di 25 lanci di una moneta equa nota per un
numero infinito di volte, il 95.6% del numero di teste in questi gruppi di 25
lanci
(100%
- 4.4%) dovrebbe cadere nell’intervallo compreso tra 8 e 17 teste.
Nel
caso in cui il numero delle teste su 25 lanci include le linee verticali e la
zona al di là di esse, ci troviamo nella zona critica
o di rigetto e quindi rigettiamo la nostra ipotesi nulla.
verifichiamo
ora l’ipotesi alternativa secondo cui la moneta non è equa.
C’è
una possibilità del 4.4% che una moneta equa dia un numero di teste compreso
tra 7 (o meno) e 18 (o più) su 25 lanci.
Quindi,
con il livello di significativita’ che abbiamo scelto, c’è una probabilità del
4.4% di rigettare un’ipotesi nulla che in realtà è corretta.
Un errore commesso nel rigettare un’ipotesi nulla corretta è un errore di tipo I.
Allo
stesso tempo una moneta truccata(biased) potrebbe dare un numero di teste che
ricade all’interno della nostra zona di accettazione entro le linee verticali.
Un
errore commesso accettando un’ipotesi nulla errata è un
Tutto
questo viene riassunto nella tabella:
|
|
ipotesi
nulla rigettata |
ipotesi
nulla accettata |
|
ipotesi
nulla vera |
errore tipo i |
decisione
corretta |
|
ipotesi
nulla falsa |
decisione
corretta |
errore tipo ii |
Il
rischio di commettere un errore di tipo I viene denotato dalla lettera greca a.
La
zona di accettazione è 1-a
Le
zone critiche su ciascun lato della distribuzione binomiale sono: ½ alfa
i
valori per 25 lanci di una moneta sono dati da:
1- a = 0.956
½ a = 0.022
Se volessimo ridurre il rischio di commettere
un errore di tipo I, potremmo ridurre la ampiezza delle nostre zone critiche ed
aumentare la ampiezza delle zone di accettazione.
Questo vorrebbe dire ridurre il livello di significativita’.
Il livello
di significativita’ è semplicemente la probabilità di un errore di tipo I espresso come percentuale.
supponiamo di vloer avere solo una probabilità dello 0.4% di commettere un errore di tipo I invece del 4.4%
In questo caso dovremmo rigettare l’ipotesi nulla solo se avessimo 5 (o meno) o 20 (o più) teste su 25 lanci. Nella tabella è possibile notare che il livello di probabilità cumulativa a 5 teste è 0.002038658 – due volte questo è circa 0.004 o 0.4%.
Numero Teste |
Probabilita' |
Probab.
Cumulativa |
|
0 |
2,98023E-08 |
2,98023E-08 |
|
1 |
7,45058E-07 |
7,7486E-07 |
|
2 |
8,9407E-06 |
9,71556E-06 |
|
3 |
6,85453E-05 |
7,82609E-05 |
|
4 |
0,000376999 |
0,00045526 |
|
5 |
0,001583397 |
0,002038658 |
|
6 |
0,005277991 |
0,007316649 |
|
7 |
0,014325976 |
0,021642625 |
|
8 |
0,032233447 |
0,053876072 |
|
9 |
0,0608854 |
0,114761472 |
|
10 |
0,097416639 |
0,212178111 |
|
11 |
0,132840872 |
0,345018983 |
|
12 |
0,154981017 |
0,5 |
|
13 |
0,154981017 |
0,654981017 |
|
14 |
0,132840872 |
0,787821889 |
|
15 |
0,097416639 |
0,885238528 |
|
16 |
0,0608854 |
0,946123928 |
|
17 |
0,032233447 |
0,978357375 |
|
18 |
0,014325976 |
0,992683351 |
|
19 |
0,005277991 |
0,997961342 |
|
20 |
0,001583397 |
0,99954474 |
|
21 |
0,000376999 |
0,999921739 |
|
22 |
6,85453E-05 |
0,999990284 |
|
23 |
8,9407E-06 |
0,999999225 |
|
24 |
7,45058E-07 |
0,99999997 |
|
25 |
2,98023E-08 |
1 |
Il
prezzo da pagare quando si cerca di ridurre il rischio di commettere un errore
di tipo I è quello di aumentare il rischio di commettere un errore di tipo II.
ammettiamo
che il livello di significativita’ per l’esperimento di 25 lanci di moneta sia
fissato a 4.4%
Se la moneta fosse veramente biased e si avessero 6 teste – rigetteremmo l’ipotesi nulla al livello di significativita’di 4.4% e arriveremmo alla decisione giusta.
Ma se scegliessimo il livello di significativita’ 0.4%, accetteremmo l’ipotesi nulla e commetteremmo un errore di II tipo.

Abbiamo visto che con 25 lanci di moneta, la zona di accettazione per un livello di significativita’ di 4.4% è compresa tra le linee verticali avendo ipotizzato che
la moneta
sia equa. Ma cosa succederebbe se usassimo una moneta biased con una
probabilità dello 0.75 di avere testa senza saperlo?
Quale
sarebbe la probabilità di rigettare l’ipotesi nulla quando, infatti, essa è
falsa?
Questa
probabilità viene definita potenza del test.
Per poter determinare questa probabilità dobbiamo sapere il vero
bias della moneta
I due grafici seguenti mostrano le distribuzioni binomiali per il
numero di teste su 25 lanci di una moneta equa (p=0.5) e una moneta biased (p =0.75).

La zona tra le linee verdi è la zona di accettazione della nostra ipotesi nulla
(da 8 a 17 teste) basandoci sull’ipotesi che usiamo una moneta equa.
La
zona nella parte bassa del grafico indicata dalla lettera b ha una probabilità cumulativa uguale alla
probabilità di commettere un errore di II tipo.
Il
secondo grafico (in basso) è un modello di comportamento della moneta “reale” –
ma accetteremmo ancora l’ipotesi nulla (poiché non saremmo a conoscenza
ordinariamente delle proprietà della moneta reale sulla base della zona di
accettazione del grafico superiore. Accettare un’ipotesi nulla falsa/errata è
un errore di II tipo.
Conoscendo
il vero bias della moneta, la probabilità di rigettare l’ipotesi nulla falsa
sarebbe la probabilità cumulativa nel grafico inferiore che include le linee
verdi e le regioni esterne ad esse.
La
probabilità cumulativa è 1-b.
Quindi
la potenza del test è 1-b.
Quanto
più ampia è la zona di accettazione nel grafico superiore, tanto meno è il livello
di significativita’ e tanto più bassa la potenza del test poiché le linee verdi
sarebbero più distanti.
Una
moneta maggiormente biased (per es. p = 0.95) farà spostare il grafico inferiore
sulla destra ed aumentare la potenza del test.
in sintesi
|
|
ipotesi nulla rigettata |
ipotesi nulla accettata |
|
ipotesi nulla vera |
errore tipo i a |
decisione corretta 1-a |
|
ipotesi nulla falsa |
decisione corretta 1-b |
errore tipo ii b |
COMPITI
1.
Quali
sono le zone di rigetto su 35 lanci di una moneta equa con un valore a di
0.05? E con un valore di 0.10? Non vogliamo commettere un errore di tipo I.
2.
Quali
sono le zone di rigetto al 5% di livello di significativita’ per un modello
basato su 35 lanci di una moneta che sappiamo essere biased in modo che c’è una
probabilità del 30% di avere testa e una probabilità del 70% di avere croce.
Non vogliamo commettere un errore di tipo I.
3.
Calcolate
la potenza del test su 25 lanci di una moneta se la vera probabilità di avere
testa fosse:
|
Probabilità di avere testa |
potenza su
25 lanci |
|
0.6 |
|
|
0.75 |
|
|
0.95 |
|
Scegliete un livello di significativita’ quanto piu’ vicino possibile al 5% senza superarlo
Cosa accadrebbe se la moneta venisse lanciata 100 volte?
|
Probabilità di avere testa |
potenza su
100 lanci |
|
0.6 |
|
La grandezza del campione ha un’influenza sulla potenza del test? Se si, perché questo sarebbe importante per un biologo?
4. date due esempi biologici specifici dove
sarebbe possibile usare la distribuzione binomiale in un test di ipotesi.