TEST DI IPOTESI CON
LA DISTRIBUZIONE BINOMIALE
PARTE I
Da
un campione casuale semplice di cento uova, nascono 37 maschi e 63 femmine.
C’è
veramente un’uguale probabilità che un uovo diA vita ad un maschio o ad una
femmina?
Probabilmente
abbiamo scelto 37 maschi e 63 femmine solo per caso. Allo stesso modo di come è
possibile avere tre teste in TRE LANCI DI SEGUITO anche se la moneta lanciata
fosse EQUA.
Se
c’è uguale probabilità che un uovo fecondo si sviluppi in un maschio o in una
femmina, il numero dei maschi e delle femmine in un numero infinito di campioni
di cento uova ciascun campione dovrebbe avere la distribuzione BINOMIALE
MOSTRATA NEL GRAFICO:

FORMULIAMO
ORA UN’IPOTESI NULLA
Questa
è l’ipotesi di cui ci occuperemo e che chiamiamo IPOTESI NULLA perché assumiamo
che non c’è nessuna differenza “reale” tra il valore vero della probabilità di
avere maschi o femmine dalla popolazione da cui abbiamo campionato e il
nostro valore ipotizzato di 0.5.
In
altre parolE assumiamo che il nostro campione è stato selezionATO da una
popolazione di uova in cui metà dei componenti erano maschi e metà erano
femmine.
Che
cosa si intende per nessuna differenza “reale”?
Ciò
che si intende è che, come nel caso in cui abbiamo duE teste su due lanci di
una moneta EQUA, la differenza tra ciò che ci aspettiamo (una testa e una
croce) e ciò che otteniamo è dovuto al caso e a nessun bias (sistematicita’) nella
moneta.
Nella
nostra ipotesi nulla assumiamo che la
differenza tra ciò che idealmente ci aspettiamo (50 maschi e 50 femmine) e ciò
che abbiamo ottenuto (37 maschi e 63 femmine)
è dovuto soltanto al caso e non riflette una vera differenza di
proporzioni nella popolazione.
L’IPOTESI ALTERNATIVA
stabilirebbe che non c’è un numero uguale di uova maschi e femmine nella
popolazione.
|
E’
soltanto possibile verificare direttamente l’ipotesi nulla. |
Perché?
Perché
abbiamo un
“modello
matematico noto”
con cui lavorare – una distribuzione BINOMIALE in cui la grandezza del campione è 100 e la probabilità di ciascun evento è 0.5.
Qual
è il nostro specifico modello matematico noto per l’ipotesi alternativa?
Se lo conoscessimo conosceremmo già le vere proporzioni di uova maschi
e femmina nella popolazione!
avendo
formulato un’ipotesi nulla e avendo un modello per verificarla – abbiamo
bisogno di una regola per decidere se accettare o rigettare l’ipotesi nulla.
In
altre parole – dobbiamo stabilire di quanto possiamo scostarci dal previsto 50 maschi e 50 femmine per rigettare
l’ipotesi nulla.
|
E’ convenzione comune di scegliere un livello significativo del 5% |
vediamo
cosa significa:
analizziamo
il grafico della probabilità cumulativa della nostra distribuzione BINOMIALE.

Qui
aggiungiamo probabilità man mano che andiamo da 0 a 100 maschi – la probabilità
totale e’ uguale a 1.
La
prima e l’ultima parte del grafico sembrano piatte perché i livelli di
probabilità sono o molto bassi(prima parte) o molto alti(seconda parte)
cerchiamo
dove la probabilità cumulativa assume un valore uguale a 0.025 o prossimo a questo valore limite senza
superarlo.
|
35 |
0.00176 |
|
|
36 |
0.00332 |
|
|
37 |
0.00602 |
|
|
38 |
0.01049 |
|
|
39 |
0.01760 |
|
|
40 |
0.02844 |
|
|
41 |
0.04431 |
|
|
42 |
0.06661 |
|
|
43 |
0.09667 |
|
|
44 |
0.013563 |
|
dalla
tabella in corrispondenza di 39 maschi si ha che p=0.01760
sul
grafico della distribuzione BINOMIALE sono indicati i limiti corrispondenti a P
£0.025 e per p=0.01760 <
0.025 si ha che i corrispondenti valori limite sono 39 e 61

La
probabilità cumulativa di entrambe le zone fuori le due verticali del
grafico, linee verticali incluse, ammonta a
0.0176
´ 2 = 0.0352 e la probabilità cumulativa delle zone delimitata dalle
due verticali e’
p=1 – 0.0352 =0.9648.
Quindi secondo la nostra regola di decisione
(stabilita prima che avessimo i dati) nel caso in cui abbiamo 39 maschi o meno o se abbiamo 61 o più
maschi, rigettiamo l’ipotesi nulla secondo cui la popolazione ha 50% maschi e
50% femmine mentre accettiamo l’ipotesi alternativa secondo cui la popolazione
non ha queste proporzioni.
La zona di accettazione dell’ipotesi nulla si trova
dentro le linee verticali, mentre la zona di rigetto
o zona critica si trova fuori (ed include) le verticali.
La
probabilità usata come criterio per il rigetto dell’ipotesi nulla viene
indicata con la lettera greca a
Il livello di significativita’ è semplicemente la
probabilità espressa come una percentuale.
Il
valore o valori del TEST STATISTIC che corrisponde a a – in questo caso 39 o 61 – vengono chiamati Valori Critici.
E’
possibile commettere un errore nel rigettare l’ipotesi nulla? Certamente –
proprio come è possibile che si abbiano 100 teste su 100 lanci di una moneta
equa.
Ma
la probabilità di avere 39 o meno – 61 o più maschi per caso in una popolazione
dove il rapporto è 1:1 è 3.52% o meno. Sulla base di ciò siamo disposti a
rigettare l’ipotesi nulla.
|
Ovviamente
in questo modo non è possibile provare che un’ipotesi è vera |
|
è soltanto possibile affermare che e’ poco
probabile l’ipotesi alternativa o contraria entro i
limiti della regola di decisione che abbiamo usato
|
Cosa
succede se la nostra scelta di zona critica non piace ad altri? Sta a loro
giustificare perché e sta a noi accettare o rifiutare le loro giustificazioni.
Ciò
che bisogna fare è essere assolutamente onesti
nel presentare i dati e assolutamente chiari
nel dimostrare il modo in cui abbiamo preso la nostra decisione per giungere ad
una conclusione.
Poiché
prima di fare l’esperimento non avevamo alcuna idea di quali sarebbero stati i
dati – abbiamo usato entrambi i lati o code
della distribuzione BINOMIALE con una probabilità totale
del valore di 0.0352 : abbiamo eseguito Un
Cosa
diremmo se queste osservazioni ci portassero a credere che ci fossero meno
maschi? Potremmo trovarci di fronte ad un caso in cui lo sperma con un
cromosoma y era meno vitale in queste specie.
In
questo caso possiamo formulare la nostra ipotesi nulla e alternativa come
segue:
IPOTESI
NULLA
Ci
sarà un numero uguale di maschi e femmine
IPOTESI
ALTERNATIVA:
Ci saranno meno maschi che femmine.
La
nostra ipotesi nulla non può cambiare perché stiamo ancora usando lo stesso
modello matematico basato su un’uguale probabilità di avere un maschio o una
femmina.
test ad una coda.
Questo va deciso prima di raccogliere i dati.
Se
si è deciso per un test ad una coda non è
possibile cambiare idea ed optare per un test a due
code (una volta che i dati sono stati acquisiti).
|
38 |
0.01049 |
|
39 |
0.01760 |
|
40 |
0.02844 |
|
41 |
0.04431 |
|
42 |
0.06661 |
|
43 |
0.09667 |
|
44 |
0.013563 |
Da
questa distribuzione di probabilita’ cumulativa
è chiaro che la nostra ipotesi nulla viene rigettata nel caso in cui si hanno
41 o meno maschi piuttosto che i 39 o meno usati con il test a due code.
Il
valore critico del nostro test è ora 41 maschi e a è ancora quanto più prossimo possibile a 0.05 senza oltrepassarlo.
La
probabilità di avere 41 maschi (o meno) è 6.661%
Il vantaggio del test a una coda è che questo ci consente di rigettare l’ipotesi nulla con un
risultato meno estremo (41 piuttosto che 39) rispetto a quello richiesto dal test a due code.
Quali sono gli svantaggi del
test a una coda?
Cosa
accadrebbe se i risultati fossero 90 maschi e 10 femmine?
Dovremmo
accettare l’ipotesi nulla invece della alternativa:
Così
come è poco probabile che si verifichi un tale evento, sarebbe inaccettabile a
questo punto cambiare idea e ritornare ad un test a due
code.
Quando siete in dubbio optate
direttamente per un test a duecode
La
validità della nostre conclusioni TRATTE da un test statistico dipende daL verificaRSI
DELle IPOTESI SU CUI E’ BASATO Il test.
|
IPOTESI PER UN TEST BASATO SULLA DISTRIBUZIONE BINOMIALE |
|
1. Le prove nel nostro campione sono indipendenti. Nel caso di lanci di
monete, una prova sarà il lancio di una moneta e il risultato del lancio di
una moneta non ha alcuna influenza sul risultato di un altro lancio. |
|
Nel
nostro caso, una prova è un organismo scelto tra la popolazione. |
|
Il
sesso dell’organismo scelto non ha alcuna influenza sul sesso di un altro. |
|
Un
esperimento consiste in un numero n di prove (100 lanci di monete o un campione di 100 organismi nel nostro
caso). |
|
2. Ci sono soltanto due risultati su ogni prova
– testa o croce, maschio o femmina. |
Supponiamo
che da un incrocio genetico ci si aspetti un rapporto di 3:1 piante di piselli
con fiori porpora su bianchi.
Si
hanno 109 piante con fiori porpora e 37 con fiori bianchi su un totale di 146
piante.
E’
possibile accettare l’ipotesi nulla secondo cui le piante mostrano un rapporto
di 3:1 :
la
distribuzione BINOMIALE per il numero di piante con fiori bianchi basato sul
rapporto previsto di 3:1.
e’ ricavata per una probabilità di ¾ di avere
una pianta con fiori porpora e una probabilità di ¼ di avere una pianta con
fiori bianchi.

Ecco
parti della tabella della distribuzione di probabilità cumulativa:
|
23 |
0.00483 |
44 |
0.093454 |
|
24 |
0.00873 |
45 |
0.095478 |
|
25 |
0.01507 |
46 |
0.096960 |
|
26 |
0.02491 |
47 |
0.098011 |
|
27 |
0.03948 |
48 |
0.098734 |
Sulla
base di un test A DUE CODE, 26 o meno piante con fiori bianchi e 47 o più
piante con fiori bianchi porteranno al rigetto dell’ipotesi del rapporto di 3:1
quanto
più CI possiamo avvicinarE al LIVELLO DI SIGNIFICATIVITA’ DEL 5% senza
oltrepassarlo
0.02491
+ (1 – 0.98011) = 0.0448 oppure 4.48%
poiché
abbiamo 37 piante con fiori bianchi Accettiamo l’ipotesi nulla.
le caratteristiche basilari sul TEST DI ipotesi sono RIASSunte NELLA TABELLA CHE SEGUE
(ci RIPROMETTiamo DI AMPLIARE ALCUNI CONCETTI NEL SEGUITO):
|
1.
IPOTESI NULLA |
|
E’
basata su un modello matematico noto ed è accettata finché i dati non
indicano diversamente. |
|
2. IPOTESI ALTERNATIVA O DI RICERCA |
|
Questa
viene accettata nel caso in cui siamo obbligati a rigettare l’ipotesi nulla |
|
3. TEST STATISTIC |
|
Un
campione statistico (in uno dei nostri esempi il numero di maschi su un
campione di 100) che usiamo per decidere se accettare o rifiutare l’ipotesi
nulla. |
|
4. ZONA DI RIGETTO |
|
Valori
numerici del test statistico che ci consentono di rigettare l’ipotesi nulla. |
|
5.IPOTESI |
|
I
dati e le procedure di esperimenti SODDISFANO le IPOTESI del vostro modello
matematico? |
|
6.
CERTEZZE |
|
Il
test statistico non dirà mai se l’ipotesi è “vera” o “falsa” – ma DA soltanto
la probabilità di rigettare un’ipotesi “vera” o “falsa” con la IPOTESI che il
modello matematico (come la distribuzione BINOMIALE) sia quello valido da
usare |
COMPITI:
1) Ecco alcuni dati di un esperimento di
comportamento dove moscerini della frutta femmine hanno la possibilità di
scegliere tra due tipi di maschi per accoppiarsi: maschi con ali normali e con
ali vestigiali.
|
maschi
con ali normali 13 |
Maschi
con ali vestigiali
5 |
FORMULATE
UN’IPOTESI NULLA
FORMULATE
DUE IPOTESI ALTERNATIVE
a)
PER
UN TEST a due code
b)
PER
UN TEST ad una coda
rispettate la condizione di avvicinarvi il più possibile al livello
di significativita’ del 5% senza oltrepassarlo.
2. si e’ eseguito un test a due code per il
seguente esperimento:
supponiamo
che da un incrocio genetico ci aspettiamo un rapporto 3:1 di piante di piselli
con fiori porpora e bianchi. Disponiamo di 109 piante con fiori porpora e 37
con fiori bianchi su un totale di 146 piante. E’ possibile accettare l’ipotesi
nulla secondo cui la piante hanno un rapporto di 3:1?
Ora
eseguite un test ad una coda al 5% di
livello di significativita’ senza oltrepassarlo.
Formulate sia l’ipotesi nulla che quella alternativa nel vostro test
ad una coda.
3. Quali caratteristiche dovrebbe avere un
esperimento biologico per poter essere analizzato usando la distribuzione BINOMIALE?
Quali tipi di esperimenti non sarebbero adatti
a questo tipo di analisi?
