DISTRIBUZIONE t E
TEST tQUANDO ABBIAMO UTILIZZATO LA DISTRIBUZIONE z GUARDANDO ALLA DIFFERENZA TRA LE MEDIE PARAMETRICHE E DEI CAMPIONI, ABBIAMO SUPPOSTO CHE
O
CONOSCEVAMO LA DEVIAZIONE PARAMETRICA STANDARD
OPPURE
LA DIMENSIONE DEL NOSTRO CAMPIONE ERA GRANDE ABBASTANZA PER DARE UNA BUONA STIMA DI ESSA. ,
M
UN CAMPIONE DI PICCOLE DIMENSIONI NON DAREBBE UNA STIMA AFFIDABILE DELLA
DEVIAZIONE STANDARD PARAMETRICA.
IN QUESTO CASO AVREMO UNA
DISTRIBUZIONE t
UNA DISTRIBUZIONE
t E' SIMILE AD UNA DISTRIBUZIONE z MA LA DEVIAZIONE STANDARD DEL CAMPIONE VARIA MOLTO CON CAMPIONI DI PICCOLE DIMENSIONI - QUESTO RENDE IL VALORE DI t PIU' VARIABILE DI QUELLO DI z .UNA DISTRIBUZIONE t PER UN CAMPIONE DI 12 PER ES., DAREBBE UNA CURVA A FORMA DI CAMPANA SOLO PIU' PIATTA AL CENTRO E PIU' DISPERSA IN CORRISPONDENZA DELLE CODE.
PER OGNI DIMENSIONE DI UN CAMPIONE C'E' UNA DIVERSA DISTRIBUZIONE t.
QUANTO PIU' PICCOLA E' LA DIMENSIONE
DEL CAMPIONE TANTO PIU' GRANDE E’ LA VARIABILITA' NEI VALORI t, E TANTO PIU' GRANDE E' IL RANGE DEL 95% DI INTERVALLO DI CONFIDENZA. DALLA TABELLA CHE SEGUE POSSIAMO VEDERE QUALI SONO LE DIFFERENZE TRA t E z A PARITA’ DI INTERVALLO DI CONFIDENZA
|
IL 95% DEI VALORI CADONO TRA ± QUESTE DEVIAZIONI STANDARD DALLA MEDIA |
|
|
NORMALE |
1.96 |
|
t (n = 6) |
2.571 |
|
t (n=3) |
4.303 |
.
DOBBIAMO USARE UNA DIVERSA DISTRIBUZIONE t PER CIASCUN CAMPIONE.
IN FIGURA E’ MOSTRATA UNA DISTRIBUZIONE t PER UN CAMPIONE DI DIMENSIONE 12 A CONFRONTO CON UNA DISTRIBUZIONE NORMALE.
M
GRL SIGNIFICA GRADI DI LIBERTA' : CI SI RIFERISCE AL NUMERO DI VALORI IN UN SET DI DATI LIBERI DI VARIARE QUANDO VENGONO POSTI VINCOLI SUI DATI.
UN CAMPIONE DI TRE VALORI CON UNA MEDIA DI 3 AVREBBE 2 GRADI DI LIBERTA'.
INFATTI NOTA LA MEDIA NEL MOMENTO IN CUI VI DICESSI CHE 1 E 3 SONO VALORI DEL CAMPIONE, IL TERZO VALORE POTREBBE SOLO ESSERE 5 PER AVERE MEDIA 3.
ABBIAMO 2 GRADI DI LIBERTA' POICHE' GIA' CONOSCIAMO LA MEDIA, IN QUESTO MODO SOLO 2 DEI 3 DATI SONO LIBERI DI CAMBIARE.
CON t DI STUDENT CI SI RIFERISCE AD UN NOME USATO DA W.S. GOSSET CHE HA SVILUPPATO L'USO DELLA DISTRIBUZIONE t .
IL 95% DELLA ZONA SOTTO LA CURVA NORMALE SI TROVA ENTRO
± 1.96 DEVIAZIONI STANDARD
MENTRE
IL 95% DELLA ZONA SOTTO LA CURVA t SI TROVA ENTRO
± 2.21 DEVIAZIONI STANDARD
.LE CURVE SONO SIMILI MA LA DISTRIBUZIONE t HA MAGGIORE VARIABILITA’.
CON n = 30 LE CURVE SAREBBERO INDISTINGUIBILI - ECCO PERCHE' PER n ³ 30
DICIAMO CHE IL CAMPIONE E’ ABBASTANZA GRANDE DA POTER CONSIDERARE UNA STATISTICA z.
CONSIDERIAMO UN PICCOLO CAMPIONE DI PESI PER ORGANISMI X:
|
N. |
Peso (g) |
|
1 |
41,8 |
|
2 |
28,2 |
|
3 |
35,6 |
|
4 |
44 |
|
5 |
39,2 |
|
6 |
35,1 |
|
7 |
42,8 |
|
8 |
36,4 |
|
9 |
32,6 |
|
10 |
33,1 |
SUPPONIAMO DI AVERE RAGIONE DI CREDERE CHE QUESTO CAMPIONE PROVENGA DA UNA POPOLAZIONE CON UN PESO MEDIO NOTO DI 42 GRAMMI.
TESTIAMO L'IPOTESI NULLA SECONDO CUI NON C'E' NESSUNA DIFFERENZA SIGNIFICATIVA TRA IL PESO MEDIO DI QUESTO CAMPIONE E QUELLO DELLA POPOLAZIONE CON PESO MEDIO DI 42 g AL 5% DI LIVELLO DI SIGNIFICATIVITA'.

M
E' POSSIBILE CALCOLARE UN VALORE t.

SE STESSIMO ESEGUENDO UN TEST z SAPREMMO CHE UN VALORE z DI -3.121 SAREBBE AL DI FUORI DEL 95% DELL’INTERVALLO DI CONFIDENZA E RIGETTEREMMO LA NOSTRA IPOTESI NULLA - MA CHE COSA DIRE PER QUESTO VALORE DI t?

LA PROBABILITA' DI AVERE UN VALORE DI t
( IN UN TEST A DUE CODE ) DI -3.21 O MENO OPPURE +3.21 O PIU' E' 0.011 ( 1.1% ).
RIGETTIAMO LA NOSTRA IPOTESI NULLA.
CHE COSA SUCCEDE SE RITENIAMO CHE QUESTO CAMPIONE PROVIENE DA UNA POPOLAZIONE CON UN PESO MEDIO NOTO DI 39 GRAMMI?

LA PROBABILITA' DI AVERE UN VALORE DI t
( IN IN UN TEST A DUE CODE) DI -1.33 O MENO OPPURE +1.33 O PIU' E' 0.22 ( 22% ).
ACCETTIAMO LA NOSTRA IPOTESI NULLA.
SE DESIDERIAMO CONFRONTARE LE MEDIE DI DUE PICCOLI CAMPIONI IN MODO DA DETERMINARE SE C'E' UNA DIFFERENZA SIGNIFICATIVA POSSIAMO USARE LA SEGUENTE DISTRIBUZIONE:
I DUE CAMPIONI HANNO MEDIE CHE DIFFERISCONO IN MODO SIGNIFICATIVO AL 5% DI LIVELLO DI SIGNIFICATIVITA'?
M




PER CAPIRE IL SIGNIFICATO DEL 95% DI INTERVALLO DI CONFIDENZA PER LA DIFFERENZA NELLE MEDIE PARAMETRICHE STIMATE DAI DUE CAMPIONI FACCIAMO L’IPOTESI CHE:
1. CI SIA UNA DIFFERENZA NELLE MEDIE PARAMETRICHE DI -5.7 ( 36.000 - 41.700 )
2. UNA DEVIAZIONE PARAMETRICA STANDARD IN QUESTE DIFFERENZE DI 0.775
3. LE DIFFERENZE SONO DISTRIBUITE NORMALMENTE

SE LE DIFFERENZE AVESSERO UNA DISTRIBUZIONE NORMALE, IL 96.7% DELLE DIFFERENZE MEDIE SI TROVEREBBE NEL RANGE DA -7.35 A -4.05.
-5.7 - 1.65 = -7.35
( E' SOLO UN CASO CHE QUESTO SIA UGUALE AL VALORE DI t)
-5.7 + 1.65 = -4.05
MA UNA DISTRIBUZIONE t E' PIU' AMPIA DI UNA NORMALE COSI' CI ASPETTEREMMO DI TROVARE UNA PERCENTUALE PIU' BASSA IN QUESTO RANGE DI UNA DISTRIBUZIONE t - INFATTI TROVIAMO IL 95%.
SE LE DIMENSIONI DEI NOSTRI CAMPIONI FOSSERO PIU' GRANDI, IL RANGE DELLA DISTRIBUZIONE t E DI QUELLA NORMALE PER DIFFERENZE MEDIE AL 95% DI INTERVALLO DI CONFIDENZA SAREBBERO POCO DIVERSI.

LA NOSTRA IPOTESI NULLA AFFERMA CHE DOVREBBE ESSERCI DIFFERENZA 0 TRA LE MEDIE DEI DUE CAMPIONI - MA DIFFERENZA 0 SI TROVA FUORI DEL NOSTRO RANGE CHE VA DA -7.35 A -4.05.
LA PROBABILITA' DI AVERE UN VALORE t -7.35 O PIU' BASSO O +7.35 O PIU' ALTO SE LA DIFFERENZA MEDIA FOSSE VERAMENTE 0 E' COSI' BASSA CHE RISULTA 0 FINO ALLA QUARTA CIFRA DECIMALE!
P=0.0000
UN TEST t PUO' ESSERE USATO CON OSSERVAZIONI ACCOPPIATE .
PER STUDIARE L'EFFETTO DEL COLORE DEL GUSCIO SULLA TEMPERATURA INTERNA DELLE LUMACHE, SONO STATE CONFRONTATE LUMACHE CON GUSCI GIALLI E MARRONI AVENTI PIU' O MENO LA STESSSA GRANDEZZA.
I GUSCI SONO STATI RIEMPITI DI MERCURIO, TENUTI ALLO STESSO LIVELLO DI LUMINOSITA', E LA TEMPERATURA DEL MERCURIO E' STATA DETERMINATA DOPO UN CERTO INTERVALLO DI TEMPO.
|
GUSCI MARRONI 0C |
GUSCI GIALLI 0C |
DIFFERENZA |
|
25.5 |
25.6 |
-0.1 |
|
27.5 |
27.8 |
-0.3 |
|
27.3 |
26.3 |
1.0 |
|
27.3 |
25.9 |
1.4 |
|
29.2 |
28.0 |
1.2 |
|
25.3 |
25.4 |
-0.1 |
|
26.4 |
25.6 |
0.8 |
|
28.5 |
28.9 |
-0.4 |
|
28.1 |
27.2 |
0.9 |
|
26.4 |
26.0 |
0.4 |
.
USEREMO LA DISTRIBUZIONE t:
LA MEDIA DELLE DIFFERENZE VIENE DIVISA PER L'ERRORE STANDARD DELLE DIFFERENZE.
LA NOSTRA IPOTESI NULLA E' CHE LA DIFFERENZA MEDIA E' 0.
m
|
N |
MARRONE |
GIALLO |
DIF. |
|
1 |
25,5 |
25,6 |
-0,1 |
|
2 |
27,5 |
27,8 |
-0,3 |
|
3 |
27,3 |
26,3 |
1 |
|
4 |
27,3 |
25,9 |
1,4 |
|
5 |
29,2 |
28 |
1,2 |
|
6 |
25,3 |
25,4 |
-0,1 |
|
7 |
26,4 |
25,6 |
0,8 |
|
8 |
28,5 |
28,9 |
-0,4 |
|
9 |
28,1 |
27,2 |
0,9 |
|
10 |
26,4 |
26 |
0,4 |
.

LA PROBABILITA' DI AVERE UN VALORE t INFERIORE A -2.28 O PIU' DI 2.28 E' DEL 4.8%.
RIGETTIAMO LA NOSTRA IPOTESI NULLA DI UNA DIFFERENZA 0 AL 5% DI LIVELLO DI SIGNIFICATIVITA’
IL t TEST E' PROBABILMENTE LA PROCEDURA STATISTICA PIU' AMPIAMENTE USATA IN
BIOLOGIA –PROBABILMENTE E' ANCHE
QUELLA USATA PEGGIO
!!ECCO UN ERRORE COMUNE:
SUPPONIAMO DI AVERE TRE (O PIU') GRUPPI DI DATI:
|
A |
B |
C |
|
2 |
2 |
2 |
|
3 |
2 |
5 |
|
3 |
3 |
3 |
|
1 |
1 |
2 |
.
A CONFRONTATO CON B
A CONFRONTATO CON C
B CONFRONTATO CON C
SUPPONIAMO CHE UN CERTO VALORE DI t (O PIU' GRANDE) HA UNA PROBABILITA' DEL 5% DI TROVARSI FUORI DAL 95% DI INTERVALLO DI CONFIDENZA.
LA PROBABILITA' CHE NON LO OTTERREMO PER CASO E' 0.95
I TRE CONFRONTI SONO EVENTI INDIPENDENTI COSI' CHE LA PROBABILITA' CHE NON LO OTTERREMO PER CASO 3 VOLTE E' 0.953 è 0.86.
COSI' NON STIAMO PIU' LAVORANDO CON LO STESSO INTERVALLO DI CONFIDENZA!!
CI SONO MODI VALIDI DI VALUTARE TRE O PIU' GRUPPI DI DATI - VEDREMO COME QUANDO STUDIEREMO LA ANALISI DELLA VARIANZA è
ANOVA.
1. ECCO DUE CAMPIONI CON UN CERTO NUMERO DI NATI DALLA STESSA SPECIE IN DUE POSTI DIVERSI.
|
CAMPIONE 1 |
CAMPIONE 2 |
|
80 |
79 |
|
76 |
73 |
|
80 |
72 |
|
66 |
62 |
|
79 |
76 |
|
79 |
68 |
|
81 |
70 |
|
76 |
86 |
|
75 |
|
|
68 |
|
|
73 |
|
|
66 |
.
SE UNA DELLE MEDIE E' PIU' GRANDE - ASSUMETE CHE SAPEVATE PRECEDENTEMENTE CHE POTEVA ESSERCI E FATE UN TEST t AD UNA CODA.
2. DIECI TOPI SONO STATI PESATI PRIMA E DOPO UN TRATTAMENTO CON UN ORMONE.
ESEGUITE UN TEST t ACCOPPIATO PER DETERMINARE SE GLI ORMONI HANNO CREATO QUALCHE DIFFERENZA. USATE IL 5% DI LIVELLO DI SIGNIFICATIVITA'.
|
PRIMA |
DOPO |
|
128 |
135 |
|
105 |
110 |
|
119 |
131 |
|
140 |
142 |
|
98 |
105 |
|
123 |
130 |
|
127 |
131 |
|
115 |
110 |
|
122 |
125 |
|
145 |
149 |