DISTRIBUZIONE t E  TEST t

QUANDO ABBIAMO UTILIZZATO LA DISTRIBUZIONE z GUARDANDO ALLA DIFFERENZA TRA LE MEDIE PARAMETRICHE E DEI CAMPIONI, ABBIAMO SUPPOSTO CHE

O

CONOSCEVAMO LA DEVIAZIONE PARAMETRICA STANDARD

OPPURE

LA DIMENSIONE DEL NOSTRO CAMPIONE ERA GRANDE ABBASTANZA PER DARE UNA BUONA STIMA DI ESSA. ,

 

M

UN CAMPIONE DI PICCOLE DIMENSIONI NON DAREBBE UNA STIMA AFFIDABILE DELLA

 

DEVIAZIONE STANDARD PARAMETRICA.

IN QUESTO CASO AVREMO UNA DISTRIBUZIONE t


M

 

UNA DISTRIBUZIONE t E' SIMILE AD UNA DISTRIBUZIONE z MA LA DEVIAZIONE STANDARD DEL CAMPIONE VARIA MOLTO CON CAMPIONI DI PICCOLE DIMENSIONI - QUESTO RENDE IL VALORE DI t PIU' VARIABILE DI QUELLO DI z .

UNA DISTRIBUZIONE t PER UN CAMPIONE DI 12 PER ES., DAREBBE UNA CURVA A FORMA DI CAMPANA SOLO PIU' PIATTA AL CENTRO E PIU' DISPERSA IN CORRISPONDENZA DELLE CODE.

PER OGNI DIMENSIONE DI UN CAMPIONE C'E' UNA DIVERSA DISTRIBUZIONE t.

QUANTO PIU' PICCOLA E' LA DIMENSIONE

 

DEL CAMPIONE TANTO PIU' GRANDE E’ LA VARIABILITA' NEI VALORI t, E TANTO PIU' GRANDE E' IL RANGE DEL 95% DI INTERVALLO DI CONFIDENZA. DALLA TABELLA CHE SEGUE POSSIAMO VEDERE QUALI SONO LE DIFFERENZE TRA t E z A PARITA’ DI INTERVALLO DI CONFIDENZA
 MM
 

DISTRIBUZIONE

IL 95% DEI VALORI CADONO TRA ± QUESTE DEVIAZIONI STANDARD DALLA MEDIA

NORMALE

1.96

t (n = 6)

2.571

t (n=3)

4.303

.
M
NON E' POSSIBILE STANDARDIZZARE  LA DISTRIBUZIONE t COME FACCIAMO CON LA DISTRIBUZIONE NORMALE.

DOBBIAMO USARE UNA DIVERSA DISTRIBUZIONE t PER CIASCUN CAMPIONE.

IN FIGURA E’ MOSTRATA UNA DISTRIBUZIONE t PER UN CAMPIONE DI DIMENSIONE 12 A CONFRONTO CON UNA DISTRIBUZIONE NORMALE.M


M
.

GRL SIGNIFICA GRADI DI LIBERTA' : CI SI RIFERISCE AL NUMERO DI VALORI IN UN SET DI DATI LIBERI DI VARIARE QUANDO VENGONO POSTI VINCOLI SUI DATI.

UN CAMPIONE DI TRE VALORI CON UNA MEDIA DI 3 AVREBBE 2 GRADI DI LIBERTA'.

INFATTI NOTA LA MEDIA NEL MOMENTO IN CUI VI DICESSI CHE 1 E 3 SONO VALORI DEL CAMPIONE, IL TERZO VALORE POTREBBE SOLO ESSERE 5 PER AVERE MEDIA 3.

ABBIAMO 2 GRADI DI LIBERTA' POICHE' GIA' CONOSCIAMO LA MEDIA, IN QUESTO MODO SOLO 2 DEI 3 DATI SONO LIBERI DI CAMBIARE.

CON t DI STUDENT CI SI RIFERISCE AD UN NOME USATO DA W.S. GOSSET CHE HA SVILUPPATO L'USO DELLA DISTRIBUZIONE t .

IL 95% DELLA ZONA SOTTO LA CURVA NORMALE SI TROVA ENTRO

± 1.96 DEVIAZIONI STANDARD

MENTRE

IL 95% DELLA ZONA SOTTO LA CURVA t SI TROVA ENTRO

± 2.21 DEVIAZIONI STANDARD.

LE CURVE SONO SIMILI MA LA DISTRIBUZIONE t HA MAGGIORE VARIABILITA’. 

CON n = 30 LE CURVE SAREBBERO INDISTINGUIBILI - ECCO PERCHE' PER n ³ 30

 

DICIAMO CHE IL CAMPIONE E’ ABBASTANZA GRANDE DA POTER CONSIDERARE UNA STATISTICA z.
 


CONSIDERIAMO UN PICCOLO CAMPIONE DI PESI PER ORGANISMI X:
.

N.

Peso (g)

1

41,8

2

28,2

3

35,6

4

44

5

39,2

6

35,1

7

42,8

8

36,4

9

32,6

10

33,1


.

 

SUPPONIAMO DI AVERE RAGIONE DI CREDERE CHE QUESTO CAMPIONE PROVENGA DA UNA POPOLAZIONE CON UN PESO MEDIO NOTO DI 42 GRAMMI.

TESTIAMO L'IPOTESI NULLA SECONDO CUI NON C'E' NESSUNA DIFFERENZA SIGNIFICATIVA TRA IL PESO MEDIO DI QUESTO CAMPIONE E QUELLO DELLA POPOLAZIONE CON PESO MEDIO DI 42 g AL 5% DI LIVELLO DI SIGNIFICATIVITA'.
M

M

 

 

 

 

 

 

 

 

 

 

 

E' POSSIBILE CALCOLARE UN VALORE t.


M

SE STESSIMO ESEGUENDO UN TEST z SAPREMMO CHE UN VALORE z DI -3.121 SAREBBE AL DI FUORI DEL 95% DELL’INTERVALLO DI CONFIDENZA E RIGETTEREMMO LA NOSTRA IPOTESI NULLA - MA CHE COSA DIRE PER QUESTO VALORE DI t?

 


M
.


M

 


 

LA PROBABILITA' DI AVERE UN VALORE DI t

( IN UN TEST A DUE CODE ) DI -3.21 O MENO OPPURE +3.21 O PIU' E' 0.011 ( 1.1% ).

RIGETTIAMO LA NOSTRA IPOTESI NULLA.

CHE COSA SUCCEDE SE RITENIAMO CHE QUESTO CAMPIONE PROVIENE DA UNA POPOLAZIONE CON UN PESO MEDIO NOTO DI 39 GRAMMI?

 

 

 

 

 

 

 

LA PROBABILITA' DI AVERE UN VALORE DI t

( IN IN UN TEST A DUE CODE) DI -1.33 O MENO OPPURE +1.33 O PIU' E' 0.22 ( 22% ).

ACCETTIAMO LA NOSTRA IPOTESI NULLA.
 
 

IPOTESI PER UN TEST t SULLA MEDIA

IL CAMPIONE CASUALE VIENE SELEZIONATO DA UNA POPOLAZIONE I CUI VALORI SONO APPROSSIMATIVAMENTE DISTRIBUITI NORMALMENTE

 



 

 

 

SE DESIDERIAMO CONFRONTARE LE MEDIE DI DUE PICCOLI CAMPIONI IN MODO DA DETERMINARE SE C'E' UNA DIFFERENZA SIGNIFICATIVA POSSIAMO USARE LA SEGUENTE DISTRIBUZIONE:


M

I DUE CAMPIONI HANNO MEDIE CHE DIFFERISCONO IN MODO SIGNIFICATIVO AL 5% DI LIVELLO DI SIGNIFICATIVITA'?

M


 

 

 

 

 

 

 

 

 

 

 

 


M


M

 



 

 

 

 

 

 

 

 

PER CAPIRE IL SIGNIFICATO DEL 95% DI INTERVALLO DI CONFIDENZA PER LA DIFFERENZA NELLE MEDIE PARAMETRICHE STIMATE DAI DUE CAMPIONI FACCIAMO L’IPOTESI CHE:

1. CI SIA UNA DIFFERENZA NELLE MEDIE PARAMETRICHE DI -5.7  ( 36.000 - 41.700  )

2. UNA DEVIAZIONE PARAMETRICA STANDARD IN QUESTE DIFFERENZE DI 0.775  

3. LE DIFFERENZE SONO DISTRIBUITE NORMALMENTE


M

 

 

 

 

 

 

 

 

 

 

 

SE LE DIFFERENZE AVESSERO UNA DISTRIBUZIONE NORMALE, IL 96.7% DELLE DIFFERENZE MEDIE SI TROVEREBBE NEL RANGE DA -7.35 A -4.05.
.

-5.7 - 1.65 = -7.35

( E' SOLO UN CASO CHE QUESTO SIA UGUALE AL VALORE DI t)

-5.7 + 1.65 = -4.05

MA UNA DISTRIBUZIONE t E' PIU' AMPIA DI UNA NORMALE COSI' CI ASPETTEREMMO DI TROVARE UNA PERCENTUALE PIU' BASSA IN QUESTO RANGE DI UNA DISTRIBUZIONE t - INFATTI TROVIAMO IL 95%.

SE LE DIMENSIONI DEI NOSTRI CAMPIONI FOSSERO PIU' GRANDI,  IL RANGE DELLA DISTRIBUZIONE t E DI QUELLA NORMALE PER DIFFERENZE MEDIE AL 95% DI INTERVALLO DI CONFIDENZA SAREBBERO POCO DIVERSI.
.


 

 

 

 

 

 

 

 

 

 

 

LA NOSTRA IPOTESI NULLA AFFERMA CHE DOVREBBE ESSERCI DIFFERENZA 0 TRA LE MEDIE DEI DUE CAMPIONI - MA DIFFERENZA 0 SI TROVA FUORI DEL NOSTRO RANGE CHE VA DA -7.35 A -4.05.

LA PROBABILITA' DI AVERE UN VALORE t -7.35 O PIU' BASSO O +7.35 O PIU' ALTO SE LA DIFFERENZA MEDIA FOSSE VERAMENTE 0 E' COSI' BASSA CHE RISULTA 0 FINO ALLA QUARTA CIFRA DECIMALE!

P=0.0000
 

IPOTESI PER CONFRONTARE DUE LE MEDIE DI DUE POPOLAZIONI USANDO IL TEST t

1.  I DUE CAMPIONI SONO SELEZIONATI A CASO IN MODO INDIPENDENTE DALLE DUE POPOLAZIONI.

2. ENTRAMBE LE POPOLAZIONI HANNO UNA DISTRIBUZIONE APPROSSIMATIVAMENTE NORMALE.

3. LE VARIAZIONI DELLA POPOLAZIONE SONO QUASI UGUALI.

IL t TEST E' QUELLO CHE GLI STATISTICI CHIAMANO ROBUSTO - QUESTO SIGNIFICA CHE (SPECIALMENTE SE LE MISURE DEI CAMPIONI SONO GRANDI) I VINCOLI POSSONO ESSERE ABBASTANZA LARGHI E LE CONCLUSIONI BASATE SUL t TEST SARANNO ANCORA VALIDE.

E' POSSIBILE USARE IL t TEST PER CAMPIONI GANDI - SOLO CHE NON E' POSSIBILE USARE IL TEST z PER CAMPIONI DI PICCOLE DIMENSIONI.

 

 

 

 

 

UN TEST t PUO' ESSERE USATO CON OSSERVAZIONI ACCOPPIATE .

PER STUDIARE L'EFFETTO DEL COLORE DEL GUSCIO SULLA TEMPERATURA INTERNA DELLE LUMACHE, SONO STATE CONFRONTATE LUMACHE CON GUSCI GIALLI E MARRONI AVENTI PIU' O MENO LA STESSSA GRANDEZZA.

I GUSCI SONO STATI RIEMPITI DI MERCURIO, TENUTI ALLO STESSO LIVELLO DI LUMINOSITA',  E LA TEMPERATURA DEL MERCURIO E' STATA DETERMINATA DOPO UN CERTO INTERVALLO DI TEMPO.
 

 

 

 

 

 

 

 

 

 

GUSCI MARRONI 0C

GUSCI GIALLI 0C

DIFFERENZA

25.5

25.6

-0.1

27.5

27.8

-0.3

27.3

26.3

1.0

27.3

25.9

1.4

29.2

28.0

1.2

25.3

25.4

-0.1

26.4

25.6

0.8

28.5

28.9

-0.4

28.1

27.2

0.9

26.4

26.0

0.4

. USEREMO LA DISTRIBUZIONE t:

 

 

LA MEDIA DELLE DIFFERENZE VIENE DIVISA PER L'ERRORE STANDARD DELLE DIFFERENZE.

LA NOSTRA IPOTESI NULLA E' CHE LA DIFFERENZA MEDIA E' 0.
.

 m

N

MARRONE

GIALLO

DIF.

1

25,5

25,6

-0,1

2

27,5

27,8

-0,3

3

27,3

26,3

1

4

27,3

25,9

1,4

5

29,2

28

1,2

6

25,3

25,4

-0,1

7

26,4

25,6

0,8

8

28,5

28,9

-0,4

9

28,1

27,2

0,9

10

26,4

26

0,4

.


m
\

m


 

 

 

 

 

 

 

 

LA PROBABILITA' DI AVERE UN VALORE t INFERIORE A -2.28 O PIU' DI 2.28 E' DEL 4.8%.

RIGETTIAMO LA NOSTRA IPOTESI NULLA DI UNA DIFFERENZA 0 AL 5% DI LIVELLO DI SIGNIFICATIVITA’ 
 

IPOTESI PER UN TEST t ACCOPPIATO

LE DIFFERENZE t ACCOPPIATE SONO DISTRIBUITE APPROSSIMATIVAMENTE NORMALE.

 

IL t TEST E' PROBABILMENTE LA PROCEDURA STATISTICA PIU' AMPIAMENTE USATA IN BIOLOGIA

PROBABILMENTE E' ANCHE

QUELLA USATA PEGGIO!!

ECCO UN ERRORE COMUNE:

SUPPONIAMO DI AVERE TRE (O PIU') GRUPPI DI DATI:
 

A

B

C

2

2

2

3

2

5

3

3

3

1

1

2

.
CONFRONTIAMO I GRUPPI ESEGUENDO IL SEGUENTE TEST t:
.

A CONFRONTATO CON B
A CONFRONTATO CON C
B CONFRONTATO CON C

 

SUPPONIAMO CHE UN CERTO VALORE DI t (O PIU' GRANDE) HA UNA PROBABILITA' DEL 5% DI TROVARSI FUORI DAL 95% DI INTERVALLO DI CONFIDENZA.

LA PROBABILITA' CHE NON LO OTTERREMO PER CASO E' 0.95

I TRE CONFRONTI SONO EVENTI INDIPENDENTI COSI' CHE LA PROBABILITA' CHE NON LO OTTERREMO PER CASO 3 VOLTE E' 0.953 è 0.86.

COSI' NON STIAMO PIU' LAVORANDO CON LO STESSO INTERVALLO DI CONFIDENZA!!

CI SONO MODI VALIDI DI VALUTARE TRE O PIU' GRUPPI DI DATI - VEDREMO COME QUANDO STUDIEREMO LA ANALISI DELLA VARIANZA è ANOVA.
 
 

 

 

 

 


 

 

1. ECCO DUE CAMPIONI CON UN CERTO NUMERO DI NATI DALLA STESSA SPECIE IN DUE POSTI DIVERSI.
 
 

CAMPIONE 1

CAMPIONE 2

80

79

76

73

80

72

66

62

79

76

79

68

81

70

76

86

 

75

 

68

 

73

 

66

.
ESEGUITE UN TEST t PER VERIFICARE L'IPOTESI NULLA DI NESSUNA DIFFERENZA SIGNIFICATIVA TRA LE MEDIE AL 5% DI LIVELLO DI SIGNIFICATIVITA'.

SE UNA DELLE MEDIE E' PIU' GRANDE - ASSUMETE CHE SAPEVATE PRECEDENTEMENTE CHE POTEVA ESSERCI E FATE UN TEST t AD UNA CODA. 


2. DIECI TOPI SONO STATI PESATI PRIMA E DOPO UN TRATTAMENTO CON UN ORMONE.

ESEGUITE UN TEST t ACCOPPIATO PER DETERMINARE SE GLI ORMONI HANNO CREATO QUALCHE DIFFERENZA.  USATE IL 5% DI LIVELLO DI SIGNIFICATIVITA'.
 
 
 

 

 

PRIMA

DOPO

128

135

105

110

119

131

140

142

98

105

123

130

127

131

115

110

122

125

145

149

 

  1. USATE LA FORMULA PER t NEL TEST t ACCOPPIATO PER MOSTRARE CHE IL VALORE DI t PER I DATI DEI GUSCI DI LUMACA E' VERAMENTE 2.28.