TEST z PER LA DIFFERENZA TRA LE MEDIE DI DUE POPOLAZIONI USANDO GRANDI CAMPIONI

 

LE MEDIE DEI GRANDI CAMPIONI DOVREBBERO ESSERE PIUTTOSTO VICINE ALLA MEDIA PARAMETRICA.

SECONDO IL TEOREMA DEL LIMITE CENTRALE, LE MEDIE DOVREBBERO MOSTRARE UNA DISTRIBUZIONE NORMALE ANCHE SE I VALORI INDIVIDUALI NELLA POPOLAZIONE NON SONO DISTRIBUITI NORMALMENTE.

PRENDIAMO DUE GRANDI CAMPIONI DELLA STESSA DIMENSIONE (PER ES. 250 ) DALLA STESSA POPOLAZIONE.

SOTTRAIAMO LA MEDIA DEL PRIMO CAMPIONE DA QUELLA DEL SECONDO

ESEGUIAMO RIPETUTAMENTE L’OPERAZIONE E RIPORTIAMO LE DIFFERENZE TRA LE MEDIE SULL'ASSE DELLE X E LA FREQUENZA DI QUESTE DIFFERENZE SULL'ASSE DELLE Y.

LE DIFFERENZE MOSTRERANNO UNA DISTRIBUZIONE NORMALE CON UNA MEDIA 0

 

I CAMPIONI VENGONO PRESI DALLA STESSA POPOLAZIONE -  COSI' OGNI VOLTA CHE LA PRIMA MEDIA E' PIU' GRANDE CI DOVREBBE ESSERE UNA VOLTA IN CUI E' PIU' PICCOLA.

STABILIAMO CHE LA PIU' GRANDE MEDIA POSSIBILE SIA 10 (IL VALORE PIU' ALTO NELLA POPOLAZIONE - TUTTI I 250 DATI NEL CAMPIONE SONO 10) E LA PIU' PICCOLA 1 (IL PIU' BASSO VALORE NELLA POPOLAZIONE - TUTI I 250 DATI NEL CAMPIONE SONO 1).
 
 

PRIMA MEDIA

SECONDA MEDIA

DIFFERENZA

10

1

1 - 10 = -9

1

10

10 - 1 =  9


LA SERIE DELLE MEDIE DEI CAMPIONI VA DA 1 A 10 

( 10 - 1 = 9 ).

IL RANGE DELLE DIFFERENZE TRA LE MEDIE VA DA -9 A  9.   (9 - [-9] = 18)

 

 

 

L'ERRORE PARAMETRICO STANDARD DI CAMPIONI DI 250 SAREBBE:

 

POICHE' LA DIFFERENZA TRA LE MEDIE HA UN "RANGE" DOPPIO, E' RAGIONEVOLE PENSARE CHE L'ERRORE PARAMETRICO STANDARD DELLA DIFFERENZA TRA LE MEDIE E':

 

L'ERRORE STANDARD QUI E' LA DEVIAZIONE STANDARD DELLA DIFFERENZA TRA LE MEDIE.

QUANDO ABBIAMO UNA MEDIA DI 0 E QUANDO DIVIDIAMO I VALORI PER LA

 

DEVIAZIONE STANDARD OTTENIAMO UNO SCARTO RIDOTTO z

QUINDI QUESTO DA ANCHE UNA DISTRIBUZIONE z:

SE I CAMPIONI VENGONO VERAMENTE DALLA STESSA POPOLAZIONE CI ASPETTIAMO CHE LA MEDIA DELLE DIFFERENZE DI MEDIE SIA 0
 

SE CONOSCESSIMO LA MEDIA PARAMETRICA AVREMMO LA SEGUENTE FORMULA:

 

 

IL DENOMINATORE HA QUESTO ASPETTO, ANCHE SE C'E' UNA DIFFERENZA DI MEDIE NEL NUMERATORE, PERCHE' IL "RANGE" ORA NON POTREBBE MAI ESSERE PIU' DI 9 POICHE' CONOSCIAMO LA MEDIA PARAMETRICA.

SUPPONIAMO CHE CON UN LIVELLO BASSO DI 1 E UN LIVELLO ALTO DI 10 LA MEDIA PARAMETRICA SIA 5.5.

1 - 5.5 = -4.5

10 - 5.5 = 4.5

RANGE = 9

 
 
PRENDIAMO DUE CAMPIONI DI PESI DI 150 ORGANISMI CIASCUNO PROVENIENTE DA DUE AREE DIVERSE DEL CAMPO

TESTIAMO L'IPOTESI NULLA:  NON C'E' NESSUNA DIFFERENZA SIGNIFICATIVA TRA LE LORO MEDIE.

 

 

 

 

 

I LORO PESI IN GRAMMI:

campione 1

14,7

11,1

10,5

10,3

16,8

9,4

13,8

11,4

10,2

11,7

15,1

9,1

9,1

11,6

11,8

13,2

10,4

13

12

12,7

14,3

13,1

11,8

14

9

10,5

11,8

16,9

14,1

12,7

10,8

9,1

8,5

14,5

15,1

12,4

13

15,2

9,3

13,8

10,1

12

10,2

7,9

9,7

10,3

14,8

12,5

12,8

9,7

10,8

12,3

9

11,5

11,7

17,3

12,7

11

11,3

8,2

11,1

13,6

11,6

11

12

11,5

17,1

10,2

9,6

14

12

14,9

12,8

16,5

14,2

13,8

13,7

10,6

14,8

9,3

9,6

14,7

11,7

10,6

11,1

12,3

13

10,6

11,3

10,9

13,9

12,1

14,6

14,4

8,9

9,7

10,1

10,1

13,5

11,1

12,1

11,6

13,2

12,2

9,4

12,3

12,1

18,2

12,1

11,6

14,9

14,6

11,4

17

11,4

12,4

14,1

13,6

10,4

14,6

13,1

14,4

9,6

11,2

13

10,8

10,8

8,5

11,3

13,3

10,9

8,9

13,4

9,9

10,7

11

11

11

10,9

12,4

 

 

 

campione 2

15,2

13

11,2

12,6

11,9

16,6

16,4

15,9

11,7

11,6

17,5

16

17,7

16,3

15,7

12,4

15,7

16,2

18,9

13,5

16,3

17,1

13,8

18,2

13,5

16,4

13,6

14,3

12,1

19,1

15,9

10,3

15,4

13,9

15,6

10,9

14,5

11,5

11

16,4

17,5

18,3

16,3

10,8

12,8

18,7

13,2

12,7

13,1

13,3

15,2

13

13,7

11,2

12

9,5

10,8

17,6

13,2

10,5

17,5

10,5

14,3

18,2

17,1

14

14,3

12,7

10

17,1

15,9

15,2

11,7

12,3

15

13,9

17,5

16,4

14,4

18,6

14,3

10,5

13,8

16,1

12,5

1,5

12,4

14,8

13,5

7,8

11,8

13,5

13,5

14,4

13,5

13,5

12,3

13

15,7

9,9

12,2

13,4

15,4

11,8

13,9

14,5

14,3

16,1

19,3

16,5

12,1

15,3

16,3

9,3

17,1

17,3

10,2

14,2

13

16,9

13

12

11,6

12,2

10,7

16,9

12,2

14,1

17,5

13,1

10,2

13,6

19,2

13,6

11,4

15,9

15,2

6,3

13,3

11,2

17,4

11,2

16

13,9

10,5

12,5

12,7

14,9

16,8

13,2

14,6

12,3

10

19,4

15,3

 

 

 
 

STATISTICA DECRITTIVA:

Variabile

N

Media

Mediana

Media Tron.

Dev. St.

Er.St.Med.

Camp.1

150

12,053

11,769

11,984

2,074

0,169

Camp.2

150

14,057

13,829

14,058

2,528

0,205

Variabile

Minimo

Massimo

Q1

Q3

Camp.1

7,179

18,237

20,615

13,559

Camp.2

6,348

19,411

22,219

15,966


SE PROVENGONO DA POPOLAZIONI CON LA STESSA MEDIA ACCETTIAMO CHE IL 95% DEGLI SCARTI RIDOTTI z

 

 

SIA COMPRESO TRA ± 1.96.

POICHE' NON CONOSCIAMO LA VARIAZIONE PARAMETRICA DOBBIAMO USARE LE STIME DELLE DEVIAZIONI STANDARD PARAMETRICHE OTTENUTE DAI CAMPIONI: M

 

 

PRENDENDO I NOSTRI VALORI DALLE STATISTICHE DESCRITTIVE:

 

 

 

 

 

 

 

IL VALORE z SI TROVA MOLTO AL DI FUORI DELL’INTERVALLO DI CONFIDENZA DEL 95% COSI' POSSIAMO RIGETTARE L'IPOTESI NULLA E POSSIAMO CONCLUDERE CHE I DUE CAMPIONI NON PROVENGONO DA POPOLAZIONI CON LA STESSA MEDIA.
   

VINCOLI PER TEST z CON GRANDI CAMPIONI NELL'IPOTESI CHE DUE MEDIE PROVENGONO DA POPOLAZIONI CON LA STESSA MEDIA 

  1. I DUE CAMPIONI SONO STATI SELEZIONATI CASUALMENTE IN MODO INDEPENDENTE DALLE DUE POPOLAZIONI

2.  LE DIMENSIONI DEI CAMPIONI DEVONO ESSERE GRANDI ABBASTANZA ( n ³ 30 ) COSI’ CHE LE MEDIE SONO VICINE AD UNA DISTRIBUZIONE NORMALE. 

3.  LE DIMENSIONI DEI CAMPIONI SONO ABBASTANZA GRANDI ( n => 30 ) COSI' CHE LA DEVIAZIONE STANDARD DEL CAMPIONE E' UNA BUONA APPROSSIMAZIONE DELLA DEVIAZIONE STANDARD PARAMETRICA.
 


 

TEST z E PROPORZIONI

SE PRENDIAMO CAMPIONI DA DUE POPOLAZIONI DI UNA CERTA SPECIE E LA GRANDEZZA DI CIASCUN CAMPIONE E' 1000, ECCO COSA OTTENIAMO:
 

POPOL. 1

546 M

454 F

POPOL. 2

475 M

525 F


C'E' UNA DIFFERENZA SIGNIFICATIVA TRA LE PROPORZIONI DI MASCHI E FEMMINE NELLE DUE POPOLAZIONI AL 5% DI LIVELLO DI SIGNIFICATIVITA?

CONSIDERIAMO LA POPOLAZIONE 1.

LA PROBABILITA' DI AVERE UN MASCHIO E' 546/1000 O 0.546.  LA PROBABILITA' DI AVERE UNA FEMMINA E' 454/1000 O 0.454.

ABBIAMO UNA SITUAZIONE DI TIPO DISTRIBUZIONE BINOMIALE CON DUE POSSIBILI RISULTATI E UNA DATA PROBABILITA' PER CIASCUNO DI ESSI.

 

 

 

RICORDIAMOCI CHE IN UNA DISTRIBUZIONE BINOMIALE IL NUMERO PREVISTO (MEDIA) DEL RISULTATO CON PROBABILITA' p E':

np E LA DEVIAZIONE STANDARD E' Ö npq

PER CONTROLLARE CHE QUESTE FORMULE FUNZIONANO, CONSIDERIAMO DUE LANCI DI UNA MONETA EQUA.
   
 

RISULTATI

Num. T

TT

2

TC

1

CT

1

CC

0

 

IL NUMERO MEDIO DI TESTE =

1/4× 2 + 1/2× 1 + 1/4× 0 = 1 = np = 2× 1/2 = 1
 

 

 

 

 

 

DEVIAZIONE STANDARD:
 

 

 

 

 

 

 

 

LA DIFFERENZA TRA DUE PROPORZIONI DI

CAMPIONI PRESI DALLA STESSA POPOLAZIONE AVRA' LA DISTRIBUZIONE A z BASATA SULLA MEDIA E LA DEVIAZIONE STANDARD DI UNA DISTRIBUZIONE BINOMIALE.

 

 

 


TESTIAMO L'IPOTESI NULLA CHE LA PROPORZIONE DI MASCHI SIA LA STESSA NEI DUE CAMPIONI SEGUENTI:
 

POPOL. 1

546 M

454 F

POPOL. 2

475 M

525 F


 

 

 


 
 

 

 

CON UN VALORE z DI 3.184, RIGETTIAMO L'IPOTESI NULLA CHE NON C'E' NESSUNA DIFFERENZA IN PROPORZIONE AL 5% DI LIVELLO DI SIGNIFICATIVITA’.
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


 

 

1. NELL'ESEMPIO CON 150 PESI PER CIASCUN CAMPIONE, QUAL E' LA DIFFERENZA TRA LE MEDIE CHE CI CONSENTIREBBE DI ACCETTARE L'IPOTESI NULLA CON UN LIVELLO DI SIGNIFICATIVITA’ AL 5%, CON UN LIVELLO DI SIGNIFICATIVITA’ AL 10%?, CON UN LIVELLO DI SIGNIFICATIVITA’ AL 1%?

SUGGERIMENTO - DATE UN VALORE SPECIFICO A z E RISOLVETE PER LA DIFFERENZA TRA LE MEDIE

SE LA DIMENSIONE DEL CAMPIONE E' AUMENTATA FINO A 500.  QUAL E' LA MINIMA DIFFERENZA TRA LE MEDIE CHE CI CONSENTIREBBE DI ACCETTARE L'IPOTESI NULLA AD UN LIVELLO DI SIGNIFICATIVITA’ DEL 5%?

MANTENETE LA DIMENSIONE DEL CAMPIONE A 150 MA RADDOPPIATE LA DEVIAZIONE STANDARD - QUAL E' ORA LA MINIMA DIFFERENZA TRA LE MEDIE CHE CI CONSENTIREBBE DI ACCETTARE L'IPOTESI

 

NULLA AD UN LIVELLO DI SIGNIFICATIVITA’ DEL 5%?

A QUALI CONCLUSIONI POSSIAMO GIUNGERE SULLA BASE DI TUTTI QUESTI RISULTATI PER QUANTO RIGUARDA L'INFLUENZA DELLA DIMENSIONE DEL CAMPIONE E LA DEVIAZIONE STANDARD SUL LIVELLO DI SIGNIFICATIVITA’?

2. LE PROPORZIONI DI PIANTE NANE ED ALTE NELLE DUE POPOLAZIONI P1 E P2 SONO DIVERSE AD UN LIVELLO DI SIGNIFICATIVITA’ DEL 5%?
 

P 1

123 ALTE

82 NANE

P 2

278 ALTE

105 NANE