LA DISTRIBUZIONE NORMALE

 

USEREMO UN ESEMPIO BIOLOGICO PER GENERARE UNA

DISTRIBUZIONE DI PROBABILITÀ NORMALE

LA PIÙ IMPORTANTE DISTRIBUZIONE DI PROBABILITÀ IN BIOMETRIA.

QUESTA DISTRIBUZIONE È LA FAMILIARE CURVA A FORMA DI CAMPANA.

PERCHÉ LA DISTRIBUZIONE NORMALE È COSÌ IMPORTANTE?

MOLTE VARIABILI BIOLOGICHE COME IL PESO, L’ALTEZZA, LA CONCENTRAZIONE DI ENZIMI, IL TEMPO DI REAZIONE, LA GRANDEZZA DEL BECCO DEI FRINGUELLI, ECC. DIPENDONO DALL’EFFETTO CUMULATIVO DI MOLTI FATTORI SIA AMBIENTALI CHE GENETICI.

CIASCUN FATTORE CONTRIBUISCE UN PO’ AL VALORE DELLA VARIABILE.

VARIABILI COME QUESTA DI SOLITO POSSONO ESSERE MODELLATE DA UNA DISTRIBUZIONE NORMALE PROPRIO COME NELLE PROPORZIONI DI SESSO BASATI SOLO SU DUE STATI– MASCHIO O FEMMINA – POSSONO ESSERE MODELLATI DA UNA DISTRIBUZIONE BINOMIALE.

VEDREMO COME UNA DISTRIBUZIONE NORMALE PUÒ ESSERE GENERATA DAGLI EFFETTI CUMULATIVI DI MOLTI FATTORI.

ASSUMIAMO CHE C’È UN GENE CHE DETERMINA L’ALTEZZA DI UN ANIMALE.

CIASCUN ALLELE a AGGIUNGE 1 cm ALL’ALTEZZA E CIASCUN ALLELE A AGGIUNGE 2 cm.

GENOTIPO

Altezza cm

AA

4

Aa

3

aa

2

STABILIAMO CHE LE FREQUENZE DEI GENI

A E a NELLA POPOLAZIONE SIANO 0.5.

CON UNA FECONDAZIONE CASUALE SI OTTERRANNO I GENOTIPI

SPERMA

UOVO

GENOTIPO

ALTEZZA

A

A

AA

4

A

a

Aa

3

a

A

Aa

3

a

a

aa

2

LA PROBABILITA’ DEI GENOTIPI AA, Aa, E aa SONO 0.25, 0.5, E 0.25.

QUESTE SONO ANCHE LE FREQUENZE DELLE ALTEZZE 2, 3, E 4 cm.

 

L’ISTOGRAMMA E’ LO STESSO (AD ECCEZIONE DELLA SCALE SULL’ASSE DELLE X) DELLA DISRIBUZIONE BINOMIALE CHE DESCRIVEREBBE DUE LANCI DI UNA MONETA EQUA.

ORA AGGIUNGIAMO UN ALTRO GENE INDIPENDENTE CHE CONTRIBUISCE ALL’ALTEZZA ALLO STESSO MODO.

GENOTIPO

ALTEZZA (cm)

AABB

8

AaBB

7

aaBB

6

AABb

7

AaBb

6

aaBb

5

AAbb

6

Aabb

5

aabb

4

STABILIAMO CHE LE FREQUENZE DEI GENI DI B E b NELLA POPOLAZIONE SONO 0.5

SE LA PROBABILITA’ DI AA E’ 0.25 E QUELLA DI Bb E’ 0.5, PER GENI INDIPENDENTI LA PROBABILITA’ DI AABb E’ 0.25 × 0.5 OPPURE 0.125.

A

B

C

D

E

F

G

H

1

Frequ. A

Frequ. B

Frequ.Genotipo

Altezza

Altezza

Frequen.

2

AA

BB

0,250

0,250

0,0625

8

4

0,0625

3

AA

Bb

0,250

0,500

0,125

7

5

0,250

4

AA

bb

0,250

0,250

0,0625

6

6

0,375

5

Aa

BB

0,500

0,250

0,125

7

7

0,250

6

Aa

Bb

0,500

0,500

0,25

6

8

0,0625

7

Aa

bb

0,500

0,250

0,125

5

8

aa

BB

0,250

0,250

0,0625

6

9

aa

Bb

0,250

0,500

0,125

5

10

aa

bb

0,250

0,250

0,0625

4

11

ABBIAMO UNA DISTRIBUZIONE BINOMIALE BASATA SU UNA COMBINAZIONE DI QUATTRO FATTORI (A, a, B, b).

VEDIAMO ORA LA DISTRIBUZIONE DI FREQUENZA PER 100 LANCI DI UNA MONETA EQUA

LA DISTRIBUZIONE DELL’ALTEZZA CHE COMPRENDE 50 GENI COMBINATI INDIPENDENTEMENTE CON DUE ALLELI E’ UGUALE ALL’ALTRA – AD ECCEZIONDELL’ASSE X CHE ANDREBBE DA 100 A 200cm.MAN MANO CHE AUMENTA IL NUMERO DI GENI COMBINATI INDIPENDENTEMENTE CHE HANNO A CHE FARE CON LA DETERMINAZIONE DELL’ALTEZZA, LA CURVA SI AVVICINA ALLA CURVA A FORMA DI CAMPANA TIPICA DELLA DISTRIBUZIONE NORMALE.QUINDI L’EFFETTO CUMULATIVO DI MOLTI GENI DIVERSI E’ DI PORTARE A UNA DISTRIBUZIONE NORMALE.

UNA DISTRIBUZIONE NORMALE E BINOMIALE AVVRANNO PROBABILITA’ MOLTI SIMILI PER UN CAMPO DI VALORI MAN MANO CHE IL NUMERO DI PROVE (ES. GENI) NELLA DISTRIBUZIONE BINOMIALE AUMENTA.L’ESEMPIO CHE SEGUE MOSTRA LA

DIFFERENZA CHE C’E’ TRA UNA CURVA NORMALE E UNA DISTRIBUZIONE BINOMIALE CON p=0.5, n=25 PROVE, MEDIA= n× p =12.5,

E DISTRIBUZIONE NORMALE CON MEDIA E DEVIAZIONE STANDARD UGUALI.

Teste

BINOMIALE

NORMALE

0

2,98023E-08

5,94688E-07

1

7,45058E-07

4,05634E-06

2

8,9407E-06

2,35772E-05

3

6,85453E-05

0,000116779

4

0,000376999

0,000492888

5

0,001583397

0,001772739

6

0,005277991

0,005433188

7

0,014325976

0,014189837

8

0,032233447

0,031580063

9

0,0608854

0,059890986

10

0,097416639

0,09678829

11

0,132840872

0,133289841

12

0,154981017

0,156417078

13

0,154981017

0,156417078

14

0,132840872

0,133289841

15

0,097416639

0,09678829

16

0,0608854

0,059890986

17

0,032233447

0,031580063

18

0,014325976

0,014189837

19

0,005277991

0,005433188

20

0,001583397

0,001772739

21

0,000376999

0,000492888

22

6,85453E-05

0,000116779

23

8,9407E-06

2,35772E-05

24

7,45058E-07

4,05634E-06

25

2,98023E-08

5,94688E-07

COME SI PUO’ VEDERE LA DIFFERENZA NON ECCEDE L’1.5 PER MILLE E MANO A MANO CHE AUMENTA IL NUMERO DI CASI LA DIFFERENZA TENDE A ZERO >>è LA DISTRIBUZIONE BINOMIALE TENDE A QUELLA NORMALE

 

 

 

 

VEDIAMO ORA DI ANALIZZARE IL GRAFICO DI UNA CURVA DI DISTRIBUZIONE NORMALE CON MEDIA 0 E UNA DEVIAZIONE STANDARD DI 30.

 

 

f(x) E’ IL VALORE DELLA DISTRIBUZIONE NORMALE PER UN PARTICOLARE VALORE DI x. IN GERGO STATISTICO f(x) E’

LA DENSITA’ DI PROBABILITA’ DELLA DISTRIBUZIONE CONTINUA IN ESAME.

DENSITA’ DI PROBABILITA’ DELLA DISTRIBUZIONE NORMALE

QuestO integrale definitO SERVE A CALCOLARE L’AREA SOTTO LA CURVA DI DENSITA’ DI PROBABILITA’ E RAPPRESENTA LA PROBABILITA’ PER EVENTI CONTINUI CHE UN CERTO EVENTO CAPITI AD ESEMPIO NELL’INTERVALLO – 60 ¸ + 60

PER QUANTO CONCERNE GLI INTEGRALI IN SINTESI CIO’ CHE OCCORRE SAPERE E’ CHE:

  1. f(x) E’ LA FORMULA PER LA DISTRIBUZIONE NORMALE O CURVA A FORMA DI CAMPANA.
  2. TRA I VALORI – 60 E + 60 SULLA ASSE DELLE x ABBIAMO IL 95.4% DELL’AREA SOTTO LA CURVA CHE RAPPRESENTA LA PROBABILITA’ CHE UN EVENTO SI PRESENTI NELL’INTERVALLO COMPRESO ENTRO I LIMITI DELL’AREA (ES.x1=-60¸ x2=+60) CHE SI STA VALUTANDO. VALORI DIVERSI DAREBBERO UNA PROBABILITA’ DIVERSA.

 

IL PRIMO INTEGRALE DEFINITO CI DA’ L’AREA TOTALE SOTTO LA CURVA DA UN VALORE x DI –1000 AD UN VALORE DI +1000

IL GRAFICO SI ESTENDE ALL’INFINITO IN ENTRAMBE LE DIREZIONI MA E’ COSI’ VICINO ALL’ASSE DELLE x CHE QUALUNQUE CONTRIBUTO ALLA SUA ZONA OLTRE –1000 A 1000 E’ COSI’ PICCOLO CHE PUO’ ESSERE IGNORATO.

INFATTI MOSTRIAMO SOLO IL GRAFICO DA

–100 A + 100 E ANCHE IN QUESTO CAMPO L’AREA SOTTO LA CURVA E’ PRATICAMENTE UGUALE AD 1.

IL SECONDO INTEGRALE DEFINITO MOSTRA CHE LA PROBABILITA’ DI AVERE UN VALORE DA –60 A +60 E’ 0.954. QUEST’ULTIMA RAPPRESENTA L‘AREA SOTTO ALLA CURVA TRA –60 E +60.

POICHE’ L’AREA TOTALE E’ 1, VEDIAMO CHE IL 95.4% DELLA ZONA SOTTO IL GRAFICO E’ COMPRESA TRA PIU’ O MENO DUE DEVIAZIONI STANDARD DALLA MEDIA (RICORDIAMO CHE LA NOSTRA DEVIAZIONE STANDARD ERA 30).

L’ULTIMO INTEGRALE DEFINITO MOSTRA PERCHE’ LE PROBABILITA’ DI x NON SONO UN NUMERO SPECIFICO COME 19. IL PUNTO CHE RAPPRESENTA 19 E’ INFINITAMENTE PICCOLO E LA ZONA AL DI SOPRA DI QUESTO PUNTO E’ 0.

NON COMMETTETE L’ERRORE DI LEGGERE SULL’ASSE DELLE y E DETERMINARE CHE LA PROBABILITA’ DI AVERE 20 E’ 0.0105.

RICORDATE CHE x ORA E’ UNA VARIABILE CONTINUA COME IL PESO E NON UNA VARIABILE DISRETA COME IL NUMERO DI MASCHI SU 1000 NASCITURI.

 

QUANDO VOLETE TROVARE LA PROBABILITA’ DI UN EVENTO IN UNA DISTRIBUZIONE BINOMIALE – LEGGETE SULL’ASSE DELLE y

 

QUANDO VOLETE TROVARE LA PROBABILITA’ DI UN EVENTO IN UNA DISTRIBUZIONE NORMALE – CONSIDERATE L’AREA (SOTTO) UNA PORZIONE DEL GRAFICO.

RIPORTIAMO AD ESEMPIO TRE DISTRIBUZIONI NORMALI CON PARAMETRI DIVERSI:

CURVA

MEDIA

DEVIAZIONE STANDARD

ROSSO

0

30

BLU

20

40

NERO

0

15

 

In ogni grafico il 95.4% della zona inferiore si trova tra più O meno duE deviazioni standard dalla media.

L’INTEGRALE TRA – 60 E +100 SI RIFERISCE AL GRAFICO CON UNA MEDIA DI 20 E LA DEVIAZIONE STANDARD DI 40.

SE LA MEDIA E’ 20 AGGIUNGENDO 2 DEVIAZIONI STANDARD è 2 × 40 = 80 A 20 SI OTTIENE COME LIMITE SUPERIORE PER L’INTEGRALE + 100 E TOGLIENDO DUE DEVIAZIONI STANDARD SI OTTERRA’ COME LIMITE INFERIORE è 20 - 80= - 60.

ORA E’ POSSIBILE VEDERE COME I DUE PARAMETRI MEDIA E DEVIAZIONE STANDARD INFLUENZANO LA DISTRIBUZIONE NORMALE:

LA MEDIA STABILISCE IL MASSIMO DELLA CURVA RELATIVA ALL’ASSE DELLE x.

LA DEVIAZIONE STANDARD INFLUENZA LA FORMA DELLA CURVA – QUANTO PIU’ GRANDE E’ LA DEVIAZIONE PER UNA DATA MEDIA, TANTO PIU’ PIATTA E’ LA CURVA.

INDIPENDENTEMENTE DALLA POSIZIONE DEL MASSIMO DELLA CURVA O DALLA MISURA DELLA DEVIAZIONE STANDARD, L’AREA AL DI SOTTO DELLA CURVA E’ SEMPRE 1 (100).

 

 

 

 

 

COMPITI

  1. TRE GENI COMBINATI INDIPENDENTEMENTE (A B C) DETERMINANO IL PESO. L’ALLELE DOMINANTE DI CIASCUN GENE (A B C) AGGIUNGE 5 CHILI E CIASCUN ALLELE RECESSIVO (a b c )AGGIUNGE 2.5 CHILI.
  2. FARE L’ISTOGRAMMA DI FREQUENZA DELLA DISTRIBUZIONE DEL PESO IN UNA POPOLAZIONE INFINITAMENTE GRANDE ACCOPPIATA IN MANIERA CASUALE IN CUI LA FREQUENZA DI CIASCUN ALLELE DOMINANTE E DI CIASCUN ALLELE RECESSIVO E’ 05.

  3. SPIEGARE LA DIFFERENZA TRA UNA DISTRIBUZIONE DI PROBABILITA’ DISCRETA E UNA CONTINUA.
  4. DARE UN ESEMPIO SPECIFICO PER CIASCUNA DI ESSE.

    COME SI CALCOLA LA PROBABILITA’ DI UN EVENTO IN CIASCUNA DI ESSE?

  5. NON C’E’ BISOGNO DI MEMORIZZARE L’EQUAZIONE DELLA DISTRIBUZIONE NORMALE MA DOVRESTE ESSERE IN GRADO DI RICONOSCERLA QUANDO LA INCONTRATE, SAPERE COSA INDICANO I SIMBOLI NELLA FORMULA E CONOSCERE QUALI PARAMETRI DELLA POPOLAZIONE HANNO UN INFLUENZA SU DI ESSA E COME.