background image

METODY STATYSTYCZNE W BIOLOGII 

1.  

Wykład wstępny 

 

 

 

 

2.  Populacje 

i próby danych

 

 

 

3.  

Testowanie hipotez i estymacja parametrów 

4.  

Planowanie eksperymentów biologicznych 

5.  

Najczęściej wykorzystywane testy statystyczne I 

6.  

Najczęściej wykorzystywane testy statystyczne II 

7.  Regresja liniowa 

 

 

 

 

8.  Regresja nieliniowa 

 

 

9.  

Określenie jakości dopasowania równania regresji liniowej i nieliniowej 

10.  Korelacja 

11.  Elementy statystycznego modelowania danych 

12.  

Porównywanie modeli 

13.  Analiza wariancji 

14.  Analiza kowariancji 

15.  

Podsumowanie materiału, wspólna analiza przykładów, dyskusja 

Copyright ©2011, Joanna Szyda  

background image

WSTĘP 

1. Test F 

2. Test Kruskala-Wallisa 

3. Test 

c

Zakres stosowania 

Definicja 

Przykład 

Copyright ©2011, Joanna Szyda  

background image

WSTĘP 

 

PRÓBA DANYCH 

 

 

HIPOTEZY 

 

 

TEST 

 

Copyright ©2011, Joanna Szyda  

background image

TEST  F 

background image

TEST F - ZAKRES STOSOWANIA 

1.

Porównanie zmienności, różnice pomiędzy wieloma 
próbami danych 

2.

Dane ciągłe 

3.

Rozkład normalny 

4. Warianty testu: 

Analiza wariancji  one-way ANOVA  

 

 

Regresja

 

2

2

0

:

e

A

H

Copyright ©2011, Joanna Szyda  

background image

Copyright ©2010, Joanna Szyda  

TEST F - ANALIZA WARIANCJI 

PRÓBA DANYCH 

1.

Zawartość azotu w trzcinie 
(% suchej masy) 

2. 3 lokalizacje (A, B, C), pomiar 

w 1996 r. 

3. Flowermere, hrabstwo 

Cambridge

 

3.06 

3.41 

2.92 

2.60 

3.23 

2.88 

2.55 

3.93 

3.25 

2.42 

3.74 

2.64 

2.35 

3.18 

3.28 

Copyright ©2011, Joanna Szyda  

background image

1.

Określenie hipotez H

0

 i H

 

H

0

: nie ma różnic w zawartości azotu pomiędzy lokalizacjami          

H

1

: lokalizacje wpływają na zawartość azotu 

   

 

 

H

0

:  N

A

 = N

= N

C

    

lub  

 

 

 

 

 

H

1

:  N

A

 

 N

 N

C   

lub 

2.

Ustalenie poziomu istotności

 

 

MAX 

= 0.05 

3.

Wybór i obliczenie wartości   

 

 

        

testu statystycznego: 

2

e

2

lok

2

e

2

lok

g

N

1

i

n

1

j

2

i

ij

g

N

1

i

2

i

i

N

N

y

y

1

N

y

y

n

F

g

i

g



TEST F - ANALIZA WARIANCJI 

Copyright ©2011, Joanna Szyda  

background image

3.

Wybór i obliczenie wartości testu statystycznego 

4.

Określenie rozkładu testu:  

g

g

N

N

,

1

N

F

~

5.

Obliczenie wartości 

t

00139

.

0

t

6. Decyzja: 

t

 < 

max 

 

 

 

H

0

 

H

 

lokalizacje wpływają na zawartość azotu w suchej masie 
trzciny 

95

.

11

3

15

03

.

1

1

3

04

.

2

N

N

y

y

1

N

y

y

n

F

g

N

1

i

n

1

j

2

i

ij

g

N

1

i

2

i

i

g

i

g



Excel: przykład 

Copyright ©2011, Joanna Szyda  

TEST F - ANALIZA WARIANCJI 

background image

TEST F - ZAKRES STOSOWANIA 

1.

Porównanie zmienności, różnice pomiędzy wieloma 
próbami danych 

2.

Dane ciągłe 

3.

Rozkład normalny 

4. Warianty testu: 

Analiza wariancji   

 

 

Regresja 

regression 

 

 

H

0

 = 0

 

Copyright ©2011, Joanna Szyda  

background image

Copyright ©2011, Joanna Szyda  

PRÓBA DANYCH 

1.

Masa ciała [kg] i grubość tkanki 
tłuszczowej [mm] 

2.

10 osób dorosłych, różnej płci, tej 
samej rasy

 

MASA 
CIAŁA 

ZAW. 
TŁUSZCZU 

89 

28 

88 

27 

66 

24 

59 

23 

93 

29 

73 

25 

82 

29 

77 

25 

100 

30 

67 

23 

TEST F - REGRESJA 

background image

Copyright ©2011, Joanna Szyda  

1.

Określenie hipotez H

0

 i H

 

H

0

: grubość tkanki tłuszczowej nie zależy od masy ciała            

H

1

: grubość tkanki tłuszczowej zależy od masy ciała 

  

H

0

:  

1

 = 0     

 

 

 

 

 

 

 

H

1

:  

1

 

 0 

2.

Ustalenie poziomu istotności

 

 

MAX 

= 0.05 

3.

Wybór i obliczenie wartości   

 

 

        

testu statystycznego: 

N

N

y

y

N

y

y

F

N

i

i

i

N

i

i

1

2

1

2

ˆ

1

ˆ

TEST F - REGRESJA 

background image

Copyright ©2011, Joanna Szyda  

TEST F - REGRESJA 

3.

Wybór i obliczenie wartości testu statystycznego 

4.

Określenie rozkładu testu:  

N

N

N

F

,

1

~

5.

Obliczenie wartości 

t

000096

.

0

t

6. Decyzja: 

t

 < 

max 

 

 

 

H

0

 

H

 

grubość tkanki tłuszczowej zależy od masy ciała 

3

.

51

2

10

08

.

9

1

2

25

.

58

ˆ

1

ˆ

1

2

1

2

N

N

y

y

N

y

y

F

N

i

i

i

N

i

i

Excel: przykład 

background image

TEST KRUSKALA-WALLISA

 

background image

Copyright ©2011, Joanna Szyda  

TEST KRUSKALA-WALLISA - ZAKRES STOSOWANIA 

1.

Porównanie zmienności, różnice pomiędzy 
wieloma próbami danych  

2.

Dane ciągłe lub porządkowe (rangi) 

3.

Dane nie pochodzą z rozkładu normalnego 

4. Analiza wariancji 

background image

Copyright ©2011, Joanna Szyda  

PRÓBA DANYCH 

1.

Wzrost dorosłych kobiet w USA 

2.

3 przedziały wiekowe 

TEST KRUSKALA-WALLISA 

20-29 

30-39 

40-49 

161.925 

164.465 

173.990 

173.355 

171.450 

175.260 

158.115 

173.355 

167.640 

170.815 

175.260 

166.370 

179.705 

164.465 

168.910 

background image

Copyright ©2011, Joanna Szyda  

1.

Określenie hipotez H

0

 i H

 

H

0

wzrost kobiet jest jednakowy w każdym p. wiekowym            

H

1

wzrost kobiet różni się w zależności od p. wiekowego 

  

H

0

:   

     

 

 

 

 

 

 

 

H

1

:   

2.

Ustalenie poziomu istotności

 

 

MAX 

= 0.05 

3.

Wybór i obliczenie wartości   

 

 

        

testu statystycznego: 

TEST KRUSKALA-WALLISA 

2

2

e

wiek

2

2

e

wiek

2

1

2

1

~

1

12

A

A

N

i

N

i

i

R

R

n

N

N

H

c

liczba obserwacji 

liczba grup 

śr. ranking obserwacji 
w grupie 

śr. ranking wszystkich obs. 

R

R

N

N

i

A

background image

Copyright ©2011, Joanna Szyda  

3.

Wybór i obliczenie wartości testu statystycznego 

4.

Określenie rozkładu testu:  

2

1

3

~

c

5.

Obliczenie wartości 

t

0398

.

0

t

6. Decyzja: 

t

 < 

max 

 

 

 

H

0

 

H

 

wzrost dorosłych kobiet różni się w poszczególnych 
przedziałach wiekowych 

TEST KRUSKALA-WALLISA 

 

45

.

6

8

8

5

8

8

5

8

2

.

7

5

1

15

15

12

1

12

2

2

2

2

1

R

R

n

N

N

H

i

N

i

i

A

Excel: przykład 

background image

TEST  

c

background image

TEST 

c

- ZAKRES STOSOWANIA 

1. Testowanie 

liczebności poszczególnych kategorii 

2.

Dane w formie częstości – 

liczba obserwacji

 w danej 

kategorii  

 

 

 

 

 

 

    

: 

%, średnia, prawdopodobieństwo 

3. Dane podzielone na kategorie 

– nominalne, porządkowe 

: 

ciągłe 

4.

Nie należy stosować testu 

c

2 gdy oczekiwana liczebność 

dla kategorii jest mała (<5) 

5. Warianty testu: 

Klasyfikacja jednoczynnikowa One-way classification 

Klasyfikacja dwuczynnikowa

 

Copyright ©2012, Joanna Szyda  

background image

Copyright ©2011 Joanna Szyda  

TEST 

c

2 KLASYFIKACJA JEDNOCZYNNIKOWA 

PRÓBA DANYCH 

1. Klasyfikacja danych wg 

pojedynczego kryterium 

2.

Kolor kwiatów krokusa

 

KOLOR 

CZĘSTOŚĆ 

Biały 

Żółty 

Żółty 

Żółty 

Czerwony 

Czerwony 

Żółty 

Biały 

Żółty 

Żółty 
Żółty 

SUMA 

Czerwony 

17 

Biały 

Czerwony 

Żółty 

Czerwony 

Czerwony 

Biały 
Żółty 
Biały 

background image

Copyright ©2011, Joanna Szyda  

TEST 

c

2 KLASYFIKACJA JEDNOCZYNNIKOWA 

1.

Określenie hipotez H

0

 i H

 

H

0

: częstości wystąpienia kolorów są  jednakowe   

          

H

1

: częstości wystąpienia kolorów są  różne  

 

  

H

0

:  n

B

 = n

Ż

 = n

C

     

 

 

 

 

 

 

H

1

:  n

B

 

≠ n

Ż 

≠ n

C

 

2.

Ustalenie poziomu istotności

 

 

MAX 

= 0.05 

3.

Wybór i obliczenie wartości testu statystycznego 

 

 

 

cz

cz

cz

obs

żó

żó

żó

obs

bi

bi

bi

obs

N

i

i

i

i

obs

n

n

n

n

n

n

n

n

n

n

n

n

K

exp

2

exp

exp

2

exp

exp

2

exp

1

exp

2

exp

2

c

background image

3.

Wybór i obliczenie wartości testu statystycznego 

TEST 

c

2 KLASYFIKACJA JEDNOCZYNNIKOWA 

 

 

 

 

53

.

1

7

.

5

7

.

5

5

7

.

5

7

.

5

8

7

.

5

7

.

5

4

2

2

2

exp

2

exp

exp

2

exp

exp

2

exp

1

exp

2

exp

2

cz

cz

cz

obs

żó

żó

żó

obs

bi

bi

bi

obs

N

i

obs

n

n

n

n

n

n

n

n

n

n

n

n

K

c

4.

Określenie rozkładu testu:  

2

2

1

~

K

c

5.

Obliczenie wartości 

t

47

.

0

t

Excel: przykład 

6. Decyzja: 

t

 > 

max 

 

 

 

H

0

 

H

 

częstości wystąpienia kolorów są  jednakowe 

Copyright ©2011 Joanna Szyda  

background image

TEST 

c

- ZAKRES STOSOWANIA 

1. Testowanie 

liczebności poszczególnych kategorii 

2.

Dane w formie częstości – 

liczba obserwacji

 w danej 

kategorii  

 

 

 

 

 

 

    

: 

%, średnia, prawdopodobieństwo 

3. Dane podzielone na kategorie 

– nominalne, porządkowe 

: 

ciągłe 

4.

Nie należy stosować testu 

c

2 gdy oczekiwana liczebność 

dla kategorii jest mała (<5) 

5. Warianty testu: 

Klasyfikacja jednoczynnikowa 

Klasyfikacja dwuczynnikowa Two-way classification

 

Copyright ©2012, Joanna Szyda  

background image

TEST 

c

2 KLASYFIKACJA DWUCZYNNIKOWA 

PRÓBA DANYCH 

1.

Klasyfikacja danych wg dwu kryteriów 

2.

Liczebność słoni w Parku Narodowym Mikumi, 
Tanzania

 

kategoria 

samotny 

samiec 

grupa 

samców 

grupa 

rodzinna 

grupa 

rodzinna + 

samiec 

Pora 

sucha 

43 

196 

deszczowa 

92 

17 

195 

Copyright ©2011, Joanna Szyda  

background image

Copyright ©2011, Joanna Szyda  

TEST 

c

2 KLASYFIKACJA DWUCZYNNIKOWA 

1.

Określenie hipotez H

0

 i H

 

H

0

: pora roku nie wpływa na zmiany liczebności słoni w 

poszczególnych kategoriach (oba kryteria są niezależne)            
H

1

: pora roku wpływa na zmiany liczebności słoni w 

poszczególnych kategoriach (oba kryteria są zależne) 

  

H

0

:  n

Di

 = n

Si

 

dla i=1…4 

 

 

 

 

 

H

1

:  n

Di

 

≠ n

Si 

 

2.

Ustalenie poziomu istotności

 

 

MAX 

= 0.05 

3.

Wybór i obliczenie wartości testu statystycznego 

 



K

M

N

i

S

S

S

obs

D

D

D

obs

N

j

ij

ij

ij

obs

n

n

n

n

n

n

n

n

n

1

4

_

exp

2

4

_

exp

4

_

1

_

exp

2

1

_

exp

1

_

1

exp

2

exp

2

c

background image

Copyright ©2011 Joanna Szyda  

TEST 

c

2 KLASYFIKACJA DWUCZYNNIKOWA 

liczebność klasy oczekiwana dla H

0

 

 

 

 

 

 

 

 

 

 

N

n

n

N

N

n

N

n

n

K

M

M

K

N

i

N

j

j

obs

i

obs

N

j

j

obs

N

i

i

obs

ij

 

1

1

.

.

1

.

1

.

exp



K

M

N

i

N

j

ij

ij

ij

obs

n

n

n

1

1

exp

2

exp

2

c

samot

ny 

samie

grupa 

samc

ów 

grupa 

rodzin

na 

grupa 

rodzin

na + 

samie

suma 

sucha 

43 

196 

250 

deszc

zowa 

92 

17 

195 

312 

suma 

135 

21 

391 

15 

562 

samotn

samiec 

grupa 

samców 

grupa 

rodzinn

grupa 

rodzinn

a + 

samiec 

sucha 

135*250

562 

deszczo

wa 

samotn

samiec 

grupa 

samców 

grupa 

rodzinn

grupa 

rodzinn

a + 

samiec 

sucha 

135*250

562 

21*250 

562 

deszczo

wa 

samotn

samiec 

grupa 

samców 

grupa 

rodzinn

grupa 

rodzinn

a + 

samiec 

sucha 

60.5 

9.34 

173.93 

6.67 

deszczo

wa 

74.95 

11.66  217.07 

8.33 

background image

3.

Wybór i obliczenie wartości testu statystycznego 

TEST 

c

2 KLASYFIKACJA DWUCZYNNIKOWA 

 

 

 

 

 

 

30

.

19

33

.

8

33

.

8

8

67

.

6

67

.

6

7

07

.

217

07

.

217

195

93

.

173

93

.

173

196

66

.

11

66

.

11

17

34

.

9

34

.

9

4

95

.

74

95

.

74

92

05

.

60

05

.

60

43

2

2

2

2

2

2

2

2

1

1

exp

2

exp

2



K

M

N

i

N

j

ij

ij

obs

n

n

n

c

4.

Określenie rozkładu testu:  



2

3

1

1

~

M

K

c

5.

Obliczenie wartości 

t

0002

.

0

t

Excel: przykład 

Copyright ©2011, Joanna Szyda  

background image

TEST 

c

2 KLASYFIKACJA DWUCZYNNIKOWA 

6. Decyzja: 

t

 < 

max 

 

 

 

H

0

 

H

 

liczebność poszczególnych grup słoni różni się w zależności 
od pory roku 

Copyright ©2011 Joanna Szyda  

background image

WYBÓR TESTU

 

background image

ROZKŁAD NORMALNY 

PORÓWNANIE ZMIENNOŚCI 

 

TEST F 

 

background image

PORÓWNANIE CZĘSTOŚCI 

 

TEST 

c

 

background image

ROZKŁAD INNY NIŻ 

NORMALNY 

PORÓWNANIE ZMIENNOŚCI 

 

TEST KRUSKALA-WALLISA