background image

Analiza wariancji.

Opracowana przez R.A. Fishera w 20 

latach XX w.

background image

Analiza wariancji

Analiza wariancji jest metodą 

statystyki matematycznej bazującej 

na porównaniu wariancji, która w 

najprostszym przypadku jest 

rozszerzeniem testu do weryfikacji 

hipotezy o równości wartości 

przeciętnych w dwóch populacjach na 

większą ich ilość.

background image

Analiza wariancji

Analiza wariancji jest techniką 

badania obserwacji (wyników), które 

zależą od jednego lub więcej 

czynników działających równocześnie.

Za pomocą tej techniki określa się, 

czy wyodrębnione czynniki wywierają 

wpływ na obserwowane wyniki.

Zmienną, która takiej obserwacji 

podlega nazywamy zmienną 

objaśnianą.

background image

Analiza wariancji

W przypadku, gdy np. obserwujemy 

ilość wydzielanej substancji podczas 

doświadczenia chemicznego przy 

różnych temperaturach, wtedy mamy 

do czynienia z klasyfikacją 

jednoczynnikową.

Można stosować klasyfikację wg 

dwóch albo kilku kryteriów i wtedy 

mamy do czynienia z klasyfikacją 

wielokrotną.

background image

Klasyfikacja 

jednoczynnikowa

Weryfikacja hipotezy o równości k>2 

wartości przeciętnych w przypadku 

klasyfikacji jednoczynnikowej :

Niech badana cecha X ma w każdej 

populacji taki sam rozkład N(m,s).

Z każdej populacji wybieramy próbę o 

liczebności n

i

(i=1,2 …, k) 

odpowiednio.

Niech x

ij

będzie j-tym wynikiem w i-

tej próbce 

background image

Klasyfikacja 

jednoczynnikowa

Średnia i-tej próbki

Średnia ogólna

i

n

j

ij

i

i

x

n

x

1

1

k

i

i

i

n

j

ij

k

i

n

x

n

x

n

x

i

1

1

1

1

1

background image

Klasyfikacja 

jednoczynnikowa

Sumę kwadratów odchyleń 

poszczególnych obserwacji x

ij

od 

średniej ogólnej można przedstawić w 

postaci sumy dwóch składników

Pierwszy jest sumą kwadratów 

wewnątrz grup lub sumą resztkową,

Drugi jest sumą kwadratów między 

grupami.



k

i

i

i

k

i

i

n

j

ij

n

j

ij

k

i

n

x

x

x

x

x

x

i

i

1

2

1

2

1

1

2

1

)

(

)

(

)

(

background image

Klasyfikacja 

jednoczynnikowa

Dla potrzeb weryfikacji hipotez 

wprowadzamy oznaczenia 

Q  – suma kwadratów całkowita,

Q

R

– resztkowa

Q

G

– międzygrupowa.

Statystyka F= Q

G

/(k-1): Q

R

/(n-k) ma 

rozkład F Snedecora o (k-1,n-k) 

stopniach swobody.

background image

Klasyfikacja 

jednoczynnikowa

Zbiorem krytycznym testu F jest 

przedział <F(1-

a

;k-1;n-k) , +oo).

Ponieważ warunkiem koniecznym 

weryfikowania  hipotezy F jest 

równość wariancji, musimy najpierw 

zweryfikować hipotezę 

H0: 
o równości wariancji przy pomocy 

testu Bartletta

2

2

2

2

1

....

k

background image

Test Bartletta

Korzystamy ze statystyki Bartletta

gdzie

k

i

i

n

j

i

ij

i

obl

n

x

x

n

s

k

n

c

i

1

1

2

2

2

]

1

)

(

log

)

1

(

log

)

[(

303

,

2



k

i

i

n

j

ij

x

x

k

n

s

i

1

2

1

2

)

(

1

)

1

(

3

)

1

1

1

(

1

1

k

k

n

n

c

k

i

i

background image

Test Bartletta

Zbiorem krytycznym testu Bartletta 

jest przedział 

<Chi

2

(1-

a

,k-1), +oo),

gdzie Chi

2

(1-

a

,k-1) jest kwantylem 

rzędu (1-

a

) odczytanym z tablic 

rozkładu Chi

2

o (k-1) stopniach 

swobody.

background image

Klasyfikacja podwójna

Weryfikacje hipotez dotyczące 

wartości przeciętnych w przypadku 

klasyfikacji podwójnej można 

zastosować do następującego typu 

zadań:

Badania skuteczności procesu 

biologicznego oczyszczania ścieków 

przy wykorzystaniu:

odmian bakterii (czynnik A)

rodzajów napowietrzania (czynnik        

B).

background image

Klasyfikacja podwójna

W tego rodzaju badaniach wszystkie 

obserwacje będą podzielone na  r*p 

grup.

Dla uproszczenia zapisów możemy 

założyć, że w każdej grupie 

przeprowadza się jednakową liczbę l

pomiarów.

Badaną cechą jest skuteczność 

oczyszczania.

background image

Klasyfikacja podwójna

Przy pomocy tego modelu możemy 

weryfikować następujące hipotezy:

dotyczącą równości wartości 

przeciętnej badanej cechy we 

wszystkich r*p populacjach,

H

01

m

ij

=

m

dla i=1,..,r; j=1,…,p.

background image

Klasyfikacja podwójna

dotyczącą równość wszystkich 

wartości przeciętnych badanej cechy 

poddanej działaniu czynnika 

wariantach bez względu na wpływ 

czynnika B.

H

02

m

1.

m

2.

=…= 

m

r.

background image

Klasyfikacja podwójna

dotyczącą równość wszystkich 

wartości przeciętnych badanej cechy 

poddanej działaniu czynnika 

wariantach bez względu na wpływ 

czynnika A.

H

03

m

.1

m

.2

=…= 

m

.p

background image

Klasyfikacja podwójna

Mówiąca, że odchylenie wartości 

przeciętnej we wszystkich rp

populacjach od ogólnej wartości 

przeciętnej jest równe sumie efektów 

czynnika B.

H

04

m

ij 

-

m

=(

m

i. 

-

m

)+(

m

.j 

-

m

)

Gdy H

04

nie jest spełniona, czyli gdy 

nie zachodzi addytywność 

oddziaływania A i B, to mówimy, że 

zachodzi współdziałanie tych 

czynników