plik

2013-04-17

Metody probabilistyczne

Weryfikacja hipotez statystycznych

Hipotezy parametryczne

cz.2

Testowanie hipotezy o dwóch wskaźnikach struktury (p)



Badanie dwu skończonych populacji generalnych ze względu na
wyróżnioną cechę

. Zachodzi konieczność weryfikacji hipotezy o równości

wskaźników struktury w obu zbiorowościach.

Założenie: Cecha ma w populacjach rozkład dwupunktowy z parametrem

odpowiednio p

i p

oznaczającym prawdopodobieństwo, że cecha przyjmie

wyróżnioną wartość.
Próby muszą być duże (n

≥100) i (n

≥100).

Formułowanie hipotezy:



Hipoteza zerowa (H

)

jest hipotezą „o równości” i brzmi: H

: p

= p

gdzie p

i p

są konkretną wartością (liczbą).



Hipoteza alternatywna (H

)

może być sformułowana trojako (najczęściej w

zależności od wyniku uzyskanego w próbie):
H

: p



(albo H

: p

< p

albo też H

: p

> p

)



Wybór hipotezy alternatywnej (H

) ma decydujące znaczenie dla

sformułowania obszaru odrzucenia,



Rozkład różnicy między wskaźnikami struktury można
aproksymować za pomocą rozkładu normalnego o parametrach







































2013-04-17

Testowanie hipotezy o dwóch wskaźnikach struktury (p)

Sprawdzian:

gdzie:

, , , ,



która ma w przybliżeniu rozkład asymptotycznie normalny N(0 ; 1), dla
której P{|U|





Wnioskowanie



Jeżeli wartość sprawdzianu U znajdzie się:

w obszarze odrzucenia, to odrzucamy H

i przyjmujemy H

poza obszarem odrzucenia, to nie mamy podstaw do odrzucenia
H

Brak podstaw do odrzucenia oznacza, że obie próby pochodzą z

tej samej populacji

*
2





*
2















Testowanie hipotezy o dwóch wskaźnikach struktury (p)

przykład



Zweryfikować przypuszczenie kobiety i mężczyźni jednakowo często
dojeżdżają do pracy komunikacją zbiorową.



Wylosowano 500 mężczyzn i 600 kobiet. Okazało się, że 200 mężczyzn i
250 kobiet korzysta z komunikacji zbiorowej. Na poziomie istotności α=0,05
zweryfikować hipotezę, że odsetek jeżdżących pojazdami komunikacji
zbiorowej kobiet i mężczyzn jest jednakowy.



Dane: n

=500, n

=600, m

=200, m

=250, α=0,05,



: p

wobec H

: p

≠p

500

200



600

250

*
2



1100

450

600

500

250

200



















727

272

1100

300000

600

500

600

500











671

273

*
2











Wniosek:
u

0,025

= 1,96

– gdyż obszar jest dwustronny

emp

< u

0,025

, czyli brak podstaw do

odrzucenia hipotezy H

=> mężczyźni i

kobiety jednakowo często korzystają z
komunikacji zbiorowej.

2013-04-17

Testowanie hipotezy o wariancji populacji generalnej σ

Założenie: Populacja generalna ma rozkład normalny N(μ,



)

o nieznanych parametrach

μ i



Z populacji tej wylosowano niezależnie n elementów do próby

Formułowanie hipotez:



Hipoteza zerowa: H



, wobec



hipotezy alternatywnej H







(albo H







albo też H



)

gdzie:



jest hipotetyczną wartością wariancji











najczęściej gdyż sytuację, w której wariancja jest

wysoka uznaje się niekorzystną.

Testowanie hipotezy o wariancji populacji generalnej σ

Model 1



Założenia:

próba mała (n≤30); μ i



- nieznane



Sprawdzian:

Test istotności dla tej hipotezy jest następujący. Z wyników n elementowej

próby losowej obliczmy wartość s

, a następnie wartość statystyki:



Test istotności:

Statystyka ta ma przy założeniu prawdziwości hipotezy H

rozkład χ

z n-1

stopniami swobody.

Dla ustalonego z góry poziomu istotności



i dla n-1 stopni swobody

odczytujemy z tablicy rozkładu χ

taką wartość krytyczną, aby spełniona

byłą równość P{χ





. (obszar prawostronny)

 





















2013-04-17

Testowanie hipotezy o wariancji populacji generalnej

Wnioskowanie



Nierówność χ



określa prawostronny obszar krytyczny, tzn. gdy

z porównania wartości χ

obliczonej z próby z wartością krytyczną

zajdzie nierówność χ



, hipotezę H

odrzucamy na korzyść

alternatywy H



Natomiast, gdy zajdzie nierówność χ



, nie ma podstaw do

odrzucenia hipotezy H

, że wartość wariancji



populacji generalnej

jest



Testowanie hipotezy o wariancji populacji generalnej σ

Model 2
Założenia:

próba duża (n>30); μ i



- nieznane



Sprawdzian:
Wartość χ

należy przekształcić na

gdzie: k

– liczba stopni swobody k=n-1



Test istotności:

Statystyka ta przy założeniu prawdziwości hipotezy H

dla ustalonego

U ma w przybliżeniu rozkład asymptotycznie normalny

N(0 ; 1), dla którego P{U





















2013-04-17

Testowanie hipotezy o wariancji populacji generalnej

przykład



Pewnego dnia dokonano 15 pomiarów opóźnień pociągów
przyjeżdżających do stacji Kraków Główny. Na podstawie wyników
pomiarów otrzymano wartość średniego opóźnienia 23min i s

= 523,07.

Zakłada się, że czas opóźnień pociągów ma rozkład N(μ,σ). Sprawdzić na
poziomie istotności α=0,05 hipotezę, że wariancja opóźnień wynosi 400.



Dane: n=15, , s

= 523,07,

=400,

α=0,05,



Hipotezy: H

=400 H

>400



Statystyka:



Wnioskowanie: obszar krytyczny:



615

400

523







emp

685

;







;







emp

Wniosek:
Nie ma podstaw do odrzucenia hipotezy
głoszącej, że wariancja opóźnień całej
populacji kształtuje się na poziomie 400.

Test dla dwóch wariancji



Test służy do sprawdzenia hipotezy o jednakowym stopniu rozproszenia

wartości badanej cechy w dwóch populacjach.



Estymatory wariancji:

























lub

→





2013-04-17

Test dla dwóch wariancji



Model

Założenia:



Dane są dwie populacje generalne mające odpowiednio rozkłady normalne
N(



) i N(



), gdzie parametry tych rozkładów są nieznane,



Wylosowano niezależnie dwie próby o liczebności n

i n

elementów,

Formułowanie hipotez



Należy sprawdzić hipotezę H



wobec hipotezy alternatywnej H



(postać najczęściej)



Sposób postępowania: z obu prób wyznaczyć: i

Sprawdzian statystyka F:



statystyka F

, przy założeniu prawdziwości hipotezy H

, ma

rozkład F Snedecora z n

– 1 i n

– 1 stopniami swobody,

Wnioskowanie:



jeżeli F ≥ F



, to hipotezę H

należy odrzucić na rzecz hipotezy alternatywnej H

ˆs













W liczniku zawsze

większa z wariancji

Test dla dwóch wariancji - przykład



Wyniki dwóch czasu prowadzenia pojazdu przez kierowców.
Poziom istotności α=0,05.



Zweryfikować hipotezę o równości wariancji wyników obu kierowców.



Dane: n

=8, n

=9,





wobec



7,48

7,88

8,00

7,15

7,26

7,33

7,71

7,18

7,62

7,83

8,03

7,97

7,17

8,08

7,92

7,93 7,58

0837

1072





=3,5 stąd F=1,28 < F



=3,5

Wniosek:
Brak podstaw do odrzucenia H

, że wariancje

wyników czasu prowadzenia pojazdów przez
obu kierowców są jednakowe.

1072



0837

2
2



2013-04-17

Test jednorodności wielu wariancji

Test Bartletta jest stosowany do sprawdzenia założenia o jednakowych

wariancjach we wszystkich badanych populacjach.

Model
Założenia:



danych jest k populacji normalnych N(



) (i = 1, 2, ..., k),



z każdej populacji wylosowano niezależnie n

elementów,



wyniki każdej próby są oznaczone x

(i = 1, 2, ..., k, j = 1, 2, ..., n

Formułowanie hipotez:



należy sprawdzić hipotezę H



= ... =





hipoteza alternatywna H

: nie wszystkie wariancje są równe.

Sposób postępowania:



z wyników k prób należy obliczyć:





























































gdzie:





Test jednorodności wielu wariancji

Statystyka:



dla ustalonego poziomu istotności α i dla k –1 stopni swobody należy
odczytać wartość χ

log

– logarytm dziesiętny

Wnioskowanie:



jeżeli χ



, to hipotezę H

należy odrzucić.



jeżeli χ

brak podstaw do odrzucenia hipotezy H

























303

log



2013-04-17

Test jednorodności wielu wariancji - przykład



Zbadano  liczbę  pasażerów  przewożonych  linią  tramwajową  w godzinach  szczytu
w kolejnych  3 dniach  roboczych  tygodnia.  Otrzymano  następujące  wariancje
liczby pasażerów  przewożonych  20, 100, 70. Przyjmując poziom  istotności
α=0,05 zweryfikować  hipotezę,  że wariancja  liczby pasażerów  w kolejne  dni
tygodnia  jest jednakowa.

log(s

)

-1)

-1)*(s

)

-1)*log(s

)

1,301

180

11,709

100

2,000

900

18,000

1,845

630

16,606

suma

1710

46,315

63,333

1,049

n-k=

5,111

log(s

)

1,802

0,05,2

5,991









190

100























049













 























































 







111

315

333

log

049

303

log

303





























Wniosek

Nie ma podstaw do

odrzucenia hipotezy, że

wariancje są jednakowe

Test analizy wariancji dla wielu średnich

Klasyfikacja pojedyncza



Podstawowe narzędzie statystyki eksperymentalnej,



Pozwala na sprawdzenie, czy pewne czynniki, które można regulować w
toku eksperymentu, wywierają wpływ (jak duży) na kształtowanie się
średnich wartości badanych cech,



Polega na porównaniu wariancji wynikającej z działania danego czynnika z
wariancją resztkową mierzącą losowy błąd eksperymentu.



Klasyfikacja pojedyncza

– suma kwadratów wariancji ogólnej jest rozbijana

na dwa składniki mierzące zmienność między grupami (populacjami) i
wewnątrz grup

2013-04-17

Test analizy wariancji dla wielu średnich

Model
Założenia:



danych jest k

populacji o rozkładzie normalnym N(μ



) lub o rozkładzie

zbliżonym do normalnego,



wariancje wszystkich k

populacji są równe (



= ... =



ale

nie muszą być znane,



z każdej z tych populacji wylosowano niezależnie próby o liczności n

elementów,



wyniki prób oznaczone są przez x

(i = 1, 2, ..., k, j = 1, 2, ..., n

)

przy czym x



gdzie:



jest wartością zmiennej losowej nazywanej składnikiem losowym,

mającej rozkład N(0,



Źródło zmienności

Suma kwadratów

Stopnie

swobody

Wariancja

Test F

między

populacjami

(grupami)

k - 1

wewnątrz grup

(składnik losowy)

n - k

Test analizy wariancji dla wielu średnich

Formułowanie hipotez:



należy zweryfikować hipotezę H

=... =



hipoteza alternatywna H

: nie wszystkie średnie badanych populacji są

równe

Sposób postępowania:



z wyników poszczególnych prób należy obliczyć średnie grupowe
i średnią ogólną :



wypełnić tablicę analizy wariancji:









 



















)

(

















)

(

2013-04-17

Test analizy wariancji dla wielu średnich

Sprawdzian



obliczoną w tablicy wartość F należy porównać z wartością krytyczną F



odczytaną z tablic rozkładu F Snedecora dla ustalonego poziomu istotności



i dla liczby stopni swobody k-1 i n-k,

Wnioskowanie:



jeżeli F ≥ F



to hipotezę H

należy odrzucić,



jeżeli F < F



brak podstaw do odrzucenia hipotezy H

Test analizy wariancji dla wielu średnich - przykład



Koszt wytworzenia pewnego usługi transportowej trzema różnymi metodami
ma rozkład normalny o jednakowej wariancji dla każdej z metod. Na
poziomie istotności α=0,05 zweryfikować hipotezę, że średnie koszty
materiałowe są jednakowe dla wszystkich metod produkcji usługi.

Metoda

100

250

55,56

180

175

1050

266,67

140

121,43

850

77,78

suma

420

2150

400

Średnia

420/18=23,33

Źródło zmienności

Suma

kwadratów

Stopnie

swobody

Wariancja

Test F

między grupami

400

k-1=2

200,0

emp

=1,39

wewnątrz grup

2150

n-k=15

143,3

α,2,15

=3,68

F<F

stąd nie ma podstaw do odrzucenia hipotezy Ho

o równości średnich kosztów produkcji usługi

n *

 

