Microsoft PowerPoint - 3_WNIOSKOWANIE2

Nieznany parametr

Wybieramy estymator

realizacją

w próbie losowej jest

Ocena (

) parametru

za pomocą estymatora

pochodzi z próby losowej: stąd

estymator jest zmienną losową

→ patrz: rozk

ady statystyk z próby

−

MoŜemy

popełnić błąd

Na podstawie oceny -

dokonujemy estymacji punktowej lub przedziałowej

Podstawy estymacji: pojęcie i podstawowe

własności estymatorów

nie znamy charakterystyk

np.: średniej ani częstości

Populacja

Próba losowa

znamy statystyki z próby

np.: średnią albo częstość

Biorąc pod uwagę te kryteria najlepszymi punktowymi estymatorami

średniej i częstości populacyjnej będą średnia i częstość z próby.

ObciąŜenie estymatora:

estymator jest nieobciąŜony jeśli zachodzi

jeśli

to estymator jest obciąŜony (obciąŜenie

)

Asymptotyczna nieobciąŜoność: jeśli liczebność próby dąŜy do nieskończoności obciąŜenie

estymatora dąŜy do zera

Efektywność estymatora:

Z dwóch estymatorów efektywniejszy jest ten którego wariancja jest

mniejsza. Mniejsze prawdopodobieństwo uzyskania w próbie losowej wartości bardzo odbiegających

od parametru

Zgodność estymatora:

estymator jest zgodny jeśli zachodzi:

Oznacza to, Ŝe jeśli rośnie liczebność próby, rośnie teŜ prawdopodobieństwo, Ŝe oszacowanie przy

pomocy estymatora będzie przyjmować wartości coraz bliŜsze wartości szacowanego parametru.

Inaczej: zwiększając liczebność próby, zmniejszamy ryzyko popełnienia błędu.

(

)

lim

−

∞

→

Podstawy estymacji: Własności estymatorów

)

(

−

)

(

)

(

lim

∞

→

Jakość estymatora punktowego moŜemy ocenić za

pomocą:

Odchylenia standardowego estymatora (średni błąd

szacunku)→

D(T

)

Błąd względny estymatora

)

(

)

(

Estymacja punktowa

Najlepszymi punktowymi estymatorami średniej -

i frakcji (częstości) -

populacji będą próby będą statystyki:

Ocena błędu względnego:

V(T

)<7,5% wysoka precyzja

7,5%<V(T

)<15% dostateczna precyzja

V(T

)>15% odrzucenie estymacji punktowej za pomoca

parametru z próby Tn

Znane odchylenie

standardowe w populacji

Nie znane odchylenie

standardowe w populacji

Odchylenie

standardowe

Wartość oczekiwana

)

(

)

(

)

(

Śr

ób

Odchylenie

standardowe

Wartość oczekiwana

ób

w(1

D(w)

Przykład: estymacja punktowa średniej

Wiadomo, Ŝe w przedsiębiorstwie X średni czas losowo wybranych 100 rozmów

międzymiastowych wynosił 10 min. i charakteryzował się zmiennością 40%, naleŜy ocenić

punktowo średni czas trwania tej rozmowy.

100

)

(

)

(

)

(

)

(

)

(

→

ocena punktowa średniego czasu rozmów

→ średni błąd szacunku

)

(

)

(

→ błąd względny estymatora (poniewaŜ V(Tn)<7,5%

wysoka precyzja oszacowania punktowego)

Przykład: estymacja punktowa frakcji

Z przygotowanej do sprzedaŜy partii skrzynek z jabłkami w pewnej hurtowni wybrano losowo

200 skrzynek jabłek i 146 z nich zakwalifikowano jako I gatunek. Oszacować punktowo frakcję

jabłek I gatunku w całej partii.

200

)

735

(

735

)

(

)

(

735

200

147

−

gat

→ ocena punktowa frakcji jabłek pierwszego gatunku

→ średni błąd szacunku

735

)

(

)

(

→ błąd względny estymatora (poniewaŜ V(Tn)<7,5%

wysoka precyzja oszacowania punktowego)

Zagadnienie estymacji przedziałowej średniej i

częstości

Punktowa ocena parametru za pomocą estymatora moŜe być obciąŜona błędem lub

całkowicie nietrafna: wynika to z losowości próby oraz z faktu Ŝe w przypadku cech ciągłych

prawdopodobieństwo, Ŝe estymator przyjmie wartość szacowanego parametru jest równe

zero.

Dlatego teŜ stosujemy tzw.

estymację przedziałową

→

konstrukcja przedziału liczbowego

(tzw. przedziału ufności)

, który z załoŜonym prawdopodobieństwem pokrywa wartość

szacowanego parametru.

Częstość oszacowań prawidłowych zwana jest

współczynnikiem ufności

i oznaczana jako

1-α

. Podkreśla to, Ŝe zaleŜy nam na jak największej liczbie oszacowań prawidłowych i na

małej liczbie oszacowań nieprawidłowych (

). Zazwyczaj

to mała liczba np.: 0,05 lub 0,01.

W przypadku estymacji punktowej otrzymujemy jedną liczbę a w przypadku estymacji

przedziałowej otrzymujemy przedział liczbowy.

Dzięki estymacji przedziałowej moŜemy ocenić jak często uznanie za wartość parametru

konkretnej liczby z proponowanego przedziału jest oszacowaniem prawidłowym.

Zaczynamy od oceny punktowej parametru czyli Tn

Znając błąd standardowy estymatora oraz zakładając Ŝe jego rozkład jest normalny

oraz Ŝe jest on nieobciąŜony, to wówczas 68% wartość jakie moŜe on przyjmować naleŜy do

przedziału:

Jak konstruujemy przedział ufności? (1)

Czyli z prawdopodobieństwem 0,68 otrzymujemy takie oceny parametru które naleŜą do

tego przedziału. Przedział ten będzie miał krańce o wartościach:

PoniewaŜ punktowa ocena parametru jak i jego błąd standardowy pochodzą z realizacji próby

losowej za kaŜdym razem moŜemy otrzymać inną wartość krańca przedziału jednak zawsze

przedziały te będą zawierały oszacowany parametr

)

(

−

)

(

;

)

(

−

)

(

;

)

(

f(t

)

D(T

E(T

D(T

Dysponując jedynie tymi przedziałami nie moŜemy jednoznacznie wskazać gdzie znajduje się

szacowany parametr. MoŜemy jedynie powiedzieć, Ŝe szacowany parametr będzie zawierał się w

przedziale z określonym prawdopodobieństwem

(

)

(

)

(

−

Jak konstruujemy przedział ufności? (2)

MoŜna powiedzieć Ŝe 68 na 100 skonstruowanych przedziałów będzie zawierało szacowany

parametr. Jednocześnie częstość błędnych oszacowań wynosi 0,32.
Chcielibyśmy mieć więcej oszacowań prawidłowych. MoŜemy to zrobić zwiększając rozpiętość

przedziału do dwukrotnego lub trzykrotnego błędu średniego. Ogólnie moŜemy zwiększyć tę

rozpiętość do

-krotnego błędu średniego

(

)

−

≤

Gdy

→

P=0,68

≤

Gdy

→

P=0,95

≤

Gdy

→

P=0,99

≤

−

)

(

;

)

(

−

)

(

;

)

(

−

)

(

;

)

(

Jak konstruujemy przedział ufności? (3)

Wtedy: rośnie częstość oszacowań prawidłowych oznaczana przez

1-α

natomiast zacznie maleć

częstość oszacowań nieprawidłowych oznaczona jako

Jeśli estymator ma rozkład normalny to związek poziomu ufności ze zmienną losową

opisującą krotność odchylenia standardowego estymatora jaką naleŜy brać pod uwagę

konstruując przedział jest następujący:

−













∗

−

)

(

)

(

Ogólnie konstrukcję przedziału ufności moŜemy zapisać następująco:

Krańce przedziału są losowe gdyŜ zmienia się wartość oceny punktowej parametru. Jednak

zawsze, z prawdopodobieństwem

1-α

, pokryje on szukaną wartość parametru.

Przy ustalonej liczebności próby, przyjęte prawdopodobieństwo

1-α

rozstrzyga o tym jaka

będzie rozpiętość przedziału.

Im większa częstość poprawnych oszacowań tym większa wymagana krotność błędu

standardowego i szerszy przedział.

ZaleŜność między precyzją a pewnością oszacowania

→

wysoka wiarygodność ufność nie

sprzyja precyzji oszacowania.

Jak konstruujemy przedział ufności? (4)

Przykład: estymacja przedziałowa średniej

Wiadomo, Ŝe w przedsiębiorstwie X średni czas losowo wybranych 100 rozmów

międzymiastowych wynosił 10 min. i charakteryzował się zmiennością 40%, naleŜy ocenić

przedziałowo średni czas trwania tej rozmowy. Przyjąć 1-

= 0,95.

100

)

(

)

(

)

(

;

)

(

−

→ ocena punktowa średniego czasu rozmów

→ zasada konstrukcji przedziału ufności dla

średniej

→ błąd standardowy estymatora

spełnia warunek

P(-u

<U<u

)=1-α → 1-α=0,95

poziom ufności (częstość poprawnych

oszacowań przedziałowych – 95 na 100 skonstruowanych przedziałów pokryje nieznany

parametr populacyjny

→ szukamy wartości u

→

F(u

)=1-α/2

→

F(u

)=0,975

→

=1,96

784

;

216

784

;

784

;

)

(

;

)

(

→

−

→

⋅

−

→

−

→ przedział ufności dla średniej

Przykład: estymacja przedziałowa frakcji

Z przygotowanej do sprzedaŜy partii skrzynek z jabłkami w pewnej hurtowni wybrano losowo

200 skrzynek jabłek i 146 z nich zakwalifikowano jako I gatunek. Wyznaczyć przedział ufności

dla frakcji jabłek I gatunku. Przyjąć 1 -

= 0,90.

200

)

(

)

(

)

(

200

146

)

(

;

)

(

−

→ ocena punktowa frakcji jabłek Iszego

gatunku

→ zasada konstrukcji przedziału ufności

dla frakcji

→ błąd standardowy estymatora

spełnia warunek

P(-u

<U<u

)=1-α → 1-α=0,90

poziom ufności (częstość poprawnych

oszacowań przedziałowych – 90 na 100 skonstruowanych przedziałów pokryje nieznany

parametr populacyjny

→ szukamy wartości u

→

F(u

)=1-α/2

→

F(u

)=0,95

→

=1,65

;

,73

;

)

(

;

)

(

→

−

→

⋅

−

→

−

→ przedział ufności dla frakcji

Przykład: poparcie dla partii politycznych

019

)

(

)

(

019

704

)

(

)

(

−

Oszacowanie przedziałowe i

punktowe dla PO

;

,48

;

019

,48

;

019

)

(

;

)

(

→

−

→

⋅

−

→

−

Zakładamy poziom ufności

1-α=0,95

F(u

)=0,975

→

=1,96

Gdyby wybory odbyły się w lutym PO zdobyła by

między 44% a 52% z prawdopodobieństwem 0,95

Dokładność estymacji: zagadnienie minimalnej

liczebności próby

)

(

∗

Problem precyzji oszacowania sprowadza się do wyboru między długością przedziału

a częstością trafnych oszacowań:

szerszy przedział

→

większa częstości trafnych oszacowań → mała precyzja

wąski przedział → niŜsza częstość trafnych oszacowań → większa precyzja

Szerokość przedziału moŜemy modyfikować przez zmiany w wartości

prawdopodobieństwa 1-α

→

to rozwiązanie nas nie interesuje!

MoŜemy takŜe „manipulować” wielkością próby w celu osiągnięcia załoŜonej precyzji

oszacowania. Precyzja jest mierzona jest za pomocą tzw.

błędu maksymalnego

czyli połowy długości przedziału. Błąd ten oznaczany jest jako

Gdy nie ma przewidywań co do

wartości

przyjmujemy 0,5

∗

Stąd moŜemy postawić pytanie: Jaka powinna być minimalna liczba obserwacji w próbie

niezbędna do przeprowadzenia wnioskowania o wymaganej precyzji i ustalonej ufności

1-α

Dla szacowania średniej

Dla szacowania częstości

Gdy przewidujemy

podstawie

)

(

∗

−

Dokładność estymacji: zagadnienie minimalnej

liczebności próby (2)

)

(

∗

gdzie: d

-planowany

błąd maksymalny

Przykład: zagadnienie minimalnej liczebności próby

dla frakcji

Jak liczna powinna być próba by oszacować odsetek pracowników, awansujących trzykrotnie

w karierze zawodowej z maksymalnym błędem 2% ? Jeśli badanie pilotaŜowe wskazuje iŜ

spodziewana wielkość kształtuje się w granicach 15%?
d

=0,02

=0,15

1-α=0,95

1224

0004

1275

)

(

)

(

−

∗

NaleŜy dolosować: 2394-704=1690 elementów

O ile naleŜało by zwiększyć próbę by dwukrotnie zwiększyć precyzję oszacowania poparcia dla

PO wg. badania CBOS z lutego 2008?

=0,02

=0,48

1-α=0,95

2394

0004

2496

)

(

)

(

−

∗

NaleŜy wylosować próbę składającą się z 1224 elementów

Przykład: zagadnienie minimalnej liczebności próby

dla średniej

Na podstawie losowej próby 400 konsumentów odwiedzających pewien sklep AGD otrzymano

następujący przedział ufności dla średnich wydatków: <460; 500> zł, oszacowany z ufnością

0,98. Jak liczna powinna być próba, aby całkowita rozpiętość przedziału nie przekroczyła 30 zł?

=15

1-α=0,98→F(u

)=1-α/2 → F(u

)=1-0,02/2=0,99 → u

=2,33

d=u

*D(T

)

(

∗

171

)

(

)

(

400

)

(

→

∗

→

∗

708

159196

171

→

Próba powinna liczyć 708 elementów