Microsoft PowerPoint - ESTYMACJA

Podstawy estymacji: poj

cie i podstawowe w

asno

estymator

w (1)

CZYM JEST ESTYMATOR ORAZ PROCES ESTYMACJI?

Chcemy

wnioskować na

podstawie próby o

charakterystykach

populacyjnych

Estymatorem będzie statystyka z próby która posłuży nam do estymacji (czyli

wnioskowania) o nieznanych charakterystykach populacyjnych.

nie znamy charakterystyk
np.: średniej ani częstości

Populacja

Próba losowa

znamy statystyki z próby
np.: średnią albo częstość

Estymacja jest zbiorem metod szacowania wartości pewnych nieznanych
parametrów cechy statystycznej (bądź jej postaci funkcyjnej) na podstawie próby
losowej.

JAKIE RODZAJE ESTYMACJI I ESTYMATOR

W MO

EMY WYR

Estymacja

Parametryczna

Nieparametryczna

Dotyczy rozkładu

zmiennej

punktowa

przedziałowa

Podstawy estymacji: poj

cie i podstawowe w

asno

estymator

w (2)

My zajmiemy się jedynie estymacją punktową oraz

przedziałową średniej oraz częstości

Θ – szacowany parametr populacyjny

– estymator

– ocena parametru Θ za pomocą estymatora T

Ponieważ szacunku dokonujemy na podstawie próby losowej istnieje możliwość
popełnienia błędu. Jest to różnica między estymatorem a wartością parametru:

−

Konkretna wartość jaką przyjmuje estymator (a więc wartość statystyki z próby) dla
danej próby losowej nazywamy oceną parametru (t

Taka ocena parametru jest więc punktowym oszacowaniem nieznanego parametru
populacyjnego.

Podstawy estymacji: poj

cie i podstawowe w

asno

estymator

w (3)

PODSTAWOWE OZNACZENIA

Nieznany parametr Θ

Wybieramy estymator T

realizacją w próbie losowej jest

Ocena (

) parametru Θ za pomocą estymatora T

pochodzi z próby losowej:

stąd estymator jest zmienną losową → patrz: rozkłady statystyk z próby

−

Możemy
popełnić błąd

Na podstawie oceny - t

- dokonujemy estymacji punktowej lub przedziałowej

Podstawy estymacji: poj

cie i podstawowe w

asno

estymator

w (4)

nie znamy charakterystyk
np.: średniej ani częstości

Populacja

Próba losowa

znamy statystyki z próby
np.: średnią albo częstość

JAKI ESTYMATOR B

DZIE

„

DOBRYM

”

ESTYMATOREM?

ASNO

CI ESTYMATOR

Bior

c pod uwag

te kryteria najlepszymi punktowymi estymatorami

redniej i cz

sto

ci populacyjnej b

rednia i cz

sto

ść

z pr

by.

Jakość estymatora punktowego możemy również ocenić za pomocą:

• Odchylenia standardowego estymatora D(T

) – jest to średni błąd szacunku

• Błędu względnego estymatora określanego jako

)

(

)

(

Obciążenie estymatora:

estymator jest nieobciążony jeśli zachodzi

: E(Tn)=Θ

Efektywność estymatora:

Z dwóch estymatorów efektywniejszy jest ten którego

wariancja jest mniejsza. Mniejsze prawdopodobieństwo uzyskania w próbie
losowej wartości bardzo odbiegających od parametru Θ

Zgodność estymatora:

estymator jest zgodny jeśli zachodzi:

(

)

lim

−

∞

→

Podstawy estymacji: poj

cie i podstawowe w

asno

estymator

w (4)

Zagadnienie estymacji przedzia

owej

redniej i

sto

Punktowa ocena parametru za pomocą estymatora może być obciążona błędem lub
całkowicie nietrafna: wynika to z losowości próby oraz z faktu że w przypadku cech
ciągłych prawdopodobieństwo, że estymator przyjmie wartość szacowanego
parametru jest równe zero.

Dlatego też stosujemy tzw. estymację przedziałową,

→

konstrukcja przedziału

liczbowego (tzw. przedziału ufności), który z założonym prawdopodobieństwem
pokrywa wartość szacowanego parametru.

W przypadku estymacji punktowej otrzymujemy jedną liczbę a w przypadku
estymacji przedziałowej otrzymujemy przedział liczbowy.

Dzięki estymacji przedziałowej możemy ocenić jak często uznanie za wartość
parametru konkretnej liczby z proponowanego przedziału jest oszacowaniem
prawidłowym.

Częstość oszacowań prawidłowych zwana jest współczynnikiem ufności i
oznaczana jako 1-α. Podkreśla to, że zależy nam na jak największej liczbie
oszacowań prawidłowych i na małej liczbie oszacowań nieprawidłowych (α).
Zazwyczaj α to mała liczba np.: 0,05 lub 0,01.

Jak konstruujemy przedzia

ufno

ci?

Zaczynamy od oceny punktowej parametru czyli T

Znając błąd standardowy estymatora oraz zakładając że jego rozkład
jest normalny oraz że jest on nieobciążony, to wówczas 68% wartość jakie
może on przyjmować należy do przedziału:

Czyli z prawdopodobieństwem 0,68 otrzymujemy takie oceny parametru
które należą do tego przedziału. Przedział ten będzie miał krańce o
wartościach:

Ponieważ punktowa ocena parametru jak i jego błąd standardowy pochodzą z
realizacji próby losowej za każdym razem możemy otrzymać inną wartość
krańca przedziału jednak zawsze przedziały te będą zawierały oszacowany
parametr Θ

)

(

−

)

(

;

)

(

−

)

(

;

)

(

f(t

)

D(T

)-Θ E(T

)=Θ D(T

)+Θ

Dysponując jedynie tymi przedziałami nie możemy jednoznacznie wskazać gdzie
znajduje się szacowany parametr. Możemy jedynie powiedzieć, że szacowany
parametr będzie zawierał się w przedziale z określonym prawdopodobieństwem

(

)

(

)

(

−

Można powiedzieć że 68 na 100 skonstruowanych przedziałów będzie zawierało
szacowany parametr. Jednocześnie częstość błędnych oszacowań wynosi 0,32.

Chcielibyśmy mieć więcej oszacowań prawidłowych. Możemy to zrobić zwiększając
rozpiętość przedziału do dwukrotnego lub trzykrotnego błędu średniego. Ogólnie
możemy zwiększyć tę rozpiętość do u

-krotnego błędu średniego

Jak konstruujemy przedzia

ufno

ci? (2)

Wtedy: rośnie częstość oszacowań prawidłowych oznaczana przez 1-α natomiast
zacznie maleć częstość oszacowań nieprawidłowych oznaczona jako α.

Jeśli estymator ma rozkład normalny to związek poziomu ufności ze zmienną
losową U opisującą krotność odchylenia standardowego estymatora jaką należy
brać pod uwagę konstruując przedział jest następujący:

(

)

−

≤

Gdy → P=0,68

≤

Gdy → P=0,95

≤

Gdy → P=0,99

≤

−

)

(

;

)

(

−

)

(

;

)

(

−

)

(

;

)

(

Jak konstruujemy przedzia

ufno

ci? (3)

−













∗

−

)

(

)

(

Ogólnie konstrukcję przedziału ufności możemy zapisać następująco:

Krańce przedziału są losowe gdyż zmienia się wartość oceny punktowej
parametru. Jednak zawsze, z prawdopodobieństwem 1-α, pokryje on szukaną
wartość parametru.

Przy ustalonej liczebności próby, przyjęte prawdopodobieństwo 1-α rozstrzyga o
tym jaka będzie rozpiętość przedziału.

Im większa częstość poprawnych oszacowań tym większa wymagana krotność
błędu standardowego i szerszy przedział.

Zależność między precyzją a pewnością oszacowania

→

wysoka wiarygodność

ufność nie sprzyja precyzji oszacowania.

Jak konstruujemy przedzia

ufno

ci? (4)

Dok

adno

ść

estymacji; zagadnienie minimalnej

liczebno

ci pr

by.

)

(

∗

Problem precyzji oszacowania sprowadza się do wyboru między długością
przedziału a częstością trafnych oszacowań:

szerszy przedział

→

większa częstości trafnych oszacowań

→

mała precyzja

wąski przedział

→

niższa częstość trafnych oszacowań

→

większa precyzja

Szerokość

przedziału możemy modyfikować

przez zmiany w wartości

prawdopodobieństwa 1-α

→

to rozwiązanie nas nie interesuje!

Możemy także „manipulować” wielkością próby w celu osiągnięcia założonej
precyzji oszacowania. Precyzja jest mierzona jest za pomocą tzw. błędu
maksymalnego czyli połowy długości przedziału. Błąd ten oznaczany jest jako d:

1
d

Gdy nie ma przewidywań co do
wartości p za p* przyjmujemy 0,5

Stąd możemy postawić pytanie: Jaka powinna być minimalna liczba obserwacji w
próbie niezbędna do przeprowadzenia wnioskowania o wymaganej precyzji i ustalonej
ufności 1-α?

)

(

Dla szacowania

średniej

Dla szacowania

częstości

)

(

∗

−

Gdy przewidujemy p na
podstawie p*

Dok

adno

ść

estymacji; zagadnienie minimalnej

liczebno

ci pr

by. (2)