background image

1

Podstawy estymacji: poj

Podstawy estymacji: poj

ę

ę

cie i podstawowe w

cie i podstawowe w

ł

ł

asno

asno

ś

ś

ci 

ci 

estymator

estymator

ó

ó

w (1)

w (1)

CZYM JEST ESTYMATOR ORAZ PROCES ESTYMACJI?

CZYM JEST ESTYMATOR ORAZ PROCES ESTYMACJI?

Chcemy 

wnioskować na 

podstawie próby o 

charakterystykach 

populacyjnych

Estymatorem będzie statystyka z próby która posłuży nam do estymacji (czyli 

wnioskowania) o nieznanych charakterystykach populacyjnych. 

nie znamy charakterystyk 
np.: średniej ani częstości

Populacja

Próba losowa

znamy statystyki z próby 
np.: średnią albo częstość

Estymacja jest zbiorem metod szacowania wartości pewnych nieznanych 
parametrów cechy statystycznej (bądź jej postaci funkcyjnej) na podstawie próby 
losowej.

background image

2

JAKIE RODZAJE ESTYMACJI I ESTYMATOR

JAKIE RODZAJE ESTYMACJI I ESTYMATOR

Ó

Ó

W MO

W MO

Ż

Ż

EMY WYR

EMY WYR

Ó

Ó

Ż

Ż

NI

NI

Ć

Ć

?

?

Estymacja

Parametryczna

Nieparametryczna

Dotyczy rozkładu 

zmiennej

punktowa

przedziałowa

Podstawy estymacji: poj

Podstawy estymacji: poj

ę

ę

cie i podstawowe w

cie i podstawowe w

ł

ł

asno

asno

ś

ś

ci 

ci 

estymator

estymator

ó

ó

w (2)

w (2)

My zajmiemy się jedynie estymacją punktową oraz 

przedziałową średniej oraz częstości

background image

3

Θ – szacowany parametr populacyjny

T

n

– estymator

t

n

– ocena parametru Θ za pomocą estymatora T

n

Ponieważ szacunku dokonujemy na podstawie próby losowej istnieje możliwość
popełnienia błędu. Jest to różnica między estymatorem a wartością parametru:

d

n

T

=

Θ

Konkretna wartość jaką przyjmuje estymator (a więc wartość statystyki z próby) dla 
danej próby losowej nazywamy oceną parametru (t

n

).

Taka ocena parametru jest więc punktowym oszacowaniem nieznanego parametru 
populacyjnego.

Podstawy estymacji: poj

Podstawy estymacji: poj

ę

ę

cie i podstawowe w

cie i podstawowe w

ł

ł

asno

asno

ś

ś

ci 

ci 

estymator

estymator

ó

ó

w (3)

w (3)

PODSTAWOWE OZNACZENIA

PODSTAWOWE OZNACZENIA

background image

4

Nieznany parametr Θ

Wybieramy estymator T

n

realizacją w próbie losowej jest

t

n

Ocena (

t

n

) parametru Θ za pomocą estymatora T

n

pochodzi z próby losowej: 

stąd estymator jest zmienną losową → patrz: rozkłady statystyk z próby

d

n

T

=

Θ

Możemy 
popełnić błąd

Na podstawie oceny  - t

n

dokonujemy estymacji punktowej lub przedziałowej

Podstawy estymacji: poj

Podstawy estymacji: poj

ę

ę

cie i podstawowe w

cie i podstawowe w

ł

ł

asno

asno

ś

ś

ci 

ci 

estymator

estymator

ó

ó

w (4)

w (4)

nie znamy charakterystyk 
np.: średniej ani częstości

Populacja

Próba losowa

znamy statystyki z próby 
np.: średnią albo częstość

background image

5

JAKI ESTYMATOR B

JAKI ESTYMATOR B

Ę

Ę

DZIE 

DZIE 

DOBRYM

DOBRYM

ESTYMATOREM? 

ESTYMATOREM? 

W

W

Ł

Ł

ASNO

ASNO

Ś

Ś

CI ESTYMATOR

CI ESTYMATOR

Ó

Ó

W.

W.

Bior

Bior

ą

ą

c pod uwag

c pod uwag

ę

ę

te kryteria najlepszymi punktowymi estymatorami 

te kryteria najlepszymi punktowymi estymatorami 

ś

ś

redniej i cz

redniej i cz

ę

ę

sto

sto

ś

ś

ci populacyjnej b

ci populacyjnej b

ę

ę

d

d

ą

ą

ś

ś

rednia i cz

rednia i cz

ę

ę

sto

sto

ść

ść

z pr

z pr

ó

ó

by.

by.

Jakość estymatora punktowego możemy również ocenić za pomocą:

• Odchylenia standardowego estymatora D(T

n

– jest to średni błąd szacunku 

• Błędu względnego estymatora określanego jako 

n

n

n

T

T

D

T

V

)

(

)

(

^

^

=

Obciążenie estymatora:

estymator jest nieobciążony jeśli zachodzi

E(Tn)=Θ

Efektywność estymatora:

Z dwóch estymatorów efektywniejszy jest ten którego 

wariancja jest mniejsza. Mniejsze prawdopodobieństwo uzyskania w próbie 
losowej wartości bardzo odbiegających od parametru Θ

Zgodność estymatora:

estymator jest zgodny jeśli zachodzi: 

(

)

1

lim

=

<

Θ

ε

n

n

T

P

Podstawy estymacji: poj

Podstawy estymacji: poj

ę

ę

cie i podstawowe w

cie i podstawowe w

ł

ł

asno

asno

ś

ś

ci 

ci 

estymator

estymator

ó

ó

w (4)

w (4)

background image

6

Zagadnienie estymacji przedzia

Zagadnienie estymacji przedzia

ł

ł

owej 

owej 

ś

ś

redniej i 

redniej i 

cz

cz

ę

ę

sto

sto

ś

ś

ci

ci

¾

Punktowa ocena parametru za pomocą estymatora może być obciążona błędem lub 
całkowicie nietrafna: wynika to z losowości próby oraz z faktu że w przypadku cech 
ciągłych prawdopodobieństwo, że estymator przyjmie wartość szacowanego 
parametru jest równe zero.

¾

Dlatego też stosujemy tzw. estymację przedziałową

konstrukcja przedziału 

liczbowego (tzw. przedziału ufności), który z założonym prawdopodobieństwem 
pokrywa wartość szacowanego parametru.

¾

W przypadku estymacji punktowej otrzymujemy jedną liczbę a w przypadku 
estymacji przedziałowej otrzymujemy przedział liczbowy. 

¾

Dzięki estymacji przedziałowej możemy ocenić jak często uznanie za wartość
parametru konkretnej liczby z proponowanego przedziału jest oszacowaniem 
prawidłowym. 

¾

Częstość oszacowań prawidłowych zwana jest współczynnikiem ufności 
oznaczana jako 1-α. Podkreśla to, że zależy nam na jak największej liczbie 
oszacowań prawidłowych i na małej liczbie oszacowań nieprawidłowych (α). 
Zazwyczaj α to mała liczba np.: 0,05 lub 0,01.

background image

7

Jak konstruujemy przedzia

Jak konstruujemy przedzia

ł

ł

ufno

ufno

ś

ś

ci?

ci?

Zaczynamy od oceny punktowej parametru czyli T

n

Znając błąd standardowy estymatora          oraz zakładając że jego rozkład 
jest normalny oraz że jest on nieobciążony, to wówczas 68% wartość jakie 
może on przyjmować należy do przedziału:

Czyli z prawdopodobieństwem 0,68 otrzymujemy takie oceny parametru 
które należą do tego przedziału. Przedział ten będzie miał krańce o 
wartościach:

Ponieważ punktowa ocena parametru jak i jego błąd standardowy pochodzą z 
realizacji próby losowej za każdym razem możemy otrzymać inną wartość
krańca przedziału jednak zawsze przedziały te będą zawierały oszacowany 
parametr Θ

)

(

ˆ

n

T

D

>

Θ

Θ

<

)

(

ˆ

 ;

 )

(

ˆ

n

n

T

D

T

D

>

+

<

)

(

ˆ

  

;

  

)

(

ˆ

n

n

n

n

T

D

t

T

D

t

background image

8

f(t

n

)

t

n

D(T

n

)-Θ E(T

n

)=Θ D(T

n

)+Θ

Dysponując jedynie tymi przedziałami nie możemy jednoznacznie wskazać gdzie 
znajduje się szacowany parametr. Możemy jedynie powiedzieć,  że szacowany 
parametr będzie zawierał się w przedziale z określonym prawdopodobieństwem

(

)

68

,

0

)

(

ˆ

)

(

ˆ

=

+

<

Θ

<

n

n

n

n

T

D

t

T

D

t

P

Można powiedzieć że 68 na 100 skonstruowanych przedziałów będzie zawierało 
szacowany parametr. Jednocześnie częstość błędnych oszacowań wynosi 0,32. 

Chcielibyśmy mieć więcej oszacowań prawidłowych. Możemy to zrobić zwiększając 
rozpiętość przedziału do dwukrotnego lub trzykrotnego błędu  średniego. Ogólnie 
możemy zwiększyć tę rozpiętość do u

α

-krotnego błędu średniego

Jak konstruujemy przedzia

Jak konstruujemy przedzia

ł

ł

ufno

ufno

ś

ś

ci? (2)

ci? (2)

background image

9

Wtedy: rośnie częstość oszacowań prawidłowych oznaczana przez 1-α natomiast 
zacznie maleć częstość oszacowań nieprawidłowych oznaczona jako α.

Jeśli estymator ma rozkład normalny to związek poziomu ufności ze zmienną
losową opisującą krotność odchylenia standardowego estymatora jaką należy 
brać pod uwagę konstruując przedział jest następujący:

(

)

α

α

=

1

U

P

Gdy                → P=0,68

1

U

Gdy                → P=0,95

2

U

Gdy                → P=0,99

3

U

>

+

<

)

(

  

;

  

)

(

^

n

^

n

n

n

T

D

t

T

D

t

>

+

<

)

(

2

  

;

  

)

(

2

^

n

^

n

n

n

T

D

t

T

D

t

>

+

<

)

(

3

  

;

  

)

(

3

^

n

^

n

n

n

T

D

t

T

D

t

Jak konstruujemy przedzia

Jak konstruujemy przedzia

ł

ł

ufno

ufno

ś

ś

ci? (3)

ci? (3)

background image

10

α

α

α

=

+

<

Θ

<

1

)

(

  

  

  

)

(

n

n

n

n

T

D

u

t

T

D

u

t

P

Ogólnie konstrukcję przedziału ufności możemy zapisać następująco:

Krańce przedziału są losowe gdyż zmienia się wartość oceny punktowej 
parametru. Jednak zawsze, z prawdopodobieństwem 1-α, pokryje on szukaną
wartość parametru.

Przy ustalonej liczebności próby, przyjęte prawdopodobieństwo 1-α rozstrzyga o 
tym jaka będzie rozpiętość przedziału. 

Im większa częstość poprawnych oszacowań tym większa wymagana krotność
błędu standardowego i szerszy przedział. 

Zależność między precyzją a pewnością oszacowania 

wysoka wiarygodność

ufność nie sprzyja precyzji oszacowania.

Jak konstruujemy przedzia

Jak konstruujemy przedzia

ł

ł

ufno

ufno

ś

ś

ci? (4)

ci? (4)

background image

11

Jak konstruujemy przedzia

Jak konstruujemy przedzia

ł

ł

ufno

ufno

ś

ś

ci? (5)

ci? (5)

background image

12

Dok

Dok

ł

ł

adno

adno

ść

ść

estymacji; zagadnienie minimalnej 

estymacji; zagadnienie minimalnej 

liczebno

liczebno

ś

ś

ci pr

ci pr

ó

ó

by.

by.

)

(

n

T

D

u

d

=

α

Problem precyzji oszacowania sprowadza się do wyboru między długością
przedziału a częstością trafnych oszacowań: 

szerszy przedział

większa częstości trafnych oszacowań

mała precyzja

wąski przedział

niższa częstość trafnych oszacowań

większa precyzja

Szerokość

przedziału możemy modyfikować

przez zmiany w wartości 

prawdopodobieństwa 1-α

to rozwiązanie nas nie interesuje!

Możemy także „manipulować” wielkością próby w celu osiągnięcia założonej 
precyzji oszacowania. Precyzja jest mierzona jest za pomocą tzw.  błędu 
maksymalnego 
czyli połowy długości przedziału. Błąd ten oznaczany jest jako d:

background image

13

2

2

4

1
d

u

n

α

=

Gdy nie ma przewidywań co do 
wartości za p* przyjmujemy 0,5

Stąd możemy postawić pytanie: Jaka powinna być minimalna liczba obserwacji w 
próbie niezbędna do przeprowadzenia wnioskowania o wymaganej precyzji i ustalonej 
ufności 1-α?

2

2

2

1

)

(

d

X

D

u

n

α

=

Dla szacowania 

średniej

Dla szacowania 

częstości

2

2

)

1

(

d

p

p

u

n

=

α

Gdy przewidujemy na     
podstawie p*

Dok

Dok

ł

ł

adno

adno

ść

ść

estymacji; zagadnienie minimalnej 

estymacji; zagadnienie minimalnej 

liczebno

liczebno

ś

ś

ci pr

ci pr

ó

ó

by. (2)

by. (2)

background image

14

Typowe zadania

Typowe zadania

1. Z przygotowanej do sprzedaży partii skrzynek z jabłkami w pewnej hurtowni 

wybrano losowo 200 skrzynek jabłek i 146 z nich zakwalifikowano jako I 
gatunek. Oszacować punktowo frakcji jabłek I gatunku w całej partii. Wyznaczyć
przedział ufności dla frakcji jabłek I gatunku. Przyjąć 1 -

α = 0,90.

3. Jak liczna powinna być próba by oszacować odsetek pracowników, 

awansujących trzykrotnie w karierze zawodowej z maksymalnym błędem 2% ? 
Jeśli badanie pilotażowe wskazuje iż spodziewana wielkość kształtuje się w 
granicach 15%?

2. Wiadomo, że w przedsiębiorstwie X średni czas losowo wybranych 100 rozmów 

międzymiastowych wynosił 10 min. i charakteryzował się zmiennością 40%, 
należy ocenić przedziałowo średni czas trwania tej rozmowy. Przyjąć 1-

α = 0,95.