background image

1

Estymacja punktowa

i przedziałowa

background image

2

Wnioskowanie 

statystyczne

Obejmuje  zasady  i  metody  uogólniania 
wyników  otrzymanych  z  próby  losowej  na 
całą populację, z której ta próba pochodzi, 
na 

bazie 

reguł 

rachunku 

prawdopodobieństwa.
Jest  określane  jako  indukcyjna  statystyka 
matematyczna.

background image

3

Wnioskowanie 

statystyczne

Estymacja

Weryfikacja

          hipotez           

statystycznych

background image

4

Teoria estymacji

Badania  niepełne  (obejmujące  wybrane  jednostki) 

populacji  wymagają  określenia  estymatorów,  na 

podstawie  których  będziemy  weryfikowali  hipotezy 

badawcze, dotyczące ich parametrów.

Estymator  –  wielkość  (statystyka,  charakterystyka) 

wyznaczona  na  postawie  próby  losowej,  służąca  do 

oceny  wartości  nieznanego  parametru  populacji 

generalnej.

Estymatorem  parametru  Q  rozkładu  zmiennej  losowej  X 

nazywamy statystykę:

Z

n

 = f(X

1

, X

,…, X

n

)

której rozkład prawdopodobieństwa zależy od 

szacowanego parametru Q

background image

5

Teoria estymacji c.d.

Przykładowo  dla  populacji  generalnej  o  rozkładzie 

normalnym  N(,σ)  z  nieznaną  wartością  oczekiwaną  i 

wariancją,  statystyki  w  postaci  średniej  arytmetycznej 
oraz  wariancji  z  próby  są  estymatorami,  gdyż  ich 
rozkłady zależą od odpowiednich parametrów populacji.

Estymator  jako  statystyka  z  próby  jest  zmienną  losową. 

Posiada  zatem  rozkład  z  określonymi  parametrami. 
Rozkład estymatora Z

n

 jest determinowany przez rozkład 

zmiennej  losowej  X  w  populacji  generalnej,  przy  czym 
rozkład  ten  jest  zależny  od  parametru  Q.  Każda  z 
niezależnych zmiennych X

i

 (i = 1, 2, …, n) stanowiących 

próbę,  których  funkcją  jest  Z

n

,  ma  więc  taki  rozkład  jak 

zmienna X w populacji generalnej.

background image

6

Teoria estymacji c.d.2

      Konkretną  wartość  liczbową  z

n

  =  f(x

1

,  x

2

,  …,  x

n

),  jaką 

przyjmuje  estymator  Z

n

  parametru  Q  dla  realizacji  próby 

(x

1

,  x

2

,  …,  x

n

),  nazywamy  oceną  parametru  Q

 

.  Ocena  z

n

 

jest zatem realizacją zmiennej losowej Z

n

.

      Z  uwagi  na  to,  że  estymacji  pewnego  parametru  za 
pomocą  określonego  jego  estymatora  Z

n

  dokonujemy  na 

podstawie  wyników  próby  losowej,  istnieje  możliwość 
popełnienia 

błędu. 

Błędem 

szacunku 

(estymacji) 

parametru  Q  nazywamy  różnicę  między  uzyskaną 
liczbową oceną parametru i jego prawdziwą wartością, tj. 
z

n

– Q. 

 

 

background image

7

Teoria estymacji c.d.3

W  celu  uzyskania  dobrej  precyzji  szacunku  tzn.  małego 

błędu  estymacji,  należy  dbać  zarówno  o  prawidłowe 
losowanie  próby,  jak  i  o  dobór  możliwie  najlepszego 
estymatora Z

n

 dla oszacowanego parametru Q. W tym 

celu  wprowadza  się  pewne  własności,  które  powinien 
posiadać dobry estymator. Są nimi: nieobciążalność, 
zgodność, 

efektywność 

dostateczność 

(wystarczalność).

background image

8

Własności estymatora

Estymator  Z

n

  parametru  Q  nazywamy  nieobciążonym

jeżeli  jego  wartość  oczekiwana  jest  równa  szacowanemu 

parametrowi:    E(Z

n

)  =  Q.  W  przeciwnym  wypadku 

estymator 

Z

n

 

nazywamy 

obciążonym. 

Właściwość 

nieobciążoności  oznacza,  że  przy  wielokrotnym  losowaniu 

próby  średnia  z  wartości  przyjmowanych  przez  estymator 

nieobciążony równa się wartości szacowanego parametru

.

Estymator jest zgodny, gdy wraz ze wzrostem liczebności 

próby  uzyskuje  się  coraz  większe  prawdopodobieństwo 

tego,  że  estymator  będzie  przyjmować  wartości  coraz 

bliższe wartości szacowanego parametru Q.

background image

9

Własności estymatora 
c.d.

Jeśli  wyliczymy  wariancję  jako  rozrzut  ocen 
szacowanego parametru Q wokół prawdziwej jego 
wartości,  to  jako  estymator  najefektywniejszy 
uznaje  się  ten,  którego  wartość  tak  wyliczonej 
wariancji jest najmniejsza.

Estymator  Z

n

  parametru  Q  jest  dostateczny

jeżeli  zawiera  wszystkie  informacje,  jakie  na 
temat  parametru  Q  występują  w  próbie  i  żaden 
inny  estymator  nie  może  dać  dodatkowych 
informacji o szacowanym parametrze.

background image

10

Własności estymatora 
c.d.2

Na przykład spośród dwóch nieobciążonych estymatorów 
wartości oczekiwanej E(X), którymi są średnia arytmetyczna 
z próby oraz wartość:

drugi z wymienionych tu estymatorów nie jest dostatecznym, 
gdyż przy jego wyznaczaniu wzięto pod uwagę jedynie dwie 
wartości z próby.

2

~

max

min

x

x

X

Estymatory

parametryczne

nieparametryczne

punktowe

przedziałowe

background image

11

Przykłady estymatorów

Parametr

   

Estymator

        Właściwości

wartość przeciętna

     

       nieobciążony, zgodny,

w populacji μ

          najefektywniejszy

wariancja 

               

zgodny

w populacji σ

2

wariancja 

                             nieobciążony,

w populacji σ

2

                       

zgodny

2

1

2

1

1

)

(

1

1

)

(

1

1

X

X

n

X

X

n

X

n

n

i

i

n

i

i

n

i

i

2

^

2

S

S

X

background image

12

Rodzaje estymacji

W  estymacji  punktowej  za  ocenę  nieznanej 
wartości parametru Q w populacji przyjmuje się jedną 
konkretną  liczbę  otrzymaną  –  przy  zachowaniu 
odpowiednich reguł postępowania – z wyników próby 
losowej.  Zwykle  przy  szacowaniu  danego  parametru 
obok  jego  oceny  podaje  się  średni  błąd  szacunku 
estymatora nieobciążonego.

Prawdopodobieństwo tego, że w populacjach ciągłych 
estymator  przyjmie  wartość  równą  szacowanemu 
parametrowi równa się zeru. Jest to jeden z powodów, 
dla których stosuje się estymację przedziałową.

background image

13

Rodzaje estymacji c.d.

Estymacja  przedziałowa  polega  na  konstruowaniu 
przedziału  liczbowego,  który  z  określonym  z  góry  – 
bliskim  jedności  –  prawdopodobieństwem  będzie 
zawierał  nieznaną  wartość  szacowanego  parametru 

Q

Przedział  ten  nosi  nazwę  przedziału  ufności,  a  jego 
ogólna postać jest następująca:

prawd.

parametr

      poziom ufności

lewy kraniec

prawy kraniec przedziału ufności

 

 

1

2

1

n

n

Z

g

Q

Z

g

P

background image

14

Wyliczenie przedziału 
ufności dla średniej 
testem t-Studenta

Przedział ufności dla średniej populacji wyliczony 
na podstawie n elementowej próby określamy jako:

gdzie:  t

;  n-1

  -  oznacza  wartość  krytyczną  testu  t-

Studenta  dla  poziomu  istotności    i  liczby  stopni 

swobody =n-1.

x

n

x

n

s

t

x

s

t

x

1

;

1

;

background image

15

Przedział ufności - 
interpretacja parametrów

W celu prawidłowego zrozumienia od czego zależy 
wielkość przedziału ufności należy przeanalizować 
poszczególne zmienne które decydują o długości 
przedziału ufności:

-

liczebność próby ?,

-

rozrzut wyników w obrębie próby ?,

-

średnia arytmetyczna ?

background image

16

Przykład 1 (estymacja punktowa)

Pobrano próbę obejmującą n=10 następujących pomiarów 

koncentracji

SO

2

 (w µmol·mol

-1

) w powietrzu: 10,1; 10,9; 11,2; 11,6; 13,7; 

14,1; 15,6;

14,1;14,2; 12,9. Na podstawie tych danych oszacować 

przeciętne 

stężenie dwutlenku siarki oraz błąd szacunku.

)

57

,

0

(

84

,

12

57

,

0

10

79

,

1

79

,

1

1

10

)

(

84

,

12

10

1

)

(

)

(

2

10

1

10

1

2

1

x

i

i

i

i

n

i

i

x

x

s

x

x

s

x

x

n

x

x

s

n

s

s

s

x

background image

17

Wniosek

Szacowane przeciętne stężenie 
SO

2

 

w powietrzu wynosi:

)

μmol·mol

57

,

0

(

μmol·mol

84

,

12

1

1

background image

18

Przykład 2 (estymacja 
przedziałowa)

Na  podstawie  danych  z  przykładu  1  określić 

-stosując  95%  przedział  ufności  -  w  jakich 

granicach  znajduje  się prawdziwa  średnia  wartość 

stężenia dwutlenku siarki.

13

,

14

55

,

11

29

,

1

84

,

12

29

,

1

84

,

12

29

,

1

57

,

0

262

,

2

·

262

,

2

57

,

0

84

,

12

·

·

05

,

0

95

,

0

1

1

;

9

1

;

05

,

0

1

;

1

;

)

tablic

z

(

x

n

n

x

x

n

x

n

s

t

t

s

x

s

t

x

s

t

x

background image

19

prawdopodobieństwem 

popełnienia  błędu  mniejszym  niż 
0,05  można  stwierdzić,  że  średnia 
wartość  stężenia  dwutlenku  siarki 
w  powietrzu  jest  nie  mniejsza  niż 
11,55  μmol·mol

-1 

i  nie  większa  niż 

14,13 μmol·mol

-1 

.

WNIOSEK

background image

20

Przykład 3 (estymacja 
przedziałowa)

W laboratorium trzykrotnie (n=3) powtarzano analizę 

preparatu ze

względu na zawartość substancji czynnej  i uzyskano 

następujące

wyniki: 0,8403; 0,8363; 0,8447 g/l. Odchylenie standardowe 
jest znane i wynosi σ=0,0068 g/l. Określić 99% przedział 

ufności

średniej μ.

8505

,

0

08303

,

0

0101

,

0

8504

,

0

0101

,

0

08404

,

0

0101

,

0

3

0068

,

0

58

,

2

·

58

,

2

;

01

,

0

;

0068

,

0

8404

,

0

3

8447

,

0

8363

,

0

8403

,

0

n

z

z

x

n

z

x

n

z

x

background image

21

prawdopodobieństwem 

popełnienia  błędu  mniejszym  niż 
0,01  można  stwierdzić,  że  średnia 
wartość 

koncentracji 

substancji 

aktywnej  w  preparacie  jest  nie 
mniejsza  niż  0,8303  g/l

 

i  nie 

większa niż 0,8505 g/l.

WNIOSEK


Document Outline