background image

Estymatory średniej i dyspersji 

 

Estymatory średniej i dyspersji.  
 
Zakładamy, że w czasie doświadczenia otrzymaliśmy zestaw 

n

 wartości 

zmiennej losowej 

X

 o pewnym rozkładzie prawdopodobieństwa (gęsto-

ści prawdopodobieństwa).  
 

{

}

n

x

x

x

x

,...

,

,

3

2

1

  

Prawdopodobieństwo otrzymania dowolnej z tych wartości wynosi  
 

)

(

i

x

P

 albo 

dx

x

p

dx

x

x

dP

i

i

i

=

+

)

(

)

,

(

  

odpowiednio dla zmiennej dyskretnej albo ciągłej.  
 
Jeżeli możemy założyć, że kolejne wartości są niezależne, to prawdopo-
dobieństwo otrzymania całego ich zestawu 

{

}

n

x

x

x

x

,...

,

,

3

2

1

 wynosi 

)

(

})

({

1

i

n

i

i

x

P

x

P

=

=

 dla zmiennej dyskretnej albo 

(

)

dx

x

p

x

dP

i

n

i

i

=

=

)

(

})

({

1

 dla zmiennej ciągłej. Prawdopodobieństwo to 

zależy od samych wartości 

}

{

i

x

 i od postaci rozkładu prawdopodobień-

stwa. Na przykład dla rozkładu normalnego 

)

,

(

σ

µ

N

  

 

dx

x

dx

x

x

dP

i

i

i

 −

=

+

2

2

1

exp

2

1

)

,

(

σ

µ

π

σ

  

prawdopodobieństwo będzie zależało od średniej i dyspersji tego rozkła-
du.  

 



 −

=

=

dx

x

x

dP

i

n

i

i

2

1

2

1

exp

2

1

})

({

σ

µ

π

σ

  

 

( )

dx

x

x

dP

n

i

n

i

i

n

i

1

1

2

2

1

exp

2

1

})

({

=

=

 −

=

σ

µ

π

σ

  

Funkcja  

 

 −

=

=

n

i

i

n

i

x

x

p

1

2

2

1

exp

2

1

)

,

};

({

σ

µ

π

σ

σ

µ

  

ma sens funkcji rozkładu gęstości prawdopodobieństwa otrzymania ze-
stawu wartości 

{

}

n

x

x

x

x

,...

,

,

3

2

1

.  

 

background image

Estymatory średniej i dyspersji 

 

Metoda największej wiarogodności  
 
Wykonując pomiary nie znamy wartości mierzonej, tzn. nie znamy para-
metrów 

µ

 i 

σ

 rozkładu 

)

,

};

({

σ

µ

i

x

p

 i celem pomiarów jest ich wyzna-

czenie. Możemy jednak przypuszczać, że to co się wydarzyło, to znaczy, 
że otrzymaliśmy zestaw konkretnych wartości 

{

}

n

x

x

x

x

,...

,

,

3

2

1

, było naj-

bardziej prawdopodobne. Zamiast zatem pytać jakie są faktyczne warto-
ści parametrów 

µ

 i 

σ

 (na to pytanie zwykle nie można odpowiedzieć), 

możemy zapytać o coś innego.  
Dla uproszczenia załóżmy jeszcze, że interesuje nas tylko wartość śred-
nia, a dyspersję albo znamy skądinąd, albo nie jest nam potrzebna jej 
wartość.  
To inne pytanie brzmi:  
Dla jakiej wartości 

'

µ

 hipotetycznej średniej rozkładu otrzymanie 

zestawu wartości 

{

}

n

x

x

x

x

,...

,

,

3

2

1

 jest najbardziej prawdopodobne?  

Czyli dla jakiej wartości 

'

µ

 funkcja  

 

 −

=

=

n

i

i

n

x

p

1

2

'

2

1

exp

2

1

)

'

(

σ

µ

π

σ

µ

  

osiąga maksimum przy ustalonych 

{

}

n

x

x

x

x

,...

,

,

3

2

1

 i 

σ

.  

Na takie pytanie można odpowiedzieć, i to stosunkowo łatwo, chodzi 
bowiem o znalezienie maksimum funkcji jednej zmiennej.   
Funkcja 

)

'

(

µ

p

 osiąga maksimum kiedy wartość sumy  

 

2

1

'

=

 −

n

i

i

x

σ

µ

  

jest minimalna. Oznacza to, że pochodna sumy przyjmuje wartość zero  

 

0

'

'

2

1

=

 −

=

n

i

i

x

σ

µ

µ

  

background image

Estymatory średniej i dyspersji 

 

Pochodna wynosi  

 

=

=

=

 −

=

 −

 −

=

 −

n

i

i

n

i

i

n

i

i

x

x

x

1

1

2

1

'

2

1

'

2

'

'

σ

µ

σ

σ

σ

µ

σ

µ

µ

  

i osiąga zero gdy zeruje się suma  

 

0

'

1

=

 −

=

n

i

i

x

σ

µ

  

 

σ

σ

µ

=

 −

=

  

0

'

1

n

i

i

x

  

 

0

'

1

=

=

µ

n

x

n

i

i

  

czyli gdy 

'

µ

 jest równe średniej arytmetycznej wartości 

{

}

n

x

x

x

x

,...

,

,

3

2

1

  

 

=

=

n

i

i

x

n

1

1

'

µ

  

Wartość 

'

µ

 jest estymatorem największej wiarogodności wartości śred-

niej rozkładu 

)

,

(

σ

µ

N

.  

 
 
Jeżeli 

{

}

n

x

x

x

x

,...

,

,

3

2

1

 są wynikami bezpośrednich pomiarów wielkości 

fizycznej 

X

, to ich średnia arytmetyczna jest najlepszym oszacowaniem 

wartości 

X

. Oprócz szacunku samej wartości musimy podać też nie-

pewność oszacowania, czyli pierwiastek wariancji 

'

µ

. Oznaczmy ją 

przez 

)

'

(

µ

V

.  

 

=

i

x

n

V

V

1

)

'

(

µ

  

W celu obliczenia wartości prawej strony możemy wykorzystać wprowa-
dzone poprzednio prawo przenoszenia niepewności (w istocie było to 
prawo przenoszenia wariancji, które dla naszych celów przekształciliśmy 
w prawo przenoszenia niepewności), a właściwie pewne specjalne wzory 
wyprowadzone z tego prawa.  

 

( )

=

i

i

x

V

n

x

n

V

2

1

1

  

Jeżeli wartości 

{

}

n

x

x

x

x

,...

,

,

3

2

1

 są niezależne, to  

 

( )

2

)

(

σ

=

=

n

x

V

x

V

i

i

  

background image

Estymatory średniej i dyspersji 

 

Ostatecznie  

 

n

n

n

V

2

2

2

1

)

'

(

σ

σ

µ

=

=

  

 
Czyli wynik serii pomiarów mógłby wyglądać na przykład tak:  

 

=

=

=

n

i

i

x

n

X

1

1

µ

σ

n

X

u

1

)

(

=

 . 

 
 

  

 
Załóżmy teraz, że znamy wartość średnią rozkładu 

µ

, a chcielibyśmy 

znaleźć estymator dyspersji tego rozkładu 

'

σ

.  

 
Jeżeli 

'

σ

 ma być estymatorem największej wiarogodności, to tym razem 

funkcja  

 

 −

=

=

n

i

i

n

x

p

1

2

'

2

1

exp

2

'

1

)

'

(

σ

µ

π

σ

σ

  

ma osiągnąć maksimum ze względu na 

'

σ

, czyli  

 

0

)

'

(

'

=

σ

σ

p

  

 

0

'

2

1

exp

2

'

1

'

1

2

=



 −

=

n

i

i

n

x

σ

µ

π

σ

σ

 

 

0

'

)

(

2

'

1

2

'

1

2

'

1

1

3

2

(...)

(...)

2

1

=





+

=

n

i

i

n

n

x

e

e

n

σ

µ

π

σ

π

σ

π

σ

  

 

0

'

)

(

2

'

1

2

'

1

'

1

3

2

(...)

(...)

=





+

 −

=

n

i

i

n

n

x

e

e

n

σ

µ

π

σ

π

σ

σ

  

 
Po podzieleniu stronami przez  

 

(...)

2

'

1

e

n

π

σ

  

otrzymujemy  

 

2

1

3

2

'

  

0

'

)

(

'

σ

σ

µ

σ

=





+

 −

=

n

i

i

x

n

  

background image

Estymatory średniej i dyspersji 

 

 

(

)

0

'

1

2

2

=

+

=

n

i

i

x

n

µ

σ

  

czyli  

 

(

)

=

=

n

i

i

x

n

1

2

2

1

'

µ

σ

  

 

(

)

=

=

n

i

i

x

n

1

2

1

'

µ

σ

  

Estymatorem największej wiarogodności wariancji rozkładu 

)

,

(

σ

µ

N

 jest 

2

'

σ

 – średni kwadrat odchylenia wartości 

{

}

n

x

x

x

x

,...

,

,

3

2

1

 od wartości 

średniej tego rozkładu, a estymatorem dyspersji jest 

'

σ

.  

 
Najczęściej nie znamy żadnego parametrów rozkładu i musimy je osza-
cować tylko na podstawie uzyskanych wartości doświadczalnych 

{

}

n

x

x

x

x

,...

,

,

3

2

1

.  

 
Nie zmienia to sposobu wyznaczenia wartości 

'

µ

 i w dalszym ciągu naj-

lepszym estymatorem (w sensie metody największej wiarogodności) po-
zostaje średnia arytmetyczna.  

 

=

=

n

i

i

x

n

1

1

'

µ

.  

Do wyznaczenia estymatora dyspersji (albo wariancji) potrzebna jest 
znajomość wartości średniej rozkładu. Jeżeli użyjemy w tym celu warto-
ści 

'

µ

 zamiast 

µ

, to moglibyśmy zapisać  

 

(

)

=

=

n

i

i

x

n

1

2

2

'

1

'

µ

σ

.  

Okazuje się jednak, że taki estymator jest obciążony, to znaczy, że war-
tość średnia 

2

'

σ

 jest różna od 

2

σ

. W statystyce dowodzi się, że  

 

2

2

)

'

(

σ

σ

<

E

.  

background image

Estymatory średniej i dyspersji 

 

Rzeczywiście  

(

)

(

)

=





+

=





=

=

=

n

i

i

n

i

i

x

n

E

x

n

E

E

1

2

1

2

2

)

'

(

)

(

1

'

1

)

'

(

µ

µ

µ

µ

σ

  

 

[

]

=





=

=

n

i

i

x

n

E

1

2

)

'

(

)

(

1

µ

µ

µ

 

 

[

]

=





+

=

=

n

i

i

i

x

x

n

E

1

2

2

)

'

(

)

'

)(

(

2

)

(

1

µ

µ

µ

µ

µ

µ

 

 

=





+

=

=

=

2

1

1

2

)

'

(

1

)

(

1

)

'

(

2

)

(

1

µ

µ

µ

µ

µ

µ

n

n

x

n

x

n

E

n

i

i

n

i

i

  

 

=





+

=

=

2

2

1

2

)

'

(

)

'

(

2

)

(

1

µ

µ

µ

µ

µ

n

i

i

x

n

E

  

 

=





=

=

2

1

2

)

'

(

)

(

1

µ

µ

µ

n

i

i

x

n

E

  

 

(

) (

)

=

=

=

2

1

2

)

'

(

)

(

1

µ

µ

µ

E

x

E

n

n

i

i

  

 

(

) (

)

)

'

(

)

(

)

'

(

)

(

2

2

µ

µ

µ

µ

V

x

V

E

x

E

i

=

=

  

Czyli  

 

( )

2

2

2

2

1

1

'

σ

σ

σ

σ

n

n

n

E

=

=

  

i  

 

(

)

=

=

n

i

i

x

n

s

1

2

2

'

1

1

µ

  

jest już nieobciążonym estymatorem wariancji.  
Po uwzględnieniu ostatniego wzoru wynik pomiarów można by przed-
stawić następująco:  

 

=

=

=

n

i

i

x

n

x

X

1

1

(

)

=

n

i

i

x

x

n

n

X

u

1

2

)

1

(

1

)

(

.  

 

background image

Estymatory średniej i dyspersji 

 

Średnia ważona  
 
We wzorze  

 

(

)

dx

x

P

x

dP

i

n

i

i

=

=

)

(

})

({

1

  

wcale nie jest konieczne, żeby wszystkie 

i

x

 miały dokładnie takie same 

rozkłady. Równie dobrze moglibyśmy zapisać  

 

(

)

=

=

n

i

i

i

i

dx

x

p

x

dP

1

)

(

})

({

  

a funkcja  

 

=

=

n

i

i

i

i

x

p

x

p

1

)

(

})

({

  

miałaby taką samą interpretację jak poprzednio.  
 
Załóżmy, że rozkłady  

 





 −

=

2

2

1

exp

2

1

)

,

;

(

i

i

i

i

i

i

x

x

p

σ

µ

π

σ

σ

µ

  

mają wszystkie tę samą wartość średnią i różne dyspersje.  
Wtedy rozkład gęstości prawdopodobieństwa otrzymania ciągu wartości 

{

}

n

x

x

x

,...

,

2

1

 wyniesie  

 





 −





=

=

=

=

=

n

i

i

i

n

i

i

n

i

i

i

i

i

x

x

p

x

p

1

2

1

1

2

1

exp

2

1

)

,

;

(

})

({

σ

µ

π

σ

σ

µ

.  

Taki przypadek odpowiada sytuacji, kiedy kolejne wartości 

{

}

n

x

x

x

,...

,

2

1

 

wyznaczono niezależnie metodami różniącymi się precyzją scharaktery-
zowaną różnymi wartościami 

i

σ

.  

 

background image

Estymatory średniej i dyspersji 

 

Stosując metodę największej wiarogodności do wyznaczenia estymatora 
wartości średniej 

µ

 będziemy szukali maksimum funkcji  

 





 −





=

=

=

n

i

i

i

n

i

i

x

p

1

2

1

'

2

1

exp

2

1

)

'

(

σ

µ

π

σ

µ

.  

Podobnie jak poprzednio odpowiada to znalezieniu minimum sumy  

 

=





 −

n

i

i

i

x

1

2

'

σ

µ

  

 

 

0

'

2

'

'

1

2

1

2

=





 −

=





 −

=

=

n

i

i

i

n

i

i

i

x

x

σ

µ

σ

µ

µ

  

Stąd  

 

0

'

1

2

1

2

=









=

=

n

i

i

n

i

i

i

x

σ

µ

σ

  

 

=

=





=





n

i

i

n

i

i

i

x

1

2

1

2

1

'

σ

µ

σ

  

i ostatecznie  

 

(

)

( )

=

=

=

n

i

i

n

i

i

i

x

1

2

1

2

1

'

σ

σ

µ

  

W celu ustalenia wariancji tego estymatora obliczamy pochodne cząst-
kowe:  

 

(

)

( )

( )

=

=

=

=

=

n

i

i

i

n

i

i

n

i

i

i

i

i

x

x

x

1

2

2

1

2

1

2

1

1

1

'

σ

σ

σ

σ

µ

  

i zgodnie z prawem przenoszenia wariancja wynosi  

 

( )

( )

[

]

( )

∑ ∑

∑ ∑

=

=

=

=

=

2

1

2

2

2

1

2

2

2

2

1

1

1

1

1

1

)

'

(

i

n

i

i

i

n

i

i

i

i

V

σ

σ

σ

σ

σ

σ

µ

  

 

background image

Estymatory średniej i dyspersji 

 

Niepewności względne  
 
Może się zdarzyć, że znamy względne wartości 

i

σ

 nie znając przy tym 

ich wartości bezwzględnych. Wprowadzimy czynniki wagowe (wagi) 

i

w

  

 

i

i

kw

σ

1

=

  

gdzie 

k

 jest pewną stałą. Znajomość względnych niepewności odpowia-

da znajomości wartości wag 

i

w

 nawet jeżeli 

i

σ

 pozostają nieznane.  

Wtedy  

 

(

)

( )

(

)

( )

(

)

( )

=

=

=

=

=

=

=

=

=

n

i

i

n

i

i

i

n

i

i

n

i

i

i

n

i

i

n

i

i

i

w

x

w

kw

x

kw

x

1

1

1

1

1

2

1

2

1

'

σ

σ

µ

  

 
W celu ustalenia wariancji tak obliczonej średniej wprowadzimy nową 
wielkość – średnią ważoną wariancję wyników 

2

σ

 

 

 

1

'

1

)

'

(

2

2

2

2





=

=

n

n

w

x

w

n

n

w

x

w

i

i

i

i

i

i

µ

µ

σ

  

 
Wartość w nawiasie jest różnicą średniego ważonego kwadratu wyników 
i kwadratu średniej ważonej wyników. Pozostały czynnik uwzględnia fakt, 
że wartość 

'

µ

 została obliczona z tych samych wyników, zmniejszając 

liczbę stopni swobody.  
Przez analogię z wcześniej otrzymanymi związkami możemy zapisać, że 
wariancja 

'

µ

 wynosi  

 





=

=

2

2

2

'

1

1

)

'

(

µ

σ

µ

i

i

i

w

x

w

n

n

V

  

 
Jeżeli chcielibyśmy znaleźć nieznane dotąd wartości 

k

 i 

i

σ

, to możemy 

przyrównać  

 

=

=

i

i

w

k

n

1

1

1

2

2

σ

σ

  

background image

Estymatory średniej i dyspersji 

 

10 

czyli  

 





=

=

2

2

2

'

1

1

µ

σ

i

i

i

i

i

w

x

w

w

n

w

n

k

  

oraz  

 

i

i

i

i

nw

w

kw

=

=

2

2

1

σ

σ

  

 
Przykład  
Studentka przeprowadza doświadczenie w celu określenia napięcia 
ogniwa normalnego. Wykonuje 40 pomiarów przy pomocy pewnego 
przyrządu i znajduje, że  
 

V

 

0220

,

1

1

=

x

  

z odchyleniem standardowym  
 

V

 

010

,

0

1

=

s

  

Po przyjrzeniu się wynikom zauważa, że mogłaby ulepszyć układ pomia-
rowy i zmniejszyć niepewność o czynnik 2,5 

V

 

0040

,

0

2

=

s

. Wykonuje 

kolejnych 10 pomiarów, które dają  
 

V

 

0180

,

1

2

=

x

  

 
Średnia wyników wszystkich wykonanych pomiarów wynosi  

 

(

)

( )

(

) (

)

( ) ( )

=

=

=

=

=

=

+

+

=

=

40

1

10

1

2

2

2

1

10

1

2

2

2

40

1

2

1

1

50

1

2

50

1

2

1

1

1

i

i

i

i

i

i

i

i

i

i

i

s

s

s

x

s

x

x

x

σ

σ

  

 

 

    

V

 

25

,

6

00

,

4

018

,

1

25

,

6

022

,

1

00

,

4

V

 

004

,

0

10

01

,

0

40

004

,

0

018

,

1

10

01

,

0

022

,

1

40

2

2

2

2

+

+

=

+

+

=

  

 
 

    

V

 

019561

,

1

=

  

 
Niepewność wartości średniej napięcia  

 

V

 

000987

,

0

004

,

0

10

01

,

0

40

)

(

2

1

2

2

=

+

=

x

u

  

background image

Estymatory średniej i dyspersji 

 

11 

 
Ostateczny wynik należy zapisać w formie  
 
 

V

 

01956

,

1

=

x

V

 

00099

,

0

)

(

=

x

u

  

lub alternatywnie 

V

 

)

99

(

 

01956

,

1

=

x

  

 
Niepewność końcowego wyniku jest mniejsza od niepewności uzyska-
nych w każdej z części doświadczenia  

 

V

 

0016

,

0

V

 

40

01

,

0

)

(

1

=

=

x

u

,  

V

 

0013

,

0

V

 

10

004

,

0

)

(

2

=

=

x

u

 

 
Co by było gdyby studentka nie znała bezwzględnych wartości niepew-
ności swoich pomiarów, a tylko wiedziała (np. od prowadzącego zajęcia), 
że zostały zmniejszone w drugiej części o czynnik 2,5?  
Średnią ważoną może obliczyć w taki sposób  

 

1

1

2

1

1

=

=

s

w

,  

2

2

2

2

5

,

2

1

=

=

s

w

 

 

(

)

( )

V

 

01956

,

1

V

 

5

,

2

10

1

40

018

,

1

5

,

2

10

022

,

1

1

40

2

2

1

1

=

+

+

=

=

=

=

n

i

i

n

i

i

i

w

x

w

x

  

Niepewność średniej ważonej wyniesie wtedy  

 

+

+

=





=

=

=

2

2

10

1

2

2

2

40

1

2

1

2

2

5

,

2

10

40

5

,

2

39

1

1

1

)

(

x

x

x

x

w

x

w

n

x

u

i

i

i

i

i

i

i

  

 
 
 

background image

Estymatory średniej i dyspersji 

 

12 

Przykład  
Student wykonał 100 niezależnych pomiarów długości drewnianego 
klocka. Wyniki, po korekcie błędów systematycznych, mieszczą się w 
przedziale od około 18 do 22 cm i wiele z nich powtarza się. Na wykresie 
przedstawiono je w postaci histogramu (słupki narysowane cienką ciągłą 
linią) o szerokości przedziału 0,2 cm. Jeżeli obserwowany rozkład wyni-
ka z błędów przypadkowych, to jest bardzo prawdopodobne, że da się 
opisać przy pomocy rozkładu Gaussa (normalnego). Rozkład narysowa-
ny linia ciągłą odpowiada parametrom wyznaczonym z wyników pomia-
rów: średnia 19,98 cm i odchylenie standardowe 0,54 cm.  
 

18.00

19.00

20.00

21.00

22.00

długość zmierzona, cm

0

4

8

12

16

lic

zb

a p

omi

arów

 

 
Histogram z szarych słupków jest wyliczony z tego rozkładu normalnego 
i przedstawia oczekiwaną (średnią) liczbę pomiarów w każdym przedzia-
le. Rozkład narysowany linią przerywaną odpowiada 

)

50

,

0

 

;

00

,

20

(

N

.  

background image

Estymatory średniej i dyspersji 

 

13 

Usuwanie wyników odstających  
 
Załóżmy, że wśród wyników zanotowanych przez studenta w karcie po-
miarowej znalazł się jeden wyraźnie inny od pozostałych – 91,2 cm. 
Zwykle w takim przypadku nie ma wątpliwości, że nastąpiła pomyłka 
przy zapisywaniu wyniku i wynik odrzuca się jako tzw. błąd gruby. Sytu-
acja wygląda jednak inaczej jeżeli odstający wynik wynosiłby np. 22,2 
cm. Jeżeli w zestawie 100 wyników wartość 21,2 zastąpimy przez 22,2, 
to średnia i odchylenie standardowe zmienią się odpowiednio na 19,99 i 
0,54. Odległość wyniku od średniej wynosi prawie 4 odchylenia standar-
dowe. Z rozkładu Gaussa 

)

54

,

0

 

;

99

,

19

(

N

 można wyliczyć, że prawdo-

podobieństwo przypadkowego pojawienia się rezultatu, który jest nie-
mniej oddalony od średniej wynosi około 12

10

-5

, to znaczy że spodzie-

wana liczba wyników 

22,2 cm (lub 

17,78 cm) wynosi 12

10

-5

 

×

 100 = 

0,012. Czy tak mało prawdopodobny rezultat możemy odrzucić?  
 
Kryterium Chauveneta  
Odstający rezultat 

0

x

 można odrzucić, jeżeli spodziewana liczba takich 

przypadków, że 

|

|

|

|

0

x

x

x

x

  

 

5

,

0

|)

|

|

(|

0

<

=

x

x

x

x

P

N

n

  

 
Kryterium Chauveneta należy stosować z dużą ostrożnością, mając 
pewność, że potrafimy poprawnie obliczyć prawdopodobieństwo 

|)

|

|

(|

0

x

x

x

x

P

, co zwykle oznacza, że musimy znać faktyczny roz-

kład prawdopodobieństwa w danych warunkach.