background image

 

 

Pobieranie próby

Populacja generalna: zbiór wyników 

wszystkich możliwych doświadczeń 
określonego typu.

Próba n-wymiarowa: zbiór n wyników 

doświadczeń.

Wyniki j-tej próby przedstawiamy w 

postaci n-wymiarowej zmiennej losowej

x

(j)

=(x

1(j)

,x

2(j)

,...,x

n(j)

). Wektor ten ma rozkład 

prawdopodobieństwa g(x)=g(x

1

,x

2

,...,x

n

).

background image

 

 

Pobieranie losowe

1. g(x)=g

1

(x

1

)g

2

(x

2

)...g

n

(x

n

(prawdopodobieństwa pobrania 
poszczególnych elementów próby są 
niezależne od siebie),

2. g

1

(x)=g

2

(x)=...=g

n

(x)=f(x) 

(poszczególne rozkłady muszą być 
identyczne z rozkładem gęstości dla 
populacji). 

background image

 

 

Dystrybuanta empiryczna (rozkład w 

próbie)

W

n

(x)=n

x

/n

n

x

 – liczba elementów próby takich że 

x

j

x.

W

n

(x) dąży do prawdziwej dystrybuanty 

F(x) dla n

background image

 

 

Przedstawianie rozkładów z 

próby

• Wykresy liniowe (jednowymiarowe)
• Histogramy

– Wykresy schodkowe
– Wykresy słupkowe
– Wykresy impulsowe

Konstrukcja histogramu
h(x)=n(x<yx+x)
h(x

1

,x

2

,...,x

n

)=n(x

1

<y

1

x

1

+x

1

,x

2

<y

2

x

2

+x

2

,..., x

n

<y

n

x

n

+x

n

)

background image

 

 

Przedstawienie wyników pomiarów 

oporu 100 pojedynczych oporników

• Wykres liniowy
• Histogram – wykres słupkowy
• Histogram – wykres schodkowy
• Histogram – wykres z zaznaczonymi 

przedziałami błędów

Zależność postaci histogramów 
z próby dla czterech różnych 
szerokości przedziałów 

background image

 

 

Statystyki i estymatory

Statystyka: funkcja określona na elementach 
próby, np. średnia.

n

x

x

x

n

x

2

1

1

Estymator: przybliżona wartość parametru 
rozkładu prawdopodobieństwa wyznaczona z 
próby. S=S(x

1

,x

2

,...,x

n

)

Estymator jest nieobciążony jeżeli jego wartość 
oczekiwana nie zależy od liczby elementów 
próby.

Estymator jest zgodny jeżeli jego wariancja 
dąży do zera wraz ze wzrostem liczby 
elementów próby. 

  

background image

 

 

Obliczanie momentów 

centralnych zbioru punktów

3

)

1

(

ˆ

)

1

(

ˆ

1

1

1

ˆ

1

1

1

ˆ

4

1

4

3

1

3

2

1

1

2

1

2

2

1



n

x

x

n

x

x

x

n

x

n

x

x

n

x

n

x

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

background image

 

 

Estymator wartości średniej rozkładu

)

(

1

2

)

ˆ

(

)

ˆ

(

)

ˆ

(

1

)

ˆ

(

)

ˆ

(

)

ˆ

(

1

1

ˆ

)

(

)

(

ˆ

)

(

)

(

)

(

1

)

(

2

2

2

2

2

1

2

2

2

1

2

2

2

1

2

2

2

1

x

x

n

n

x

x

x

x

x

x

E

n

x

x

x

x

x

x

E

n

x

x

x

n

x

E

x

E

x

E

x

x

x

E

x

E

x

E

n

x

E

n

n

n

n





Estymator wartości średniej jest zatem 
estymatorem nieobciążonym i zgodnym.

background image

 

 

Dygresja: błądzenie przypadkowe 

(random walk)

start

stop

 

 





 

N

D

D

X

X

D

D

X

X

X

X

D

X

X

X

X

X

X

X

X

X

X

X

X

X

X

D

X

X

X

X

D

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

N

M

M

N

N

2

2

0

2

2

1

0

1

2

0

1

2

0

2

1

2

0

1

2

0

1

2

1

1

0

1

1

2

1

2

1

2

1

background image

 

 

Estymator wariancji rozkładu (nieobciążony i 
zgodny)

1

2

)

var(

)

(

)

(

1

)

(

1

1

)

)

ˆ

((

)

)

ˆ

((

1

1

)

ˆ

(

)

ˆ

)(

ˆ

(

2

)

ˆ

(

1

1

)]

ˆ

(

)

ˆ

[(

1

1

)

(

)

(

)

(

1

1

)

(

)

(

)

(

)

(

1

1

4

2

2

2

2

2

2

1

2

2

1

2

1

2

2

2

2

1

2

2

2

2

2

1

2





n

s

n

n

n

n

x

x

E

x

x

E

n

x

x

x

x

x

x

x

x

E

n

x

x

x

x

E

n

x

x

x

x

x

x

E

n

s

E

x

x

x

x

x

x

n

s

n

i

i

i

n

i

i

n

i

i

n

n

x

x

x

background image

 

 

Estymator wariancji wartości średniej:

 

 

 

n

i

i

x

x

n

n

x

s

n

x

s

1

2

2

2

1

1

1

Estymator odchylenia standardowego wartości 
średniej:

1

2 

n

s

s

 

 

n

i

i

x

x

n

n

x

s

1

2

2

1

1

Estymator błędu ochylenia standardowego:

background image

 

 

Obliczanie mediany z serii pomiarów 

wielkości prostej

n

x

x

x

2

1

1. Sortujemy wyniki pomiarów od najmniejszego do 

największego,

2. Jeżeli liczba pomiarów (n) jest nieparzysta to 

mediana (x

m

) jest środkowym wynikiem pomiaru o 

numerze (n+1)/2

3. Jeżeli liczba pomiarów jest parzysta to mediana jest 

średnią arytmetyczną największego wyniku z 
“lewej” i najmniejszego z “prawej” połowy.

2

/

1

n

m

x

x

2

/

1

2

/

1

2

/

n

n

m

x

x

x

background image

 

 

Przenoszenie błędów 

(rachunek błędów)

Niech x=(x

1

,x

2

,...,x

n

) będzie n-wymiarową 

zmienną losową złożoną z niezależnych 
składników o rozkładach normalnych z 
wariancjami 

1

2

, 

2

2

,..., 

n

2

. Wtedy funkcja 

skalarna y=f(x) tej zmiennej losowej jest 
zmienną losową opisywaną w przybliżeniu 
rozkładem normalnym o następującej 
wariancji:

2

x

2

n

2

x

2

2

2

x

2

1

2

y

n

2

1

x

f

x

f

x

f













background image

 

 

Jeżeli elementy x są skorelowane to we wzorze 
występuje pełna macierz wariancji-kowariancji

j

i

j

i

i

x

x

x

x

n

1

i

i

1

j

j

i

2
x

2

n

1

j

i

j

i

n

1

i

j

n

1

j

i

2

y

r

x

f

x

f

2

x

f

)

x

,

x

cov(

x

f

x

f





















background image

 

 

Szacowanie błędu “z góry”

n

x

n

x

x

y

r

x

f

r

x

f

r

x

f

r

2

1

2

1

gdzie r

y

 jest oszacowanym maksymalnym błędem 

wielkości y a r

xi

 jest oszacowanym maksymalnym 

błędem wielkości x

i

.

background image

 

 

Rozkład wariancji z próby (rozkład 

2

)

Pobieramy próbę x

1

,x

2

,...,x

n

 z rozkładu 

normalnego o a=0 i =1. Dystrybuanta 

rozkładu zmiennej x

2

=x

1

2

+x

2

2

+...+x

n

2

 jest 

dana następującą funkcją:

du

u

u

n

F

n

n

 

2

1

exp

2

2

1

1

)

(

2

0

1

2

1

2

gdzie (y) jest funkcją gamma Eulera (silnią 

uogólnioną na liczby rzeczywiste). 

0

)

1

(

dt

e

t

x

t

x

background image

 

 

 

u

2

1

exp

u

2

n

2

1

1

)

(

f

1

n

2

1

n

2

Zatem sam rozkład wariancji jest dany następującą 
funkcją

background image

 

 

Zasada największej wiarygodności

(Maximum Likelihood Principle)

Mamy próbę (x

1

,x

2

,...,x

n

)

f(x,): funkcja określająca rozkład gęstości 

prawdopodobieństwa, gdzie  jest 

zestawem parametrów rozkładu. 

Zasada największej wiarygodności: najlepsze 

 maksymalizuje prawdopodobieństwo 

wystąpienia próby.

Ta zasada jest podstawą wszystkich metod 

estymowania parametrów rozkładu 

prawdopodobieństwa (a zatem i modelu 

matematycznego) z próby danych. 

background image

 

 

Ponieważ poszczególne elementy próby są 
niezależne

dx

x

f

dP

j

j

)

,

(

)

(

)

(

λ

N

j

j

dx

x

f

dP

1

)

(

)

;

(

λ

)

(

)

(

)

;

(

)

;

(

2

1

1

2

)

(

1

1

)

(

λ

λ

λ

λ

L

L

x

f

x

f

Q

N

j

j

N

j

j

iloraz wiarygodności 

N

j

j

N

j

j

x

f

L

x

f

L

1

)

(

1

)

(

)

;

(

ln

)

;

(

λ

λ

funkcja 
wiarygodności 

background image

 

 

Przykład jakościowego porównywania dwu 
modeli poprzez obliczenie ilorazu 
wiarygodności

Rzucamy monetą asymetryczną. 
Przypuszczamy, że albo prawdopodobieństwo 
wyrzucenia reszki jest 2 razy większe niż 
prawdopobobieństwo wyrzucenia orła (A) albo 
odwrotnie (B). Przypuśćmy, że w 5 rzutach 
otrzymaliśmy 1 raz orła i 4 razy reszkę. Wtedy:

8

,

3

2

3

1

,

3

2

3

1

4

4

B

A

B

A

L

L

Q

L

L

background image

 

 

Przykład zastosowania zasady największej 
wiarygodności: obliczanie wartości średniej przy 
założeniu, że rozkład prawdopodobieństwa jest 
rozkładem normalnym





N

j

j

N

j

j

j

N

j

j

j

N

j

j

j

N

j

j

j

j

N

j

j

j

j

j

j

x

x

d

d

x

N

L

x

L

dx

x

dx

x

f

1

2

1

2

)

(

*

1

2

*

)

(

1

2

2

)

(

1

2

2

)

(

1

2

2

)

(

)

(

1

0

2

)

(

2

1

ln

)

2

ln(

2

ln

)

(

2

)

(

exp

2

1

2

)

(

exp

2

1

)

;

(

*

background image

 

 





)

(

''

)

(

)

(

''

)

(

)

(

'

)

(

'

0

)

;

(

)

;

(

'

)

(

'

*

*

*

*

*

1

)

(

)

(

*

*

N

j

j

j

x

f

x

f

Właściwości asymptotyczne funkcji 
wiarygodności

Dla dużych prób

















2

2

*

2

2

*

*

2

*

2

'

)

(

)

(

'

1

)

(

)

(

*

2

)

(

exp

)

(

2

1

)

(

)

(

/

1

)

(

'

)

;

(

)

;

(

'

)

;

(

)

;

(

'

)

(

''

*

*

b

k

L

b

b

NE

x

f

x

f

NE

x

f

x

f

j

j

N

j

j

j

background image

 

 

Obszary ufności w przestrzeni 

parametrów

Obszar ufności definiujemy jako taki obszar w 
otoczeniu wartości oczekiwanej wektora parametrów i 
ograniczony powierzchnią o stałej gęstości 
prawdopodobieństwa, że prawdopodobieństwo 
znalezienia w nim prawdziwych wartości parametrów 
jest nie mniejsze niż zadana wartość (kwantyl). W 
jednym wymiarze mówimy o przedziale ufności.

1

2

P=g

1

2

*

background image

 

 

99

.

0

3

;

683

.

0

)

1

(

)

erf(

2

)

(

)

(

)

(

2

)

(

exp

)

(

*

2

2

*





 





P

P

g

d

L

d

L

P

kg

k

L

W jednym wymiarze

background image

 

 

01439

.

0

,

03734

.

0

,

09020

.

0

19875

.

0

,

39347

.

0

,

68269

.

0

2

1

,

2

)

exp(

)

(

1

)

,

(

2

,

2

)

;

(

6

5

4

3

2

1

0

1

0

2

2

W

W

W

W

W

W

n

P

W

dt

t

t

a

x

a

P

g

n

P

d

n

f

W

n

x

a

g

Ogólnie dla wielowymiarowego rozkładu 
Gaussa


Document Outline