background image

Mat. Statystyka. Wykład 4 c.d. R. Rempała                                                 Materiały dydaktyczne 
 

 

Wykłady 4.c.d. 

Funkcje charakterystyczne 

 

wielowymiarowych zm. los

., 

średnia i wariancja z próby losowej w modelu normalnym, rozkłady 

2

 c.d., 

rozkłady t-Studenta, rozkłady  F-Snedecora. 

Funkcje charakterystyczne wielowymiarowych zmiennych losowych 

 

poprzednim 

wykładzie 

mówiliśmy 

jedynie 

funkcjach 

charakterystycznych  jednowymiarowych  zmiennych  losowych.  Obecnie 
podamy  definicję  i  podstawowe  własności  funkcji  charakterystycznych  w 
przypadku  wektorów losowych.  

D e f i n i c j a .   Funkcją charakterystyczną wektora losowego 

n

R

:

X

 

nazywamy przekształcenie 

C

R

:

n

X

, dane wzorem 

n

X

,

t

i

X

R

t

,

Ee

)

t

(

  gdzie X=(X

1

, X

2

, …, X

n

) oraz t=(t

1

, t

2

, …, t

n

), a symbol <·,·> oznacza euklidesowy 

iloczyn skalarny.  

Własności funkcji charakterystycznej wektora losowego X=(X

1

, X

2

, …, X

n

Niech  X=(X

1

,  X

2

,  …,  X

n

)  będzie  wektorem  losowym,  t=(t

1

,  t

2

,  …,  t

n

)

n

R

.  Wówczas  funkcja  charakterystyczna 

n

2

1

X

t

,...,

t

,

t

  ma 

następujące własności: 

i) 

1

0

,...,

0

,

0

X

ii) 

n

n

2

1

n

2

1

X

R

t

,...,

t

,

t

1

t

,...,

t

,

t

iii)   

n

2

1

X

n

2

1

X

t

,...,

t

,

t

t

,...,

t

,

t

iv)   

 

1

X

1

X

t

0

,...,

0

,

t

1

gdzie 

 

1

X

t

1

to 

funkcja 

charakterystyczna zmiennej losowej X

1

 .  

Dowody w przypadkach i)- iii) są podobne do jednowymiarowych. 
Własnośd iv) jest konsekwencją definicji. Mamy bowiem  

 

1

X

X

it

X

,

t

i

1

X

t

Ee

Ee

0

,...,

0

,

t

1

1

1

 

background image

Mat. Statystyka. Wykład 4 c.d. R. Rempała                                                 Materiały dydaktyczne 
 

 

Przytoczymy  teraz  twierdzenie,  które  wskazuje  na  związek    niezależności 
zmiennych losowych z iloczynem  funkcji charakterystycznej.  

T w i e r d z e n i e 4 . 1   ( O   z w i ą z k u   F . C h.   z   ni e za l eż no ś ci ą   z mi e n ny ch )  
Zmienne losowe X

1

, X

2

, …, X

n

 są niezależne wtedy i tylko wtedy, gdy  

 

 

 

n

X

2

X

1

X

n

2

1

X

,...,

X

,

X

t

...

t

t

t

,...,

t

,

t

n

2

1

n

2

1

.      (*) 

Dowód. Z niezależności zmiennych  wynika już  równośd (*). Wystarczy 
skorzystad z faktu, że wartośd oczekiwana iloczynu zm. los. 

n

,

,

2

,

1

i

,

e

i

i

X

it

 jest iloczynem wartości oczekiwanych tych zmiennych. 

Mamy więc 

)

t

(

)

t

(

)

Ee

Ee

Ee

)

e

e

e

(

E

Ee

)

t

,

,

t

(

,

,

n

n

X

1

1

X

n

X

n

it

2

X

2

it

1

X

1

it

n

X

n

it

2

X

2

it

1

X

1

it

)

n

X

n

t

1

X

1

t

(

i

n

1

)

n

X

1

X

(

Dowód wynikania w przeciwną stronę pomijamy. 

Twierdzenie jest ważne, ponieważ daje jeszcze jedną charakteryzację 
niezależności zmiennych. 

Próba losowa c.d. 

 

 

Niech 

n

2

1

X

,

,

X

,

X

 będzie próbą losową prostą pochodzącą z 

pewnego rozkładu (czasami nazywanego rozkładem 
teoretycznym). W wykładzie występują tylko próby losowe 
proste. Zatem  przymiotnik prosta bardzo często pomijamy.  
 

 

Przypominamy: Określenie próba losowa prosta oznacza, iż 
tworzące ją  zm. los. są niezależne i mają takie same rozkłady 
jak ten rozkład , z którego pochodzi próba. Można założyd (i taki 
założenie wprowadziliśmy), że zmienne tworzące próbę 
określone są na tej samej przestrzeni probabilistycznej. 
                                

 
 
 

background image

Mat. Statystyka. Wykład 4 c.d. R. Rempała                                                 Materiały dydaktyczne 
 

 

Modele normalne 

Definicja. Mówimy, że model statystyczny jest normalny jeśli 
wiadomo, że próba losowa pochodzi z rozkładu normalnego. 

 

Najważniejsze Statystyki w modelu normalnym 

Założenie. Niech 

n

2

1

X

,

,

X

,

X

 

    

będzie próbą prostą pochodzącą z 

rozkładu N(

,

). 

  

a) 

Rozkład średniej:

)

X

X

X

(

n

1

X

n

2

1

  

Wiemy, z poprzednich rozważao, że przy założeniach normalności 
średnia arytmetyczna  

      

n

1

i

i

X

n

1

X

    ma rozkład normalny  

)

n

,

(

N

  

    Standaryzacja prowadzi więc  do zmiennej 

        

n

X

U

,     która ma rozkład   

)

1

,

0

(

N

 Wykorzystaliśmy  fakt,  znany  z  rachunku  prawdopodobieostwa,  że 
suma niezależnych zmiennych losowych o rozkładzie normalnym ma 
rozkład normalny
. Parametry rozkładu łatwo  wyliczyd wykorzystując 
własności wartości oczekiwanej i wariancji. 

        

 

 

 

 

 

 

  Rys.

(Por.J.Podgórski

 . 

Statystyka 

dla studiów licencjackich. 

PWE.2001str.170

 ). 

Na rysunku 

           m = 

)

X

(

E

 

  

 

background image

Mat. Statystyka. Wykład 4 c.d. R. Rempała                                                 Materiały dydaktyczne 
 

 

b) Rozkład Chi-kwadrat z    - stopniami swobody: 

2

(  ).  

 Przypominamy definicję i podstawowe własności   

Definicja. 

2

(  ) jest to rozkład zmiennej losowej 

k

1

i

2

i

X

Y

, gdzie 

k

,

,

2

,

1

i

X

i

 są niezależnymi zmiennymi losowymi o rozkładzie 

N(0,1).

 

 Stwierdzenia 4.1.

 Rozkład 

2

(k ) jest rozkładem Gamma

)

p

,

a

(

 dla 

 

.

2

/

k

p

,

2

/

1

a

 

Dowód był podany na poprzednim wykładzie.   

 

  Przypominamy: gęstość prawdopodobieństwa dla rozkładu 

Gamma (

)

p

,

a

ma postać 

    f(y)= 

.

0

p

,

0

a

;

0

y

,

e

y

)

p

(

a

ay

1

p

p

  

0

p

,

e

x

)

p

(

0

x

1

p

.   

Wartośd oczekiwana i wariancja są wyrażone przez parametry w 

następująco: E(Y) =

a

/

p

, Var (Y)=

2

a

/

p

Zatem   mamy następujący wniosek  wynikający z własności  
rozkładu Gamma. 
 
Wniosek 4.1. 
Wartość oczekiwana i wariancja zm. los. Y o rozkładzie 

2

(

  ) przyjmują następujące wartości: E(Y)=  , Var (Y)=2  .  

 

 

background image

Mat. Statystyka. Wykład 4 c.d. R. Rempała                                                 Materiały dydaktyczne 
 

 

    Przykłady gęstości rozkładów chi-kwadrat z     stopniami swobody 

 

    

 

Ważnymi statystykami w modelu normalnym są wariancje z próby.   

Zajmiemy się rozkładami wariancji i ich relacjami ze średnią z próby. 

(Przypominamy: 

n

1

i

2

i

2

n

1

i

2

i

2

)

)

X

X

(

n

1

S

ˆ

,

)

X

X

(

1

n

1

S

.     

Twierdzenie. 4.2 W modelu normalnym 

X

 i 

2

S

 są niezależnymi 

zmiennymi losowymi z następującymi rozkładami 

                         

X

 

~

)

n

,

(

N

  

                          

2

2

S

1

n

2

(n-1)  

Dowód pomijamy.  

        Rys. Gęstości rozkładów

 

)

k

(

2

.

 

 

 

Niech 

X

1

,X

2

,…X

n

 

będzie próbą losową z 

N(      

  

Rozkłady asymetryczne. 

 

Kształt gęstości zależy od 

liczby stopni swobody. 

 

Przy dużej liczbie stopni 

 swobody, rozkłady zbliżają się 

do rozkładu normalnego. 

  

 

 

 

 

 

 

 

 

background image

Mat. Statystyka. Wykład 4 c.d. R. Rempała                                                 Materiały dydaktyczne 
 

 

Uwaga. Zauważmy, że zarówno 

X

 jak i 

2

S

są wyznaczone przez tę 

samą próbę losową. Fakt niezależności statystyk, nie jest 
oczywisty.   Istotne jest tu założenie, iż próba pochodzi z rozkładu 
normalnego. 

                                  Parametry  statystyki S

Stwierdzenie 4.2

2

2

)

S

(

E

Var 

(

2

S

)=

1

n

2

4

.

 

Dowód. Na mocy Twierdzenia 4.2,  

2

2

S

1

n

2

(n-1). Z kolei  

Wniosku 4.1 wynika, że   E(

2

2

S

1

n

)=

1

n

)

S

(

E

1

n

2

2

 . Z ostatniej 

równości mamy więc: 

2

2

)

S

(

E

.

  

                    

Rozumując podobnie otrzymujemy: 

Var (

2

2

S

1

n

) = 

)

1

n

(

2

)

S

(

Var

)

1

n

(

2

4

2

) zatem  Var (

2

S

)=

1

n

2

4

 Wniosek 4.2. Ze związku  

                                        

2

2

S

n

1

n

S

ˆ

 

otrzymujemy natychmiast 

  

oraz

n

1

n

)

S

(

E

n

1

n

)

S

ˆ

(

E

)

a

2

2

2

 

                                               

  

2

4

4

2

2

2

2

2

2

n

)

1

n

(

2

1

n

2

n

)

1

n

(

)

S

(

Var

n

)

1

n

(

)

S

ˆ

(

Var

)

b

c) 

X

 i  

2

Sˆ  są niezależnymi zm. los. 

background image

Mat. Statystyka. Wykład 4 c.d. R. Rempała                                                 Materiały dydaktyczne 
 

 

c)  Rozkład t-Studenta z

  -stopniami swobody, t( 

 

Definicja. Rozkład t-Studenta z 

 stopniami swobody jest to  rozkład 

zmiennej losowej  

T = 

/

Y

Z

 gdzie  Z i Y są niezależnymi zmiennymi losowymi , Z o rozkładzie 
N(0,1),  Y o rozkładzie  Chi-kwadrat z 

-stopniami swobody. 

(Zapis T

~t(

)) .

 

 

Stwierdzenie 4.3. Statystyka

 

S

/

)

X

(

n

  ma rozkład t-Studenta z 

(n-1) stopniami swobody. 

 

Rozkłady t-Studenta są   

indeksowane  liczbą stopni  

swobody 

.

 

Są symetryczne względem  

prostej t = 0. 

Zwyczajowo wartości  

oznacza się literą „t”. 

Każdy rozkład ma gestośd  

podobną  do krzywej 

Gaussa ze średnią zero. Przy dużych 

  

gęstości zbliżają  się do  gęstości N(0,1). 

  

Var(T) = 

)

2

/(

 

 

Rys. Szkice gęstości rozkładów t-Studenta 

background image

Mat. Statystyka. Wykład 4 c.d. R. Rempała                                                 Materiały dydaktyczne 
 

 

Dowód jest wnioskiem z Twierdzenia 4.2 i definicji statystyki 
 t-Studenta. 

Niech  Z = 

n

)

X

(

  i  niech  Y=

2

2

S

1

n

. Mamy więc 

 

T = 

n

)

X

(

:  

S

/

)

X

(

n

S

)

1

n

(

1

n

2

2

.  

Zatem  statystyka 

S

/

)

X

(

n

     ma rozkład t-Studenta z (n-1) 

stopniami swobody.  

 

d) Rozkład F Snedecora z k i m stopniami swobody  

Jest to rozkład zm. los. 

m

/

U

k

/

Y

R

 ,      gdzie Y i U są niezależne  

 Y 

2

(k) i U 

2

(m) 

 Zapis R  

~ F(k,m).     E(R) nie istnieje dla m   , natomiast dla m>2  

E(R)= m/(m-2). Rozkład jest stablicowany.  

e) Model dwu próbek         

Załóżmy, że mamy dwie niezależne próby losowe  

n

2

1

X

,

,

X

,

X

  

i  

m

2

1

Y

,

,

Y

,

Y

   gdzie X

i

  

~ N(

)

,

X

X

  Y

~ N(

)

,

Y

Y

 

Niech statystyki   

2

X

S

i

,

X

  będą określone  dla  próby 

,

X

,

,

X

,

X

n

2

1

   

  natomiast statystyki  

2

Y

S

i

,

Y

 dla  próby 

m

2

1

Y

,

,

Y

,

Y

 .  

 

background image

Mat. Statystyka. Wykład 4 c.d. R. Rempała                                                 Materiały dydaktyczne 
 

 

Zatem    

2

X

2

Y

2

Y

2

X

2

Y

2

Y

2

X

2

X

S

S

)

1

m

(

S

)

1

m

(

1

n

S

)

1

n

(

~F(n-1,m-1) .  

Jeśli założymy, że 

2

Y

2

X

 

 ,  to 

2

Y

2

X

S

/

S

~F(n-1,m-1), co jest 

pomocne przy testach weryfikujących równośd wariancji w 
rozkładach normalnych.  

Jeśli założymy, że 

2

Y

2

X

 

 to 

2

Y

2

X

S

/

S

~F(n-1,m-1) co jest pomocne 

przy testach weryfikujących równośd wariancji w rozkładach, z 

których pochodzą próby. Zauważmy, że przy założeniu 

2

Y

2

X

 

 

iloraz  

2

x

2

y

S

/

S

~F(m-1,n-1)

       

Ogólnie  

Jeżeli 

m

/

U

k

/

Y

R

 , gdzie Y i U są niezależne, Y 

2

(k),  U 

2

(m), 

to na mocy definicji R  

~ F(k,m). Zatem 1/R=

.

k)

F(m,

 

~

 

k

/

Y

m

/

U

 

Niech F

(

        

 

będzie kwantylem  rzędu  

 

z rozkładu F(k,m).  

Oznacza to, że  

P(R             

 = 

 

 

,  a więc    P(1/                     

  

co znaczy, że  

                           P(1/R 1/              1-    

Tak więc  1/          

 

jest kwantylemrzędu 1-  z rozkładu 

k)

F(m,

.  

Mamy ostatecznie następujący związek  

1/                           .