Zmienne losowe wielowymiarowe

Definicja:

Dana jest przestrzeń probabilistyczna (Ω, S, P ) i w tej przestrzeni n zmiennych losowych X , X ,..., X

X = { X , X ,..., X

1

2

n . Uporządkowany układ n zmiennych losowych oznaczamy jako:

}

1

2

n

i

nazywamy n – wy miarową zmienną losową lub wektorem losowym X.

W ten sposób kaŜdemu zdarzeniu elementarnemu ω ∈ Ω przyporządkowujemy układ n liczb n

rzeczywistych, czyli punkt n – wymiarowej przestrzeni euklidesowej ℜ .

Przykład 1:

Wyobraźmy sobie doświadczenie, w czasie którego wykonujemy jednoczesny rzut kostką i monetą.

Wyniki rzutu kostką moŜna uwaŜać za zmienną losową :

X 1 - przyjmującą wartości 1, 2, ... , 6 z prawdopodobieństwem 1/6.

X 2 - przyjmującą wartości 0 –orzeł, 1 – reszka z prawdopodobieństwem ½.

W wyniku jednoczesnego rzutu kostką i monetą otrzymujemy 2 wartości. Mamy więc do czynienia ze zmienną losową dwuwymiarową ( X , X )

1

2

, która moŜe przyjąć jedną z 12 wartości:

(1,0), (1,1), (2,0), (2,1), (3,0), (3,1), (4,0), (4,1), (5,0), (5,1), (6,0), (6,1).

Jest sprawą intuicyjnie oczywistą, Ŝe wszystkie12 wartości zmiennej losowej ( X , X ) 1

2

są równo

prawdopodobne. Czyli: P( X = k, X = l) = 1/12

1

2

dla k = 1, ... , 6 ; l = 0, 1.

Tabelaryczny zapis tej dwuwymiarowej zmiennej losowej ( X , X ) 1

2

:

X

X

1

2

0

1

1

1/12

1/12

2

1/12

1/12

3

1/12

1/12

4

1/12

1/12

5

1/12

1/12

6

1/12

1/12

Definicja:

Dystrybuantą zmiennej losowej n – wymiarowej ( X , X ,..., X ) 1

2

n

nazywamy funkcję:

F ( x , x ,..., x )

P( X < x , X < x ,..., X < x 1

2

n

=

)

1

1

2

2

n

n

Właściwości:

1. F (

,

∞ ,...,

∞

∞) = P( X < ,

∞ X < ,...,

∞

X n < ∞) = 1

1

2

2. Dystrybuanta jest funkcją lewostronnie ciągłą.

3. F ( x , x ,..., x

x

x

i −

− ,

∞

,...,

)

i +

n

= 0

1

2

,

1

1

. Wynika to z tego, Ŝe zdarzenie polegające na tym, Ŝe

zmienna losowa X

−

i przyjmuje wartość mniejszą niŜ

∞ , jest zdarzeniem prawie niemoŜliwym

(prawdopodobieństwo równe zeru).

4. JeŜeli zbiór wartości dystrybuanty jest skończony lub przeliczalny, to zmienną losową n –

wymiarową nazywamy dyskretną lub typu skokowego.

JeŜeli dystrybuanta jest róŜniczkowalna ( w sensie klasycznym), to zmienną losową wielowymiarową nazywamy ciągłą.

Definicja:

Funkcja gęstości prawdopodobieństwa wielowymiarowej zmiennej losowej ciągłej jest pochodną jej dystrybuanty:

F

∂ ( x , x ,..., x )

1

2

n

f ( x , x ,..., x )

1

2

n

=

x

∂ x

∂ ... x

1

2

∂ n

Własności funkcji gęstości prawdopodobieństwa:

1. f ( x , x ,..., x )

n

≥ 0

1

2

∞

∞

f x x

x dx dx

dx

n

n =

2.

...

( ,

,...,

)

...

1

∫ ∫

1

2

1

2

−∞

−∞

Momenty zmiennej losowej wielowymiarowej

Mamy zmienną losową n – wymiarową ( X , X ,..., X ) 1

2

n

. Zakładamy, Ŝe dla kaŜdej z tych

zmiennych X i ( i = 1, 2, ... , n ) są określone momenty zwykłe.

Definicja:

Momenty mieszane rzędu r + s zmiennej losowej wielowymiarowej definiuje się następująco: rs

α = E X ⋅ X

kl

( r s

k

l )

dla k, l = 1, 2, ... , n

Sumę r + s nazywamy rzędem momentu.

Definicja dla zmiennej losowej wielowymiarowej skokowej X i ( i = 1, 2, ... , n ) przyjmującej wartości x

( m =

,...,

2

,

1

K

im

) :

i

i

i

Kk

Kl

rs

r

s

α =

x

x P( X

∑∑

= x , X = x )

kl

k

km

l

lm

k

k

km

l

l

lm

m

1

= m 1

=

k

l

Definicja dla zmiennej losowej wielowymiarowej ciągłej:

∞

∞

rs

r

s

α = ... x x f ( x , x ,..., x ) dx dx dx

...

∫ ∫

kl

k

l

1

2

n

1

2

n

−∞ −∞

Momenty poszczególnych zmiennych losowych X i moŜna uwaŜać za graniczne przypadki momentów mieszanych, np.

10

α = EX

kl

k - jest wartością oczekiwaną zmiennej losowej X k

Centralne momenty mieszane rzędu r + s zmiennej losowej ( X , X ) k

l

rs

µ = E ( X − EX ) ⋅( X − EX )

kl

[

r

s

k

k

l

l

]

Z tej definicji wynika, Ŝe:

10

µ

E X

EX

kl =

( k −

)

k

= 0 dla k, l = 1, 2, ... , n

20

2

µ

= E( X − EX ) = V ( X )

kl

k

k

k

r 0

r

µ

= E( X − EX ) = µ ( X )

X

kl

k

k

r

k

- r –ty moment centralny zmiennej losowej

k .

Momenty mieszane dla zmiennej losowej dwuwymiarowej ( X, Y )

α = E( r

s

X ⋅ Y )

rs

- moment mieszany zwykły,

µ = E[( X − EX ) r ⋅( Y − EY ) s]

rs

- centralny moment mieszany,

α = E( X 1

10

⋅ Y 0) = EX

α = E( X 0

01

⋅ Y 1) = EY

µ = E[( X − EX )] = 0

(

∑ x EX p

x p

EXp

i −

) i = ∑ i i − ∑

i =

10

bo:

0

i

i

i

µ = E[( Y − EY )] = 0

01

2

2

µ = E[( X − EX ) ] = σ

20

x

2

2

µ = E[( Y − EY ) ] = σ

02

y

µ = E[( X − EX ) ⋅( Y − EY )] =

(

Cov X , Y )

11

- moment mieszany 2-go rzędu.

Kowariancja zmiennej losowej dwuwymiarowej ( X, Y )

Definicja:

Kowariancją zmiennej losowej dwuwymiarowej ( X, Y ) nazywamy liczbę Cov( X , Y ) określoną wzorem:

11

Cov( X , Y ) = E[( X − EX ) ⋅ ( Y − EY )] = µ XY

Jest to oczywiście centralny moment mieszany rzędu drugiego.

Czyli:

Cov( X , Y ) = E( X ⋅ Y ) − EX ⋅ EY

E( X ⋅ Y ) =

gdzie:

∑∑ x y p

i

k

ik - dla zmiennej losowej skokowej ,

i

k

oraz: p

= P( X = x , Y = y )

ik

i

k

.

∞ ∞

E( X ⋅ Y ) =

∫ ∫ xyf ( x, y) dxdy - dla zmiennej losowej ciągłej.

−∞ −∞

Twierdzenie 1:

Jeśli zmienne losowe X i Y są niezaleŜne i mają wartości oczekiwane, to: E( X ⋅ Y ) = EX ⋅ EY

Twierdzenie 2:

2

2

Jeśli: EX

< ∞ i EY < ∞ , to:

V ( X ± Y ) = VX + VY ± 2 ⋅ Cov( X , Y )

Twierdzenie 3:

Dla dowolnych liczb a, b, c, d zachodzi: Cov( aX + ,

b cY + d ) = a ⋅ c ⋅ Cov( X , Y ) Twierdzenie 4:

Cov( X , Y ) ≤ σ

⋅σ

X

Y

ρ

Współczynnik korelacji

XY zmiennych losowych X, Y

Niech zmienne losowe X i Y posiadają momenty dwóch pierwszych rzędów: m = EX

m =

2

σ

2

σ Y = V ( Y ) >

X = V ( X ) >

X

,

EY

Y

,

0 ,

0 .

Współczynnik korelacji jest parametrem słuŜącym do badania zaleŜności między zmiennymi losowymi X i Y . SłuŜy on do dwóch celów:

a) zaprzeczeniu zdania: zmienne losowe X i Y są niezaleŜne, b) pokazaniu, Ŝe między zmiennymi losowymi X i Y istnieje zaleŜność liniowa z prawdopodobieństwem 1.

Definicja:

Współczynnikiem korelacji ρ XY zmiennych losowych X i Y nazywamy liczbę: E{( X − m

Y

)( − m )}

Cov( X , Y

X

Y

ρ

)

=

=

XY

σ σ

σ σ

X

Y

X

Y

Własności współczynnika korelacji

Twierdzenie 5:

Wartość bezwzględna współczynnika korelacji jest niezmiennikiem przekształceń liniowych, czyli: ρ =

|

| |

|

∧

ρ

ρ

+

+

= ρ

XY

aX + b, cY + d

, czyli: |

( aX

,

b cY

d ) | | ( X , Y ) |

a, c ≠0, b, d

Twierdzenie 6:

Moduł współczynnika korelacji jest nie większy od jedności:

| ρ

|

XY ≤ 1

Twierdzenie 7:

Jeśli zmienne losowe X i Y są niezaleŜne, to ρ XY = 0 .

O zmiennych losowych, dla których ρ XY = 0 mówimy, Ŝe są nieskorelowane.

Praktyczne znaczenie współczynnika korelacji

RozwaŜmy zaleŜność liniową zmiennych losowych X i Y : Y = aX + b

Obliczmy współczynnik korelacji zmiennych losowych X i Y : Cov( X , Y

ρ

)

=

XY

σ σ

X

Y

Cov( X , Y ) = E[( Y − EY )( X − EX )] = E[( aX + b − aEX − b)( X − EX )] =

= E[ a( X − EX )( X − EX )] = E[ a( X − EX )2] = aE[( X − EX )2] =

2

= aσ X

2

2

2

2

2

2

σ = E[( Y − EY ) ] = E[( aX + b − aEX − b) ] = E[( a( X − EX )) ] = a σ

Y

X

σ = a σ

2

2

|

= a |σ

Y

X

X

Zatem współczynnik korelacji wyniesie:

2

aσ

a

X

ρ =

=

XY

σ σ

| a |

| a |

X

X

Czyli współczynnik korelacji tych zmiennych losowych wyraŜa się wzorem:

1 dla a >

ρ XY =

0



−1 dla a < 0

Dla ρ

ρ XY =

XY = 1 i

1

− zaleŜność stochastyczna przechodzi w zaleŜność funkcyjną:

y

y

Y=aX+b

Y=aX+b

a>0

a<0

x

x

ρ

ρ XY =

XY = 1

1

−

y

y

x

x

− 1 < ρ

0 < ρ XY <

XY < 0

1

y

x

ρ XY = 0 - zmienne losowe nieskorelowane.

Rozkłady brzegowe zmiennych losowych dwuwymiarowych ( X, Y )

Dla dwuwymiarowej zmiennej losowej ( X, Y ) funkcje dystrybuant: F ( x) =

F ( x, )

F ( y) =

F ( x,

X

lim

y

)

Y

lim

y

y →∞

x→∞

są funkcjami jednej zmiennej losowej, odpowiednio x oraz y i kaŜda z nich ma wszystkie własności dystrybuanty jednowymiarowej.

Definicja:

Funkcje F

F

X oraz

Y , otrzymane jako odpowiednie wartości graniczne funkcji F , nazywamy

dystrybuantami brzegowymi, a jednowymiarowe rozkłady prawdopodobieństwa wyznaczone przez funkcje F

F

X oraz

Y , nazywamy rozkładami brzegowymi.

W przypadku zmiennej losowej dwuwymiarowej ( X, Y ) typu ciągłego o funkcji gęstości prawdopodobieństwa f ( x, y) , mamy:

f ( x)

f ( y)

Y

= f ( x, y) dx

X

=

∫ f ( x, y) dy,

∫

ℜ1

ℜ1

Funkcje f ( x)

f ( y

X

i

)

Y

są funkcjami gęstości prawdopodobieństwa odpowiednio zmiennych losowych X oraz Y i nazywać je będziemy brzegowymi gęstościami prawdopodobieństwa.

Oczywiście zachodzi:

∂

∂

=

F ( x) = f ( x) ,

F ( y)

f ( y)

Y

x X

X

∂

y

Y

∂

Dla zmiennej losowej dwuwymiarowej typu skokowego o rozkładzie określonym parami liczb p( x , y ) i

k

,

mamy:

p ( x )

p( x , y )

p ( y )

p( x , y )

Y

k

=

X

i

=

∑ i k ,

∑ i k

k

i

Liczby p ( x )

X

i

- wyznaczają rozkład brzegowy prawdopodobieństwa zmiennej losowej X.

Liczby p ( y )

Y

k

- wyznaczają rozkład brzegowy prawdopodobieństwa zmiennej losowej Y.

Zostały one określone jako odpowiednie sumy prawdopodobieństw p( x , y ) i

k

dwuwymiarowej zmiennej

losowej ( X, Y ).

Znając rozkład dwuwymiarowej zmiennej losowej ( X, Y ), moŜemy zawsze wyznaczyć dla niej 2 rozkłady brzegowe:

- brzegowy rozkład prawdopodobieństwa zmiennej losowej X,

- brzegowy rozkład prawdopodobieństwa zmiennej losowej Y.

Rozumowanie odwrotne nie jest prawdziwe, tzn. znając rozkłady brzegowe, na ogół, nie moŜna jednoznacznie wyznaczyć rozkładu prawdopodobieństwa dwuwymiarowego.

Zmienne losowe niezaleŜne

Definicja:

Dana jest zmienna losowa dwuwymiarowa ( X, Y ). Zmienne losowe X i Y nazywamy niezaleŜnymi jeśli zachodzą relacje:

- dla zmiennych losowych typu skokowego:

F ( x, y) = F ( x) ⋅ F ( y)

∧

{ p( x , y ) = p ( x ) ⋅ p ( y

∧

X

Y

lub

)}

i

k

X

i

Y

k

x, y

x , y

i

k

- dla zmiennych losowych typu ciągłego:

f ( x, y) = f ( x) ⋅ f ( y)

∧

X

Y

x, y

Przykład 2:

Rozpatrzmy dwuwymiarową zmienną losową ( X, Y ) typu skokowego przyjmującą skończoną liczbę wartości ( x , y )

i

k

i = 1, 2, ..., r k = 1, 2, ..., m z prawdopodobieństwami p( x , y ) = P( X = x , Y = y ) i

k

i

k

.

Przedstawmy naszą dwuwymiarową zmienną losową ( X, Y ) za pomocą tabeli: Y

Rozkłady brzegowe zm. l.

y

y

...

y

X

1

2

m

X

x

p( x , y ) = p

p( x , y ) = p

p( x , y ) = p

p

1

1

1

11

1

2

12 ...

1

m

m

1

.

1

x

p( x , y ) = p

p( x , y ) = p

p( x , y ) = p

p

2

2

1

21

2

2

22

2

m

2 m

.

2

.

.

.

...

.

.

.

.

.

...

.

.

x

p( x , y ) = p

p( x , y ) = p

p

r

r

1

1

r

r

2

r 2 ...

r.

p( x , y ) = p

r

m

rm

Rozkłady

p

p

...

p

∑ p

p

k = ∑ i = 1

brzegowe zm.

.1

2

.

. m

.

.

l. Y

k

i

gdzie: p = p

+ p + ... + p

1.

11

12

m

1

p

= p + p + ... + p

.

2

21

22

2 m

p . = p 1 + p

+ ...

2

+ p

r

r

r

rm - rozkłady brzegowe zmiennej losowej X,

p = p

+ p + ... + p

.1

11

21

r 1

p

= p + p + ... + p

.2

12

22

r 2

p. = p 1 + p

+ ...

2

+ p

m

m

m

rm - rozkłady brzegowe zmiennej losowej Y.

r

m

p( x , y )

1

i

k

=

Oczywiście, zachodzi: ∑ ∑

i =1

k =1

Zmienne losowe typu skokowego X i Y są niezaleŜne, jeśli zachodzi: p = p ⋅ p

∧

ik

i.

. k

i, k

Znając rozkłady brzegowe zmiennych losowych X i Y , moŜemy z nich łatwo wyznaczyć wartości oczekiwane i wariancje tych zmiennych losowych:

r

m

EX = ∑ x p

EY =

y p

i

i. ,

∑ k . k

i

k

r

m

2

2

= ∑

−

2

2

= ∑

−

E( X )

x p

( EX )

V ( Y )

y p

( EY )

i

i.

,

k

. k

i

k

Dla dwuwymiarowej zmiennej losowej z przykładu 1, rozkłady brzegowe będą następujące: Y

0

1

rozkł. brzeg. zm. l. Y

X

1

1/12

1/12

p .

1 = 1/6

2

1/12

1/12

p .

2 = 1/6

3

1/12

1/12

p .

3 = 1/6

4

1/12

1/12

p .

4 = 1/6

5

1/12

1/12

p .

5 = 1/6

6

1/12

1/12

p .

6 = 1/6

rozkł. brzeg. zm. l. X p

p

1

. = 1/2

.2 =1/2

1

Zadania

1. Dwuwymiarowa zmienna losowa (X, Y) ma rozkład prawdopodobieństwa: Y 0

1

X

1

1/6

1/6

2

2/6

2/6

Zbadać, czy zmienne losowe X oraz Y są niezaleŜne.

2. Dwuwymiarowa zmienna losowa (X, Y) ma rozkład prawdopodobieństwa: Y 1

2

3

X

0

0,3

0,2

0,1

1

0,2

0,1

0,1

a) Obliczyć wartość oczekiwaną i wariancję zmiennej losowej : Z = 2 X + Y .

b) Sprawdzić, czy zmienne losowe X i Y są niezaleŜne?

3. Dwuwymiarowa zmienna losowa (X, Y) ma rozkład prawdopodobieństwa: Y 0

1

X

1

1/8

p 12

2

p 21

1/4

gdzie: p 21 = prawdopodobieństwu wypadnięcia liczby parzystej przy rzucie kostką.

Obliczyć współczynnik korelacji ρ XY zmiennych losowych X i Y.

4. Wyznaczyć stałą c tak, aby funkcja:

 c dla | x <| ,1| y <|1

f ( x, y) = 

0 poza tymobszarem

a) była funkcją gęstości prawdopodobieństwa zmiennej losowej (X, Y) typu ciągłego, b) obliczyć prawdopodobieństwo: P( X > ,

0 Y > )

0 .

5. Zmienna losowa X ma rozkład normalny N( 2 ; 1 ), zaś zmienna losowa Y ma rozkład normalny N( 1 ; 2 ). Zmienne losowe X i Y są zaleŜne, a współczynnik korelacji między nimi wynosi 0,4.

Obliczyć wartość oczekiwaną i wariancję zmiennej losowej Z = 2 X − 3 Y − 10 .

6. Zmienna losowa X ma rozkład normalny o wartości oczekiwanej 10 i wariancji 4.

a) Obliczyć kwantyl rzędu ¼ w tym rozkładzie.

b) Obliczyć wartość oczekiwaną i wariancję zmiennej losowej Y = 3

− X + 20 .

7. Sprzedawca zatrudniony w sklepie komputerowym dostaje miesięczną stałą pensję w wysokości 500,- zł, a do tego 10,- zł za kaŜdy sprzedany komputer i 20,- zł za kaŜdy sprzedany zestaw oprogramowania. W ciągu miesiąca udaje mu się sprzedać średnio 40 komputerów oraz 20

zestawów oprogramowania z odchyleniem standardowym odpowiednio 10 i 5. Współczynnik korelacji pomiędzy liczbą sprzedanych komputerów i liczbą sprzedanych zestawów oprogramowania wynosi 0,5.

Obliczyć średnie miesięczne wynagrodzenie tego sprzedawcy oraz odchylenie standardowe miesięcznego wynagrodzenia.

8. Pewna firma budowlana prowadzi działalność w Warszawie oraz poza Warszawą. Badania dotyczące działalności firmy w ciągu ostatnich lat pokazały, Ŝe rozkład prawdopodobieństwa liczby inwestycji prowadzonych jednocześnie w Warszawie oraz poza Warszawą moŜna przedstawić tabelarycznie:

Poza Warszawą

0

1

2

W Warszawie

0

0,1

0,3

0,2

1

0,2

0,1

0,1

a) Czy liczby inwestycji prowadzonych jednocześnie w Warszawie i poza są niezaleŜne?

b) Czy liczby inwestycji w Warszawie i poza są skorelowane i w jakim stopniu?

c) Jaka jest wartość oczekiwana i wariancja łącznej liczby inwestycji prowadzonych jednocześnie w Warszawie i poza Warszawą?