dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 1

5. Rozkład funkcji zmiennej losowej

i dwuwymiarowe zmienne losowe

5.1. Rozkład funkcji zmiennej losowej

• Mówimy, że g jest funkcją borelowską, jeśli dla każdego a∈ℝ zbiór

{ x : g ( x)< a} jest zbiorem borelowskim (elementem σ -ciała generowanego przez zbiory otwarte).

• W szczególności każda funkcja ciągła na pewnym przedziale jest w tym przedziale funkcją borelowską.

• Niech zmienna losowa Y będzie pewną funkcją zmiennej losowej X, tzn. dla każdego ω∈Ω mamy Y (ω)= g ( X (ω)) , gdzie g jest funkcją borelowską.

• Znając rozkład prawdopodobieństwa zmiennej losowej X, możemy wyznaczyć rozkład prawdopodobieństwa zmiennej losowej Y.

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 2

Przykład 5.1.

Niech Y = X 2+1, gdzie X jest zmienną losową o rozkładzie 1

1

1

P( X =−1)= , P ( X =0)= , P ( X =1)=

.

4

4

2

Znaleźć rozkład zmiennej losowej Y i obliczyć EY.

Rozkład zmiennej losowej Y:

1

P( Y =1)= P ( X =0)= ,

4

1 1 3

P( Y =2)= P( X =−1∨ X =1)= + = .

4 2

4

1

3 7

EY =1⋅ +2⋅ =

lub

4

4 4

1

1

1

7

EY = E ( X 2+1)= EX 2+1=(−1)2⋅ +02⋅ +12⋅ +1= .

4

4

2

4

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 3

Twierdzenie 5.1.

Jeżeli X jest zmienną losową ciągłą o gęstości f X skoncentrowanej na przedziale ( a , b) oraz y= g ( x) jest funkcją ściśle monotoniczną klasy C 1 o pochodnej g ' ( x)≠0 w tym przedziale, przy czym x= h( y) jest funkcją odwrotną do funkcji y= g ( x) , to gęstość f Y zmiennej losowej ciągłej Y = g ( X ) wyraża się wzorem f ( y )= f ( h( y))∣ h ' ( y)∣

Y

X

dla y∈( c , d ) oraz f Y ( y )=0 dla pozostałych y, gdzie c= min( c d

d

g

g

1,

1) , d = max ( c 1,

1) , c 1= lim

( x) , d

( x).

x → a+

1=lim x→ b-

Przykład 5.2.

Niech X będzie zmienną losową typu ciągłego o gęstości f X przyjmującą wartości z przedziału (−∞ , +∞). Wyznaczyć gęstość zmiennej losowej Y = aX + b , a≠0.

Funkcja liniowa y= g ( x)= ax+ b spełnia założenia twierdzenia 5.1. (dla a > 0 funkcja jest rosnąca, dla a < 0 funkcja jest malejąca).

1

1

Funkcja odwrotna x= h( y)= ( y− b) , x ' = h' ( y)=

a

a

Zatem f ( y )= f

, y∈ℝ .

Y

X ( y− b ) 1

a

∣ a∣

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 4

Zauważmy, że wzór ten możemy także uzyskać w następujący sposób.

W przypadku a > 0 mamy

y

F

− b

Y ( y )= P ( Y ≤ y )= P ( aX + b≤ y )= P ( X ≤

)= F

)

a

X ( y− b

a

Ponieważ funkcja F

,

X jest różniczkowalna w punktach ciągłości

f X więc w tych

punktach

d

d

1

f ( y )=

F ( y)=

F

f

Y

)=

)

dy Y

dy

X ( y− b

a

a X ( y− b

a

W przypadku a < 0 mamy

y

F

− b

( y)= P ( Y ≤ y )= P ( aX + b≤ y)= P

Y

( X≥ )=1− F

)

a

X ( y− b

a

d

d

1

f

F

f

Y ( y )=

(1− F

) =−

)

dy Y ( y)= dy

X ( y− b

a

a X ( y− b

a

1

Zatem otrzymujemy, że f ( y )=

f

Y

).

∣ a∣ X ( y− b

a

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 5

5.2. Dwuwymiarowe zmienne losowe

• Niech (Ω , Α , P) będzie przestrzenią probabilistyczną, w której jest określonych n zmiennych losowych X X

1,

2,  , X n

X :

i Ω → R , i=1, 2,  , n .

• Wówczas dla każdego ∈ możemy rozpatrywać układ

X = X 1 , X 2 ,  , X n

• Układ ten nazywamy wektorem losowym ( n-wymiarowym).

• Dystrybuantą wektora losowego

X = X X

1,

2, , X n nazywamy funkcję

F : Rn  R daną wzorem:

F  x x  , x = P

 x , X  x ,  , X  x

1,

2,

n

{∈ : X 1

1

2

2

n

n } .

• Wektor losowy X = X X

1,

2, , X n nazywamy wektorem losowym o rozkładzie

dyskretnym jeśli przyjmuje skończoną bądź przeliczalną liczbę wartości.

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 6

• Wektor losowy X = X X

1,

2, , X n nazywamy wektorem losowym o rozkładzie

(absolutnie) ciągłym, jeśli istnieje nieujemna funkcja n zmiennych f  x , x 1

2,  , xn 

taka, że

x

x

x

1

2

n

F  x x

f

, t ,

dt

.

1,

2,  , x n=∫ ∫ ∫

 t 1 2  ,tn dt 1 2 dtn

−∞ −∞

−∞

• Niech  X , Y  będzie dwuwymiarową zmienną losową dyskretną (skokową), czyli zmienne losowe X i Y mają skończony lub przeliczalny zbiór wartości.

• Rozkładem łącznym dyskretnej zmiennej dwuwymiarowej  X , Y  nazywa się zbiór prawdopodobieństw:

P  X = x ,Y

i

= y j= pij dla i=1,2,…( r) , , j=1,2,…( s).

• Prawdopodobieństwa pij spełniają warunek: ∑ ∑ pij=1 .

i

j

• Dystrybuantę dwuwymiarowej zmiennej losowej dyskretnej określa się wówczas wzorem:

F  x , y= P  X  x ,Y  y= ∑ ∑ pij .

x  x y  y

i

j

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 7

• Rozkład dwuwymiarowej zmiennej losowej dyskretnej zwykle jest zapisywany w postaci tablicy, nazywanej tablicą korelacyjną.

y

y

1

2



ys

∑

x

p

p

p

1

11

12



p 1s

1⋅

x

p

p

p

2

21

22



p 2s

2⋅

⋮

⋮

⋮

⋮

⋮

⋮

x

p

p

p

r

r1

r2



prs

r⋅

∑

p

p

1

⋅1

⋅2



p⋅ s

• Rozkładem brzegowym dyskretnej zmiennej losowej X nazywamy rozkład s

prawdopodobieństwa : P( X = x

p , dla i

i )= pi =∑

=1, 2, , r .

⋅

ij

j=1

• Podobnie rozkładem brzegowym dyskretnej zmiennej losowej Y nazywamy rozkład r

prawdopodobieństwa: P  Y = y

p dla j

j = p

=1, 2, , s .

⋅ j=∑

ij

i=1

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 8

• Rozkładem warunkowym zmiennej losowej dyskretnej X pod warunkiem Y = y , j

j=1, 2,… , s , nazywamy rozkład prawdopodobieństwa:

P( X = x ,Y = y

p

P( X = x

i

j)

ij

i∣ Y = y j )=

=

, dla i=1, 2,… , r .

P ( Y = y )

p

j

⋅ j

• Rozkładem warunkowym zmiennej losowej dyskretnej Y pod warunkiem X = x , i

i=1, 2,… , r , nazywamy rozkład prawdopodobieństwa:

P( X = x ,Y = y

p

P( Y = y

i

j)

ij

j∣ X = xi )=

=

, dla j=1,2,… , s .

P ( X = x )

p

i

i⋅

• Zmienne losowe dyskretne X i Y są niezależne jeżeli P  X = x ,Y

i

= y j= P  X = xi⋅ P  Y = y j , czyli pij= pi⋅ p

⋅

⋅ j ,

dla wszystkich i=1, 2, , r , j=1,2, , s .

• Jeżeli zmienne losowe X i Y są niezależne, to oczywiście P  X = xi∣ Y = y j = P  X = xi= pi , dla i

⋅

=1, 2, , r .

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 9

• Niech teraz dwuwymiarowa zmienna losowa  X , Y  będzie zmienną losową ciągłą.

• Funkcja gęstości

f  x , y dwuwymiarowej zmiennej losowej ciągłej  X , Y 

łącznego rozkładu jest funkcją spełniającą warunki:

∞

∞

f  x , y0 , ∫ ∫ f ( x , y) dxdy=1 .

−∞ −∞

• Dystrybuantą dwuwymiarowej zmiennej losowej ciągłej  X , Y  nazywamy funkcję określoną za pomocą wzoru:

x

y

F  x , y= P  X  x ,Y  y =∫ ∫ f  s ,t  dsdt .

−∞ −∞

• Rozkładami brzegowymi f 1 x , f 2 y ciągłych zmiennych losowych X i Y

∞

∞

nazywa się następujące funkcje: f

f

f

1  x = ∫

 x , y  dy , f 2 y=∫  x , y dx .

−∞

−∞

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 10

• Warunkowe funkcje gęstości zmiennych losowych ciągłych X i Y są określone f ( x , y)

wzorami: f ( x∣ y )=

,

f

dla f

( y)

2 ( y )>0

2

f ( x , y)

oraz f ( y∣ x )=

,

f

dla f

( x)

1( x )>0 .

1

• Zmienne losowe ciągłe X i Y są niezależne jeżeli: f  x , y= f 1 x⋅ f 2 y , dla każdej pary liczb rzeczywistych  x , y .

• Oczywiście dla dowolnych niezależnych zmiennych losowych X i Y mamy: F

 x , y = P  X  x , Y  y = P  X  x ⋅ P  Y  y = F

 X ,Y 

X  x ⋅ F Y  y  .

• Momenty zwykłe dwuwymiarowej zmiennej losowej  X , Y  definiujemy następująco: α rs= E ( X r Y s) , gdzie liczby r , s∈ℕ.

• Jeżeli  X , Y  jest zmienną losową dyskretną, to: α

xr ys p .

rs=∑ ∑

i

j

ij

i

j

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 11

• Jeżeli  X , Y  jest zmienną losową ciągłą o funkcji gęstości prawdopodobieństwa

∞

∞

f ( x , y) , to α =∫ ∫ xr ys f ( x , y) dxdy .

rs

−∞ −∞

• Najczęściej wykorzystuje się momenty zwykłe rzędu pierwszego (α10= E ( X 1 Y 0)= EX , α01= E ( X 0 Y 1)= EY ) oraz momenty zwykłe rzędu drugiego (α20= E ( X 2 Y 0)= EX 2 , α11= E ( X 1 Y 1)= E ( XY ) , α02= E ( X 0 Y 2)= EY 2)

• Momenty centralne definiujemy w następujący sposób:

μ rs= E( X − EX ) r( Y − EY ) s .

• W szczególności μ20= E ( X − EX )2= D 2 X , μ02= E ( Y − EY )2= D 2 Y.

• Kowariancja zmiennych losowych  X , Y  jest określona za pomocą wzoru: Cov ( X , Y )=μ = E (( X − EX )( Y − EY ))= E ( XY )− EX⋅ EY

11

.

• Zauważmy, ze dla niezależnych zmiennych losowych X i Y kowariancja wynosi 0.

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 5. (19.03.2014 r.) 12

• Ponadto Cov  X , X = VarX , Var  X  Y = VarX  VarY 2Cov  X , Y  .

• Współczynnik korelacji liniowej między zmiennymi X i Y jest określony wzorem: Cov ( X , Y )

ρ=ρ( X , Y )=

.

σ X σ Y

• Zachodzi nierówność: −1 X , Y 1

• Współczynnik korelacji mierzy „siłę” zależności liniowej między zmiennymi losowymi X i Y.

• Jeżeli ρ( X ,Y )=0, czyli gdy Cov ( X ,Y )=0, to zmienne losowe X i Y nazywamy nieskorelowanymi.

• Oczywiście zmienne losowe niezależne są nieskorelowane (nie są skorelowane).

• Jeżeli ρ( X ,Y )=1, to zmienne losowe X i Y związane są funkcyjnie, a zależność między nimi ma charakter liniowej funkcji rosnącej.

• Jeżeli ρ( X ,Y )=−1, to zmienne losowe X i Y związane są funkcyjnie, a zależność między nimi ma charakter liniowej funkcji malejącej.

• Jeżeli 0<∣ρ( X ,Y )∣<1, to istnieje współzależność między zmiennymi losowymi X i Y, ale nie ma ona charakteru funkcyjnego. Im współzależność ta jest silniejsza, tym ρ( X ,Y ) bardziej odbiega od zera.