K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
1
MPiS30 W06: CHARAKTERYSTYKI
LICZBOWE ZMIENNEJ LOSOWEJ
1.
Charakterystyki liczbowe zmiennej losowej
2.
Charakterystyki połoŜenia
Przykład 1
Przykład 2
Przykład 3
3.
Charakterystyki rozrzutu
Przykład 4
Przykład 5
4.
Momenty zwykłe i centralne
Przykład 6
5.
Charakterystyki asymetrii i spłaszczenia
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
2
6.
Charakterystyki współzaleŜności liniowej
Przykład 7
Przykład 8
7.
Zmienna losowa standaryzowana i jej własności
8.
Nierówność Czebyszewa
Przykład 9
9.
Nierówność Gaussa
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
3
1. Charakterystyki liczbowe zm. l.
Niech
na (
Ω
, B, P) określone będą zm. l. X
1
,…, X
n
o war-
tościach rzeczywistych.
Charakterystykami liczbowymi
zm.
l.-ych (lub ich rozkładów prawdop.) nazywamy liczby charak-
teryzujące zbiór wartości, jakie mogą one przyjmować, np.
pod względem wartości najbardziej prawdop., rozrzutu wokół
pewnej wartości, kształtu wykresu funkcji prawdop. lub
krzywej gęstości, a w przypadku kilku zm. l. współzaleŜności
między nimi.
Charakterystyka liczbowa słuŜy do syntetycznego opisu
wartości zm. l. Za pomocą kilku liczb moŜna uzyskać w pro-
sty sposób dostatecznie dobre informacje o rozkładzie zm. l.
lub zaleŜnościach pomiędzy zm. l.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
4
2. Charakterystyki połoŜenia
Charakterystykę liczbową zm. l. X nazywamy
charaktery-
styką połoŜenia
, jeśli dodanie do zm. l. dowolnej stałej zmie-
nia wartość tej charakterystyki o tę stałą.
Do podstawowych charakterystyk połoŜenia wartości zm.
l. naleŜą:
a)
wartość oczekiwana
(ang. mean),
b)
wartość modalna
(ang. mode)
c)
kwartyle
(ang. quartile).
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
5
Wartością oczekiwaną
(wartością średnią, ang. expected va-
lue, mean) zm. l. X nazywamy liczbę m
X
=
E(X), przy czym
a)
dla zm. l. typu dyskretnego
E(X)
=
∑ x
i
p
i
b)
dla zm. l. typu ciągłego
∫
+∞
∞
−
=
dx
x
xf
X
)
(
)
(
E
przy załoŜeniu, Ŝe występujący szereg i całka są bezwzględ-
nie zbieŜne. W przeciwnym przypadku powiemy, Ŝe zm. l. nie
ma wartości oczekiwanej.
Mianem wartości oczekiwanej jest miano badanej zm. l.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
6
Przykład 1. Rozkład zm. l. T jest określony za pomocą PMF:
f(t)
=
P(T
=
t)
=
q
t
−
1
p, t
=
1, 2,…
Wyznaczyć wartość oczekiwaną zm. l. T.
Rozwiązanie. Z definicji wartości oczekiwanej
E(T)
=
1 p
+
2qp
+
3q
2
p
+
…
=
p(1
+
2q
+
3q
2
+
…).
Korzystamy z faktu, Ŝe jeśli x < 1, to
1
+
x
+
x
2
+
x
3
+
…..
=
1/(1
−
x).
RóŜniczkując tę formułę, otrzymujemy
1
+
2x
+
3x
2
+
…
=
1/(1
−
x)
2
, więc
E(T)
=
p/(1
−
q)
2
=
p /p
2
=
1/p.
Jeśli doświadczenie polega na rzucaniu prawidłową monetą,
to oczekiwana liczba rzutów do otrzymanie po raz pierwszy
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
7
orła wynosi 2. JeŜeli rzucamy kostką, to oczekiwana liczba
rzutów do otrzymania po raz pierwszy szóstki wynosi 6.
Własności wartości oczekiwanej
Niech na przestrzeni (
Ω
, B, P) określone będą dwie zm. l. X i
Y dla których istnieją wartości oczekiwane oraz niech a, b, c
∈
R. Wówczas
1.
E(c)
=
c;
2.
E(aX)
=
aE(X);
3.
E(X
+
b)
=
E(X)
+
b;
4.
E(X
+
Y)
=
E(X)
+
E(Y).
5.
JeŜeli zm. l. X i Y są niezaleŜne, to
E((X
−
EX)(Y
−
EY))
=
0.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
8
Z własności 2, 3 i 4 wynika, Ŝe operator E jest operatorem li-
niowym. Własność 4 moŜna uogólnić na przypadek skończo-
nej sumy zm. l.
JeŜeli zm. l. X i Y spełniają warunek z tezy własności 5, to
nazywamy je
nieskorelowanymi zm. l.
JeŜeli zm. l. X ma wartość oczekiwaną m, to zm. l.
Y
=
X
−
m
nazywamy zm. l. scentrowaną
.
Przykład 2. Niech X będzie liczbą punktów stałych w loso-
wej permutacji zbioru {a, b, c}.
a) Wyznaczyć wartość oczekiwaną zm. l. X.
b) Uogólnić wynik na zbiór n elementowy.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
9
Rozwiązanie.
a) Doświadczenie jest tu określone poprzez
permutację zbioru {a, b, c}. Stąd zbiór zdarzeń elementarnych
Ω
=
{(a, b, c), (a, c, b), (b, a, c), (b, c, a), (c, a, b), (c, b, a)}.
KaŜdy wynik zachodzi z prawdop. 1/6. Liczby punktów sta-
łych podane są w tablicy 1.1.
Ω
X
p
i
a b c
a c b
b a c
b c a
c a b
c b a
3
1
1
0
0
1
1/6
1/6
1/6
1/6
1/6
1/6
Tablica 1.1. Liczby punktów stałych.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
10
Obliczamy E(X ) zm .l . typu dyskretnego
1
6
1
1
6
1
0
6
1
0
6
1
1
6
1
1
6
1
3
=
+
+
+
+
+
.
b) Wyznaczymy oczekiwaną liczbę punktów stałych w loso-
wej permutacji zbioru {1, 2, 3,…, n}. Dla kaŜdego i, 1
≤
i
≤
n,
niech X
i
(
ω
) równa się 1, jeśli losowa permutacja
ω
ma punkt
stały na i-tym miejscu, i 0 w p. p. Dla kaŜdego i,
E(X
i
)
=
1/n.
Niech Y oznacza liczbę punktów stałych w permutacji
ω
Y(
ω
)
=
X
1
(
ω
)
+
X
2
(
ω
)
+
…
+
X
n
(
ω
).
Z własności liniowości dla n zm. l. wynika, Ŝe
E(Y)
=
E(X
1
)
+
E(X
2
)
+
…
+
E(X
n
), stąd E(Y)
=
1.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
11
Przykład 3. Niech X
i
, i
=
1, 2,…, n będą i.i.d. zm. l. o rozkła-
dzie jednostajnym na [0, 1] oraz Y
n
=
max{X
1
,…, X
n
}.
a)
Wyznaczyć E(Y
n
)).
b)
Wyznacz funkcję kwantylową i kwantyl rzędu 0,9 zm. l.
Y
n
.
Rozwiązanie.
Z załoŜenia o jednostajności rozkładu zm. l. X
i
.
1
,
1
0
,
0
dla
dla
dla
,
1
,
,
0
)
(
,...
2
,
1
≥
<
≤
<
=
∀
=
x
x
x
x
x
F
i
X
n
i
Z definicji zm. l. Y
n
i niezaleŜności zm. l. X
i
mamy
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
12
)
,...,
(
P
)
}
,...,
(max{
P
)
(
1
1
x
X
x
X
x
X
X
x
F
n
n
Y
n
≤
≤
=
≤
=
)
(
...
)
(
)
(
P
...
)
(
P
1
1
x
F
x
F
x
X
x
X
n
X
X
n
⋅
⋅
=
≤
⋅
⋅
≤
=
.
Stąd dystrybuanta i gęstość zm. l. Y
n
dla n
=
1, 2,…
.
1
,
1
0
,
0
dla
dla
dla
,
1
,
,
0
)
(
≥
<
≤
<
=
x
x
x
x
x
F
n
Y
n
<
≤
=
−
,
1
0
.
.p
p
w
dla
,
0
,
)
(
1
x
nx
x
f
n
Y
n
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
13
a) Wyznaczamy wartość oczekiwaną zm. l. Y
n
1
)
(
E
1
0
+
=
=
∫
n
n
dx
x
n
Y
n
n
.
b) Wyznaczamy funkcję kwantylową zm. l. Y
n
dla x
∈
(0, 1).
PoniewaŜ
p
x
n
p
=
,
więc
n
p
p
x
=
.
Stąd kwantyl rzędu 0,9
n
x
9
,
0
9
,
0
=
.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
14
Wartością modalną
lub
modą
mo(X) (ang. modal value,
mode) zm. l. X nazywamy:
1.
dla zm. l. typu dyskretnego
−
wartość x
k
, odpowiadająca
lokalnemu maksimum funkcji prawdop., tj. wartość róŜną
od min {x
i
} i max{x
i
}, dla której prawdop. f (x
k
) jest większe
od wartości prawdop. odpowiadających punktom skokowym
leŜącym w bezp. sąsiedztwie punktu x
k
.
2.
dla zm. l. typu ciągłego
−
wartość x
0
, w której gęstość f (x)
osiąga maksimum lokalne.
JeŜeli istnieje jedna moda, to rozkład zm. l. X nazywamy
rozkł. jednomodalnym
(unimodal distribution). JeŜeli istnieje
więcej niŜ jedna moda, wtedy rozkład nazywamy
rozkł. wie-
lomodalnym
(multimodal distribution).
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
15
3. Charakterystyki rozrzutu
Charakterystykę liczbową zm. l. nazywamy
charaktery-
styką rozrzutu
, jeśli dodanie do zm. l. dowolnej stałej nie
zmienia wartości tej charakterystyki. Charakterystykami roz-
rzutu wartości zm. l. są:
a)
wariancja
(ang. variance),
b)
odchylenie standardowe
(ang. standard deviation),
c)
odchylenie ćwiartkowe
.
Względną charakterystyką rozrzutu jest
współczynnik
zmienności
(ang. coefficient of variation).
Niech
X będzie zm. l. określoną na (
Ω
, B, P) i ma wartość
oczekiwaną m
X
=
E(X).
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
16
Wariancją
(variance)
zm. l. X nazywamy wartość oczeki-
waną kwadratu scentrowanej zm. l., tj. liczbę
)
(
D
2
2
X
X
=
σ
określoną wzorem:
D
2
(X)
=
E(X
−
m
X
)
2
,
przy czym
a)
dla zm. l. typu dyskretnego
(
)
∑
−
=
)
(
)
(
D
2
2
i
X
i
x
f
m
x
X
b)
dla zm. l. typu ciągłego
∫
∞
∞
−
−
=
dx
x
f
m
x
X
X
)
(
)
(
)
(
D
2
2
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
17
Wariancja zm. l. istnieje, gdy szereg (całka) występujący
w definicji wariancji jest zbieŜny. Mianem wariancji jest kwa-
drat miana badanej zm. l.
Niech na (
Ω
, B, P) określone będą zm. l. X i Y o skończo-
nych wariancjach oraz a, b
∈
R. Wówczas
a)
D
2
(a)
=
0
−
wariancja stałej zm. l. jest równa zero,
b)
D
2
(X
+
a)
=
D
2
(X)
−
niezmienniczość na przesunięcie,
c)
D
2
(aX)
=
a
2
D
2
(X) dla a
≠
0;
Dowód.
Z def. wariancji i własności wartości oczekiwanej
D
2
(aX)
=
E(aX
−
E(aX))
2
=
E(aX
−
a E(X))
2
=
a
2
D
2
(X).
d)
D
2
(X
+
Y)
=
D
2
(X)
+
D
2
(Y)
+
2 E((X
−
EX)(Y
−
EY)).
Dowód.
Wynika z następujących przekształceń
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
18
D
2
(X
+
Y)
=
E((X
+
Y)
−
E(X
+
Y))
2
=
E((X
−
EX)
+
(Y
−
EY))
2
=
E(X
−
EX)
2
+
E(Y
−
EY)
2
+
2 E((X
−
EX)(Y
−
EY)).
W szczególności, jeśli zm. l. są nieskorelowane, to warian-
cja ich sumy jest równa sumie ich wariancji.
Odchyleniem standardowym
(standard deviation) lub dysper-
sją zm. l. X nazywamy dodatni pierwiastek z wariancji, tj.
liczbę
)
(
D
2
X
X
=
σ
.
Mianem dyspersji jest miano zmiennej X.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
19
Przykład 4. Wkładamy losowo n listów do n zaadresowanych
kopert, przeznaczonych dla róŜnych adresatów. Wyznaczyć
wartość oczekiwaną i wariancję liczby listów włoŜonych
prawidłowo.
Rozwiązanie.
Niech X
i
, i
=
1, 2,…, n będzie zm. l. informują-
cą, czy i-ty list został dobrze włoŜony, tj. niech X
i
=
1, jeśli i-
ty list został włoŜony prawidłowo oraz X
i
=
0 w przeciwnym
razie.
Ponadto niech X
=
∑
i
X
i
, tj. zm. l. X zlicza listy włoŜone
prawidłowo do kopert.
PoniewaŜ P(X
i
=
1)
=
1/n, więc EX
=
1.
W celu wyznaczenia wariancji sumy zm. l. wyprowadza-
my wzór
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
20
D
2
(X
1
+
…
+
X
n
)
=
E(X
1
+
…
+
X
n
)
2
−
(EX
1
+
…
+
EX
n
)
2
(
)
∑
∑
=
≤
<
≤
−
+
−
=
n
i
n
j
i
j
i
j
i
i
i
X
X
X
X
X
X
1
1
2
2
)
E
E
)
(
E
(
2
)
E
(
E
∑
∑
≤
<
≤
=
+
=
n
j
i
j
i
n
i
i
X
X
X
1
1
2
)
,
cov(
2
D
.
PoniewaŜ
∀
i
=
1,…, n
D
2
X
i
=
(n
−
1)/n
2
,
więc
∑
i
D
2
X
i
=
(n
−
1)/n.
Dla i
≠
j mamy E(X
i
X
j
)
=
P(X
i
X
j
=
1)
=
1/(n(n
−
1)) i kaŜda z
n
2
−
n kowariancji cov(X
i
, X
j
)
=
1/(n
2
(n
−
1)).
Ich suma wynosi 1/n, więc ostatecznie otrzymujemy D
2
X
=
1.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
21
Odchyleniem ćwiartkowym
zm. l. nazywamy charakterystykę
Q
=
(x
0,75
−
x
0,25
)/2,
gdzie x
0,25
, x
0,75
są kwartylami dolnym i górnym.
Współczynnikiem zmienności
(coefficient of variation) zm. l.
X nazywamy iloraz
X
X
m
X
σ
=
ν
(dla m
X
≠
0)
W normie PN-ISO 3534-1 współ. zmienności jest określo-
ny tylko dla nieujemnej zm. l. Współ. zmienności jest liczbo-
wą charakterystyką względnego rozrzutu wartości zm. l. Mo-
Ŝ
e być on wyraŜony procentowo.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
22
Praktyczne zastosowanie współ. zmienności wynika z te-
go, Ŝe jest charakterystyką bez miana oraz z następującej wła-
sności.
Własność.
Niech X będzie zm. l. taką, Ŝe m
X
≠
0. Dla do-
wolnej stałej c
≠
0 prawdziwa jest równość
ν
cX
=
ν
X
.
Dowód.
Z definicji współczynnika zmienności
cX
cX
cX
m
v
/
σ
=
.
Z własności wartości oczekiwanej oraz wariancji
X
X
X
cX
cm
c
ν
=
σ
=
ν
)
/(
)
(
, cnd.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
23
Przykład 5.
Wzrost ludzi z pewnej populacji jest zm. l. X o
wartości oczekiwanej m
X
=
175 [cm] i odchyleniu standardo-
wym
σ
X
=
10 [cm], zaś waga ludzi z tej populacji
−
zm. l. Y
dla której m
Y
=
75 [kg] i
σ
Y
=
5 [kg]. Ze względu, na którą ce-
chę badana populacja ludzi jest bardziej zróŜnicowana ?
Rozwiązanie.
Wystarczy porównać współczynniki zmienno-
ś
ci dla obydwu zm. l.. PoniewaŜ
ν
X
=
2/35,
ν
Y
=
2/30, więc
ν
X
<
ν
Y
, stąd badana populacja ludzi jest bardziej zróŜnicowana
ze względu na wagę niŜ na wzrost.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
24
4. Momenty zwykłe i centralne
Momentem zwykłym
r
−
tego rzędu (r jest liczbą naturalną)
zm. l. X nazywamy charakterystykę liczbową określoną wzo-
rem:
m
r
(X)
=
E(X
r
)
Z istnienia momentów wyŜszych rzędów wynika istnienie
momentów niŜszych rzędów. Wartość oczekiwana jest mo-
mentem zwykłym rzędu pierwszego.
Związek między wariancją a momentami zwykłymi
JeŜeli istnieje wariancja D
2
(X) zm. l. X, to
)
(
)
(
)
(
D
2
1
2
2
X
m
X
m
X
−
=
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
25
Dowód.
Z definicji wariancji
(
)
2
2
)
E
(
E
)
(
D
X
X
X
−
=
(
)
(
)
2
2
)
(
E
)
(
E
2
E
X
X
X
X
+
−
=
.
Z własności wartości oczekiwanej
(
)
2
2
2
)
(
E
)
(
E
)
(
E
2
)
(
E
)
(
D
X
X
X
X
X
+
−
=
(
)
2
1
2
2
2
)
(
E
)
(
E
m
m
X
X
−
=
−
=
.
Przykład 6. Losujemy liczbę z przedziału (a, b), gdzie a < b.
Niech X oznacza wylosowaną liczbę. Wyznaczyć:
a) trzy pierwsze momenty zwykłe;
b) wariancję zm. l. X.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
26
Rozwiązanie.
a) Momenty wyznaczamy przez całkowanie
2
1
)
(
1
b
a
xdx
a
b
X
m
b
a
+
=
−
=
∫
,
3
)
(
3
1
)
(
2
2
3
3
2
2
b
ab
a
a
b
a
b
dx
x
a
b
X
m
b
a
+
+
=
−
−
=
−
=
∫
,
4
)
)(
(
)
(
4
1
)
(
4
2
4
4
3
3
b
a
b
a
a
b
a
b
dx
x
a
b
X
m
b
a
+
+
=
−
−
=
−
=
∫
.
b) Wariancję wyznaczamy ze związku z momentami zwy-
kłymi
12
/
)
(
)
(
D
2
2
1
2
2
a
b
m
m
X
−
=
−
=
,
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
27
Momentem centralnym
k-tego rzędu (k
=
1, 2,…) (
central
moment of order k
) zm. l. X nazywamy wartość oczekiwaną k-
tej potęgi scentrowanej zm. l., tj.
k
k
X
X
X
)
E
(
E
)
(
−
=
µ
Wariancja jest momentem centralnym rzędu drugiego.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
28
5. Charakterystyki asymetrii i spłaszczenia
Charakterystykę liczbową zm. l. X nazywamy
charaktery-
styką asymetrii
, jeśli informuje ona o odchyleniu się jej roz-
kładu od rozkładu symetrycznego. Zm. l. X ma
rozkład syme-
tryczny
, jeśli istnieje taka liczba a, Ŝe:
•
w przypadku zm. l. typu dyskretnego kaŜdemu punktowi
skokowemu x
i
≤
a, odpowiada punkt x
j
≥
a taki, Ŝe
P(X
=
x
i
)
=
P(X
=
x
j
) oraz a
−
x
i
=
x
j
−
a;
•
w przypadku zm. l. typu ciągłego o gęstości f(x) dla kaŜ-
dego x w punktach ciągłości
f(a
−
x)
=
f(a
+
x).
Liczba a nosi nazwę
liczby centralnej
.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
29
Prosta o równaniu x
=
a jest
osią symetrii
wykresu funkcji
prawdop. lub krzywej gęstości.
Rozkład, który nie jest symetryczny nazywamy
rozkładem
asymetrycznym
.
Charakterystyką asymetrii jest
współczynnik asymetrii
.
Współczynnikiem asymetrii
lub
skośnością
(
skewness
)
γ
1
(X) rozkładu zm. l. X nazywamy iloraz
3
3
2
/
3
2
3
1
)
(
)
(
)
(
)
(
X
X
X
X
X
σ
µ
=
µ
µ
=
γ
,
gdzie
µ
2
,
µ
3
i
σ
oznaczają odpowiednio moment centralny
rzędu drugiego, moment centralny rzędu trzeciego i odchyle-
nie standardowe rozkładu zm. l. X.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
30
Współczynnik asymetrii jest miarą odchylenia od symetrii
rozkładu. Dla rozkładów symetrycznych wszystkie momenty
centralne rzędów nieparzystych są równe zeru.
Współczynnikiem spłaszczenia
(ekscesem, ang. excess)
rozkładu zm. l. X nazywamy charakterystykę
3
)
(
)
(
)
(
2
2
4
2
−
µ
µ
=
γ
X
X
X
,
gdzie
µ
2
i
µ
4
oznaczają momenty centralne, odpowiednio rzę-
du drugiego i czwartego, rozkładu zm. l. X.
Współczynnik spłaszczenia jest miarą rozbieŜności danego
rozkładu od rozkładu normalnego o tej samej wartości ocze-
kiwanej i wariancji.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
31
6. Charakterystyki współzaleŜności liniowej
JeŜeli rozwaŜamy kilka zm. l. określonych na tej samej
przestrzeni (
Ω
, B, P), to moŜemy badać je nie tylko z osobna,
ale równieŜ współzaleŜności między nimi.
W szczególności, charakterystykami określającymi współ-
zaleŜność liniową pomiędzy parą zm. l. są:
a) kowariancja,
b) współczynnik korelacji.
Niech na (
Ω
, B, P) określone będą zm. l. X
1
, X
2
,…, X
n
o
wartościach rzeczywistych.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
32
Kowariancją zm. l. X
i
i X
j
(i, j
=
1, 2, …, n) spełniających
warunek EX
i
X
j
<
∞
, nazywamy wielkość
cov(X
i
, X
j
)
=
E((X
i
−
EX
i
) ( X
j
−
EX
j
))
Mianem kowariancji jest iloczyn mian badanych zmiennych.
Własności kowariancji:
1) cov(X
i
, X
j
)
=
cov(X
j
, X
i
),
2) cov(X
i
, X
i
)
=
D
2
(X
i
),
3) cov(X
i
, X
j
)
=
E(X
i
X
j
)
−−−−
E(X
i
) E(X
j
),
4)
cov(X
i
, X
j
)
≤
D(X
i
) D(X
j
) – nierówność Schwarza.
Dowód wł. 3.
Z definicji kowariancji i własności wartości
oczekiwanej
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
33
cov(X
i
, X
j
)
=
E(X
i
X
j
−
X
j
E(X
i
)
−
X
i
E(X
j
)
+
E(X
i
)E(X
j
))
=
E(X
i
X
j
)
−−−−
E(X
i
)E(X
j
)
−−−−
E(X
i
)E(X
j
)
+
E(X
i
)E(X
j
)
=
E(X
i
X
j
)
−−−−
E(X
i
)E(X
j
).
Z własności 3) wynika, Ŝe dla kaŜdej pary niezaleŜnych
zm. l. X
i
i X
j
cov(X
i
, X
j
)
=
0. Odwrotne stwierdzenie jest fał-
szywe. Ilustruje to następujący przykład.
Przykład 7. Obliczyć kowariancję oraz zbadać niezaleŜność
zm. l. brzegowych dla wektora l. (X, Y) o łącznym rozkładzie:
X \Y
1
2
3
6
0,2
0
0,2
8
0
0,2
0
10 0,2
0
0,2
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
34
Rozwiązanie.
Po wykonaniu obliczeń mamy: E(X)
=
8, E(Y)
=
2, E(XY)
=
16, zatem cov(X, Y)
=
0, więc zm. l. X i Y są
nie-
skorelowane
, ale nie są niezaleŜne, gdyŜ
P(X
=
6, Y
=
1)
=
0,2
≠
(0,4) (0,4)
=
P(X
=
6) P(Y
=
1).
Niech na (
Ω
, B, P) określone będą zm. l. X
1
, X
2
,…, X
n
o
wartościach rzeczywistych.
Współczynnikiem korelacji
(
Correlation coefficient
) zm. l.
X
i
, X
j
(i, j
=
1, 2,…, n) nazywamy charakterystykę liczbową
ρ
ij
określoną wzorem
)
(
D
)
(
D
)
,
(
Cov
j
i
j
i
ij
X
X
X
X
=
ρ
,
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
35
Współczynnik korelacji jest wielkością nie mianowaną.
Przykład 8. Obliczyć współczynnik korelacji zachorowalno-
ś
ci na raka i nałogowego palenia papierosów S na podstawie
danych z przykładu palenie i rak.
Rozwiązanie.
Łączny i brzegowe rozkłady zostały wyzna-
czone wcześniej
C \ S 0 1
0
1
40/60 10/60
7/60 3/60
50/60
10/60
47/60 13/60
1
Tablica 1. Łączny rozkład.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
36
E(C)
=
10/60, E(S)
=
13/60, E(CS)
=
3/60, cov(C, S)
=
5/360,
E(C
2
)
=
10/60, E(S
2
)
=
13/60, D
2
(C)
=
5/36, D
2
(S)
=
611/3600.
Odchylenia standardowe D(C)
≈
0,372678, D(S)
≈
0,411974,
stąd
ρ
(C, S)
≈
0,090462.
Własności.
Dla dowolnej pary zm. l. X
i
, X
j
zachodzi własność
−
1
≤
ρ
(X, Y)
≤
1.
Ponadto dla dowolnych stałych a, b, c, d
cov(aX
+
b, cY
+
d)
=
ac cov(X, Y).
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
37
Zatem, jeśli stałe a i c są tego samego znaku, to współ-
czynnik korelacji zm. l. aX
+
b i cY
+
d jest taki sam, jak zm.
l. X i Y. Oznacza to, Ŝe współczynnik korelacji nie zaleŜy od
przyjętej skali oraz od połoŜenia początku układu współrzęd-
nych, w którym są rejestrowane zm. X i Y.
Własność
ρ
(X, Y)
=
1 zachodzi wtedy i tylko wtedy, gdy
Y
=
aX
+
b z prawdop. 1.
Jeśli
∀
i
=
1, 2,…, n
D
2
X
i
<
∞
, to macierz
cov(X
1
, X
2
,…, X
n
)
=
[cov(X
i
, X
j
)]
i,j
=
1,…, n
nazywamy
macierzą kowariancji
zm. l. X
1
, X
2
,…, X
n
.
Macierzą korelacyjną
(
correlation matrix
) zm. l. X
1
, X
2
,…,
X
n
nazywamy macierz corr(X
1
, X
2
,…, X
n
)
=
[
ρ
ij
)]
i,j
=
1,…, n
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
38
7. Zm. l. standaryzowana i jej własności
Standaryzacją
zm. l. X o skończonej wartości oczekiwanej
m
X
i odchyleniu standardowym
σ
X
> 0 nazywamy przekształ-
cenie Z
=
h(X) określone wzorem:
X
X
m
X
X
h
σ
−
=
)
(
Zm. l.
Z
nazywamy
standaryzowaną zm. l.
(
standardized r.
v.
)
Standaryzacja zm. l. moŜe być uogólniona na tak zwaną
„
zm. l. zredukowaną
”, która jest określana za pomocą innej
charakterystyki połoŜenia i/lub innej charakterystyki skali.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
39
Własności.
Niech Z będzie standaryzowaną zm. l. dla zm. l.
X, wówczas
a)
E(Z)
=
0
−
wartość oczekiwana stand. zm. l. wynosi 0,
b)
D
2
(Z)
=
1
−
wariancja stand. zm. l. wynosi 1,
c)
γ
1
(Z)
=
γ
1
(X)
−
niezmienniczość skośności na standaryza-
cję,
d)
)
/
)
((
)
(
X
X
Z
X
m
x
F
x
F
σ
−
=
−
związek między dystrybuan-
tami.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
40
8. Nierówność Czebyszewa
1
JeŜeli zm. l. X ma skończoną wartość oczekiwaną i dodat-
nią wariancję, to dla dowolnego k > 0 zachodzi oszacowanie
zwane
nierównością Czebyszewa
2
1
P
k
k
m
X
X
X
≤
≥
σ
−
lub równowaŜne
(
)
2
2
P
k
k
m
X
X
X
σ
≤
≥
−
.
1
Pafnucy Lwowicz Czebyszew (1821
−
1894)
−
matematyk rosyjski. Jeden z twórców petersburskiej szkoły matematycznej.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
41
Przykład 9. Niech X będzie liczbą sukcesów w 20 próbach,
gdzie prawdop. sukcesu w jednej próbie wynosi p
=
0,4.
a)
Oszacować z dołu prawdop., Ŝe liczba sukcesów będzie
zawarta między 4 i 12.
b)
Obliczyć dokładną wartość prawdop.
Rozwiązanie.
a) PoniewaŜ E(X)
=
20
⋅
0,4
=
8 oraz D
2
(X)
=
4,8, więc do oszacowania prawdop. korzystamy z nierówności
Czebyszewa dla k
=
4,
)
4
(
P
1
)
4
(
P
)
12
4
(
P
>
−
−
=
≤
−
=
≤
≤
m
X
m
X
X
7
,
0
16
8
,
4
1
)
4
(
P
1
=
−
≥
≥
−
−
≥
m
X
.
b) Dokładne obliczenia z rozkładu Bin(20; 0,4) to 0,96301.
K.J. Andrzejczak, MPiS30 W06: Charakterystyki liczbowe zmiennej losowej
42
9. Nierówność Gaussa
2
JeŜeli zm. l. X typu ciągłego ma skończoną wartość ocze-
kiwaną i dodatnią wariancję oraz ma rozkład jednomodalny i
symetryczny, to zachodzi lepsze oszacowanie od nierówności
Czebyszewa zwane
nierównością Gaussa
2
9
4
P
k
k
m
X
X
X
≤
≥
σ
−
2
Carl Friedrich Gauss (1777-1855)
−
matematyk niemiecki. Jeden z najwybitniejszych matematyków wszyst-
kich czasów, zwany przez współczesnych ksiąŜę matematyków. Profesor uniwersytetu w Getyndze.