dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 1

• Dokończenie Wykładu 1. Podstawy rachunku prawdopodobieństwa (str. 21 – 30) 2. Zmienna losowa i jej charakterystyki

• Prawie wszystkie wielkości, z którymi mamy do czynienia na co dzień, mają (mniej lub bardziej) charakter losowy, np. wzrost pierwszej osoby spotkanej po wyjściu z domu, ocena otrzymana na najbliższym egzaminie, cena kostki masła w najbliższym

sklepie.

• Zdarzeniom losowym często przyporządkujemy pewne wielkości liczbowe, które charakteryzują interesujące nas cechy tych zdarzeń.

• Np. zdarzeniem losowym w grze w totolotka jest trafienie szóstki, piątki, czwórki lub trójki. Z takim trafieniem jest związana pewna nagroda pieniężna, a więc

pewna wielkość liczbowa.

• Jeśli rzucamy monetą tak długo, aż pojawi się orzeł, to liczba wykonanych rzutów jest wielkością liczbową przyporządkowaną zdarzeniu losowemu.

• Te wielkości liczbowe nazywają się zmiennymi losowymi.

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 2

• Zmienne losowe to funkcje o wartościach rzeczywistych określone na przestrzeni zdarzeń elementarnych.

• Jednak musimy nałożyć pewne ograniczenia na te funkcje. Spowodowane jest to tym, że chcemy mieć możliwość mówienia o prawdopodobieństwie tego, że zmienna losowa przyjmuje wartość należącą do danego podzbioru zbioru liczb rzeczywistych

o stosunkowo prostej budowie, np. do przedziału.

• Podamy teraz formalną definicję zmiennej losowej.

Definicja 2.1.

Niech (Ω , Α , P) będzie dowolną przestrzenią probabilistyczną. Funkcję X :  R ,

określoną na przestrzeni zdarzeń elementarnych  o wartościach w zbiorze liczb rzeczywistych R , nazywamy zmienną losową, jeżeli jest funkcją mierzalną względem σ-ciała Α , tj. jeżeli dla każdej liczby rzeczywistej c {ω∈Ω: X (ω)< c}∈Α .

• Zauważmy, że jeżeli przestrzeń zdarzeń elementarnych  jest zbiorem co najwyżej przeliczalnym (np. skończonym), to każda funkcja X :  R , która każdemu zdarzeniu elementarnemu ∈ przyporządkowuje liczbę rzeczywistą X ∈ R , jest zmienną losową.

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 3

• W teorii prawdopodobieństwa zwyczajowo (w niektórych przypadkach) opuszcza się

argument  i symbolem X oznacza się zarówno wartość funkcji X  , jak i samą funkcję X . Podobnie wyrażenie { X = x } jest skróconym zapisem zbioru

{∈ : X = x } .

• Każdej zmiennej losowej odpowiada

funkcja rozkładu, określająca

prawdopodobieństwa występowania poszczególnych wartości zmiennej.

• Zmienne losowe dzielimy (m.in.) na:

• dyskretne (skokowe),

• ciągłe (absolutnie ciągłe).

• Zmienna losowa dyskretna X ma skończony lub przeliczalny zbiór wartości x , x ,

, p ,

1

2  , przy czym prawdopodobieństwa p 1

2  , przyjmowania przez

zmienną losową X wartości x , x ,

1

2  , spełniają warunki: 0< pi⩽1 , i=1, 2, 

i p 1 p 2=1 .

• Oczywiście zmienna losowa dyskretna może mieć co najwyżej tyle wartości, ile elementów liczy zbiór zdarzeń elementarnych, na którym jest ona określona.

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 4

• Rozkład zmiennej losowej dyskretnej X zapisujemy najczęściej w postaci tabelki: x

x

x

i

1

2



xn

p

p

p

i

1

2



pn

lub w postaci: P  X = xi= pi , i=1,2, .

Przykład 2.1.

Weźmy pod uwagę prosty eksperyment losowy polegający na trzykrotnym rzucie symetryczną monetą. Przestrzeń zdarzeń elementarnych  (przestrzeń prób) składa się z następujących 8 wyników:

ω1=( O ,O ,O)

ω2=( O ,O , R)

ω3=( O , R , O)

ω4=( O , R , R) ω5=( R , O , O) ω6=( R ,O , R) ω7=( R , R ,O) ω8=( R , R , R) W tym przypadku, elementami σ-ciała Α są wszystkie podzbiory zbioru 

(wiemy, że tych podzbiorów jest 28=256 ), w tym np. podzbiór odpowiadający zdarzeniu otrzymania dwóch orłów jest równy { ,

,

2 3 5 } ).

W tym przypadku na przestrzeni zdarzeń elementarnych  możemy zdefiniować

zmienną losową X określającą całkowitą liczbę orłów w trzech rzutach:

X 1=3 X 2=2 X 3=2 X 4=1

X 5=2 X 6=1 X 7=1 X 8=0

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 5

Zatem zmienna losowa X przyjmuje wartości: 0, 1, 2, 3. Ponadto zakładając, że wszystkie zdarzenia elementarne są jednakowo prawdopodobne (moneta jest symetryczna), otrzymujemy następujący rozkład prawdopodobieństwa zmiennej losowej X :

1

P  X =0= P ∈ : X =0= P {8}=8

3

P  X =1= P ∈ : X =1= P { ,

,

4 6 7 }= 8

3

P  X =2= P ∈ : X =2= P { , ,

2 3 5}= 8

1

P  X =3= P ∈ : X =3= P {1}=8

W postaci tabelki:

xi

0

1

2

3

1

3

3

1

pi

8

8

8

8

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 6

• Zmienna losowa ciągła X ma zbiór wartości nieskończony i nieprzeliczalny.

• Najczęściej jest to zbiór wszystkich liczb rzeczywistych lub pewien przedział.

• Zmienna losowa ciągła (absolutnie ciągła) jest reprezentowana przez funkcję gęstości (odpowiednik funkcji rozkładu) f ( x) , która ma następujące własności:

• funkcja gęstości jest funkcją nieujemną ( f  x0 , dla każdego x ∈ R ),

• pole pod wykresem funkcji gęstości jest równe 1, co możemy zapisać za pomocą

∞

całki w następujący sposób ∫ f  x dx=1 .

−∞

• Zauważmy, że prawdopodobieństwo, że zmienna losowa ciągła przyjmuje określoną

wartość wynosi 0 ( P  X = a=0 , a∈ R ) i dlatego dla zmiennych losowych ciągłych wyznaczamy prawdopodobieństwa przedziałowe.

• Prawdopodobieństwo, że zmienna losowa ciągła przyjmuje wartości

z przedziału  a , b (( a, b], [ a, b), [ a, b]) jest równe polu pod wykresem funkcji gęstości na tym przedziale.

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 7

Definicja 2.2.

Dystrybuantą (skumulowaną funkcją rozkładu prawdopodobieństwa) zmiennej losowej X nazywamy funkcję F ( F  x )zdefiniowaną jako: F  x= P  X  x , x ∈ R

• Dystrybuanta zmiennej losowej X jest jednoznacznie zdefiniowana przez rozkład tej zmiennej losowej.

• Własności dystrybuanty F:

• O F  x1 , dla każdego x∈ R

•

F  x jest funkcją niemalejącą

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 8

•

F  x jest funkcją (co najmniej) prawostronnie ciągłą mającą lewostronne granice

•

lim F  x=0 oraz lim F  x=1

x −∞

x ∞

• Dla zmiennych losowych dyskretnych

F  x= P  X  x=∑ P  X = x =∑ p i

i ,

x  x

x  x

i

i

zaś dla zmiennych losowych ciągłych wartość dystrybuanty w punkcie x jest równa polu pod wykresem funkcji gęstości na przedziale −∞ , x , czyli x

F ( x)=∫ f ( t) dt .

−∞

• Dla zmiennej losowej ciągłej prawdziwe są następujące wzory:

b

P  a X  b= P  a X  b= P  a X  b= P  a X  b=∫ f  x dx= F  b− F  a

a

a

P  X  a= P  X  a=∫ f  x dx= F  a

−∞

∞

P  X  a= P  X  a=∫ f  x dx=1− F  a

a

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 9

• Zmienne losowe mogą być charakteryzowane za pomocą pewnych stałych, które nazywa się parametrami.

Najważniejszymi parametrami (charakterystykami) zmiennych losowych są:

• wartość oczekiwana (wartość

• współczynnik skupienia (kurtoza)

przeciętna, nadzieja matematyczna)

• moda (wartość modalna, dominanta)

• wariancja (dyspersja)

• mediana (wartość środkowa)

• odchylenie standardowe

• kwantyl rzędu p

• współczynnik zmienności

• moment zwykły rzędu k

• współczynnik skośności (asymetrii)

• moment centralny rzędu k

• Wartość oczekiwana (wartość przeciętna, nadzieja matematyczna) EX (  ) wyraża przeciętną wartość zmiennej losowej X .

• Dla zmiennych losowych dyskretnych:

n

∞

EX =∑ x p (lub EX

x p , jeśli tylko E∣ X∣

i

i

=∑ i i

∞ ).

i=1

i=1

∞

• Dla zmiennych losowych ciągłych: EX =∫ xf  x dx , jeśli tylko E∣ X∣∞ .

−∞

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 10

• Podstawowe własności wartości oczekiwanej:

E  c= c

E  X − Y = EX − EY

E  aX = aEX

E  aX  bY = aEX  bEY

E  X  Y = EX  EY

E  XY = EX⋅ EY , gdy X i Y są niezależne gdzie a , b ,c∈ R

• Wariancja (dyspersja) Var X ( 2 X , D 2 X ) wyraża przeciętny kwadrat odchyleń od wartości oczekiwanej i wraża się wzorem:

Var X = E  X − EX 2= E  X 2− EX 2

• Dla zmiennych losowych dyskretnych:

n

n

Var X =∑  x

x 2 p

i− EX 2 pi=∑

i

i− EX 2

i=1

i=1

∞

∞

(lub Var X =∑  x

x 2 p

i− EX 2 pi=∑

i

i− EX 2 ).

i=1

i=1

• Dla zmiennych losowych ciągłych:

∞

∞

Var X =∫  x− EX 2 f  x dx=∫ x 2 f  x dx− EX 2 .

−∞

−∞

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 11

• Podstawowe własności wariancji:

Var  c=0

Var  X  Y = VarX  VarY , gdy X i Y są niezależne Var  aX = a 2 VarX

Var  X − Y = VarX  VarY , gdy X i Y są niezależne Var  X  c= VarX

Var  aX  bY = a 2 VarX  b 2 VarY , gdy X i Y są niezależne gdzie a , b , c∈ R

• Odchylenie standardowe  X ( DX , σ ) wyraża przeciętne odchylenie wartości od wartości oczekiwanej i wyraża się wzorem (jest to pierwiastek z wariancji):

 X = Var X .

• Współczynnik zmienności V mierzy podobnie jak odchylenie standardowe, zróżnicowanie wartości zmiennej losowej X i wyraża się wzorem:

V

 X

=

⋅100 %

EX

• Współczynnik skośności (asymetrii) A , tzw. standaryzowany moment trzeciego stopnia, mierzy skośność rozkładu i wyraża się wzorem:

E  X − EX 3

A=

 X 3

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 12

• Współczynnik asymetrii przyjmuje:

• wartość 0 dla rozkładów symetrycznych,

• wartości ujemne dla rozkładów o asymetrii lewostronnej (wydłużone lewe ramię rozkładu),

• wartości dodatnie dla rozkładów o asymetrii prawostronnej (wydłużone prawe ramię rozkładu).

• Współczynnik skupienia (kurtoza) K , jest jedną z miar spłaszczenia rozkładu badanej cechy i wyraża się wzorem:

E( X − EX )4

K =

−3

(σ X )4

• Rozkłady prawdopodobieństwa można podzielić ze względu na wartość K na:

• mezokurtyczne – wartość kurtozy wynosi 0, spłaszczenie rozkładu jest podobne do rozkładu normalnego (dla którego wartość kurtozy wynosi dokładnie 0),

• leptokurtyczne – kurtoza jest dodatnia, wartości cechy są bardziej skoncentrowane niż przy rozkładzie normalnym,

• platykurtyczne – kurtoza jest ujemna, wartości cechy są mniej skoncentrowane niż przy rozkładzie normalnym.

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 13

• Modą (wartością modalną, dominantą) Mo dla zmiennej losowej o rozkładzie dyskretnym nazywamy wartość (różną od wartości największej i najmniejszej) o największym prawdopodobieństwie.

• Natomiast dla zmiennej losowej ciągłej moda Mo jest wartością argumentu x, dla którego funkcja gęstości prawdopodobieństwa f  x przyjmuje wartość największą.

• Medianą (wartością środkową) zmiennej losowej X nazywamy każdą liczbę Me spełniającą następujące warunki:

1

1

P

1

 X  Me

i P  X  Me

(czyli P  X  Me  P  X  Me ).

2

2

2

• Oczywiście czasami może być cały przedział takich wartości (przedział

mediany).

• Dla zmiennej losowej ciągłej o dystrybuancie F, medianę wyznacza się z równania:

F

1

 x= 2

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 14

• Kwantylem rzędu p, 0 p1 , zmiennej losowej X nazywamy liczbę x p , spełniającą następujące warunki:

P  X  x p p i P  X  x p1− p (czyli P  X  x p p P  X  xp ).

• Dla zmiennej losowej ciągłej o dystrybuancie F, kwantyl rzędu p wyznacza się z równania: F  x= p .

= Me

• Oczywiście x 1

.

2

1

• Kwantyle rzędu ,

, 2 , 3

4 4 4 to kwartyle.

1 2 3 4

• Kwantyle rzędu

, , ,

to kwintyle.

5 5 5 5

1

2

9

• Kwantyle rzędu

,

,  ,

10 10

10 to decyle.

1

2

99

• Kwantyle rzędu

,

,  ,

100 100

100 to percentyyle.

dr Tomasz Walczyński – Statystyka (I rok Chemii, specjalności ChK, ChPiS, ACh) - Wykład 2. (26.02.2014 r.) 15

• Momentem zwykłym rzędu k zmiennej losowej X nazywamy liczbę (jeśli istnieje):

 k= E X k .

• Zauważmy, że 1= EX .

• Momentem centralnym rzędu r zmiennej losowej X nazywamy liczbę (jeśli istnieje):

 k= E  X − EX  k .

• Zauważmy, że  2= E  X − EX 2= Var X .

• Zadania (rozwiązania na tablicy)

• Dla zmiennej losowej dyskretnej otrzymanej w przykładzie 2.1. wyznaczyć i narysować jej dystrybuantę oraz obliczyć EX ,VarX , σ X , V , A , K , Mo , Me , x , x ,

1

3

P( X ≤2,5) , P( X >2).

4

4

• Dana jest zmienna losowa X o funkcji gęstości danej wzorem

f ( x)= cx dla x∈[0,2] oraz f ( x)=0 dla pozostałych x.

Wyznaczyć stałą c, a następnie dystrybuantę F(x) oraz obliczyć EX ,VarX , σ X ,V , A , K , Mo , Me , x , x ,

1

3

P( X ≤√2) , P ( X >1) , P (−1< X ≤1,5).

4

4