background image

Wrocław,  6 maja 2010  

 

Lista zadań i poleceń nr 1 

Statystyka Matematyczna 

II rok  Technologii Żywności i Żywienia (semestr IV, studia stacjonarne 1-go stopnia) 

 

Zadania dotyczące statystyki opisowej 

 

I.  W celu określenia stopnia przepustowości  WZG (Woj. Zakłady Gastronomiczne), wylosowano w 
pewnym miesiącu letnim 1980 r. na obszarze Woj. Dolnośląskiego 30 zakładów gastronomicznych, 
otrzymując m. in. dane o liczbie miejsc konsumpcyjnych: 

 

 

lp. 

1 2 3  4  5  6 7 8 9 10

11 

12

13 

14 

15 

miejsce_kons  70 67  81  83  57  62  78

67

52 52

65 72

74  64 56 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lp. 

16 17  18  19  20  21  22

23

24 25

26 27

28  29 30 

miejsce_kons  75 74  96  68  70  68  91

77

85 63

71 80

54  99 61 

 
 
 
 

 

Dla tych danych dokonaj analizy statystycznej poprzez elementy statystyki opisowej: 
a) dokonaj graficznej prezentacji materiału empirycznego poprzez: 
   1.histogram częstości  
      - wg algorytmu podanego na wykładzie i w materiałach dydaktycznych 

       - przyjmując przedział zmienności [50 ; 100] i jednakową rozpiętość przedziałów  
            klasowych równą 10. 
2. wykres pudełkowy w oparciu o statystyki pozycyjne(rangowe) 

 
b) zbierz wyniki i podaj ich interpretację 

c) Sformułuj wnioski i zaproponuj hipotezy robocze będące   
   przedmiotem dalszego wnioskowania statystycznego 

 

II. 

OPIS EKSPERYMENTU

Dwie grupy studentów oceniało masę dwóch różnych buł agatowych nie posługując się  żadnymi 
przyrządami(minerały pochodziły ze złóż melafirów Dolnego Śląska). Pierwsza grupa szacowała agat 
małej wielkości(zmienna  exp1_190), a druga grupa miała do dyspozycji agat znacznie większy 
(zmienna  exp2_950). Rzeczywiste masy agatów (mały - 190g, duży - 950g) zostały podane do 
wiadomości uczestników eksperymentu na końcu. Celem analizy statystycznej jest wykazanie czy 
wielkość badanego obiektu wpływa na wielkość popełnionych błędów (zmienne: exp1_bwzgl (wg 
wzoru (exp1_190 - 190)/190 ),  exp2_bwzgl ( wg wzoru (exp2_950 - 950)/950 )).  
Dane eksperymentalne są zaprezentowane na stronie następnej poniżej: 
Dla tych danych (zmienne 5 i 6) dokonaj analizy porównawczej poprzez elementy statystyki opisowej: 
•  dokonaj graficznej prezentacji materiału empirycznego, tj.: 

  - histogramy częstości wraz z łamanymi częstości w jednym układzie współrzędnych i dla  tej   
    samej liczby klas (k=5)  i wspólnego obszaru zmienności 

        - wykresy pudełkowe zbudowane w oparciu o statystyki   momentowe w jednym układzie  
           współrzędnych  
        - wykresy pudełkowe zbudowane w oparciu o statystyki  rangowe w jednym układzie   
           współrzędnych 
•  wyznacz podstawowe charakterystyki liczbowe z podziałem jakościowym na trzy grup miar 

•  zbierz wyniki i podaj ich interpretację. 
   

background image

    Dane eksperymentalne 

 

1

exp1_190

2

exp2_950

3

exp1_190bbez

4

exp2_950bbez

5

exp1_bwzgl

6

exp2_bwzgl

7

lp

1
2
3
4
5
6
7
8
9

10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

20

410

-170

-540

-0,8947

-0,5684

1

25

420

-165

-530

-0,8684

-0,5579

2

35

610

-155

-340

-0,8158

-0,3579

3

45

620

-145

-330

-0,7632

-0,3474

4

50

640

-140

-310

-0,7368

-0,3263

5

65

670

-125

-280

-0,6579

-0,2947

6

65

750

-125

-200

-0,6579

-0,2105

7

65

850

-125

-100

-0,6579

-0,1053

8

65

850

-125

-100

-0,6579

-0,1053

9

65

870

-125

-80

-0,6579

-0,0842

10

75

880

-115

-70

-0,6053

-0,0737

11

95

910

-95

-40

-0,5000

-0,0421

12

115

930

-75

-20

-0,3947

-0,0211

13

120

940

-70

-10

-0,3684

-0,0105

14

120

950

-70

0

-0,3684

0,0000

15

130

980

-60

30

-0,3158

0,0316

16

130

980

-60

30

-0,3158

0,0316

17

135

1050

-55

100

-0,2895

0,1053

18

155

1060

-35

110

-0,1842

0,1158

19

155

1120

-35

170

-0,1842

0,1789

20

185

1130

-5

180

-0,0263

0,1895

21

185

1200

-5

250

-0,0263

0,2632

22

195

1250

5

300

0,0263

0,3158

23

210

1250

20

300

0,1053

0,3158

24

1260

310

0,3263

25

1400

450

0,4737

26

1450

500

0,5263

27

1500

550

0,5789

28

1720

770

0,8105

29

 

 
 
 

Dla której zmiennej empiryczny rozkład prawdopodobieństwa  wykazuje 

największe podobieństwo do rozkładu normalnego(wsp. asymetrii A

P

=0,  

kurtoza K=3)? (odpowiedź uzasadnij) 
 

Sformułuj wnioski i zaproponuj hipotezy robocze będące przedmiotem 
dalszego wnioskowania statystycznego 

 
 

TEST 1a.

  Jeżeli funkcja gęstości rozkładu prawdopodobieństwa zmiennej losowej X wyraża się 

wzorem: 

2

)

2

(

2

2

1

)

(

+

=

x

e

x

f

π

  , to wartość oczekiwana E(X) i wariancja Var(X) są równe wg podanego 

wariantu: 

wariant 

a b c d e  f 

E(X) 

0  1 -2 -2 1 -2 

Var(X) 

1 0.5 1 0.5 1 

π

 

 

background image

ZADANIE 1a.

 

 W oparciu o następujące dane eksperymentalne dotyczące cechy typu ciągłego 

 

 

0.5, 1, 3,  2.5,  2,  7,  7.5,  6,  8,  4.5,  5.5,  4.5,  5,  7,  7.5, 7

 

1. Sporządź histogram częstości wraz z łamaną i zaznacz wartość modalną, średnią i medianę.  
2. Na tle histogramu sporządź wykres pudełkowy, opisz go i podaj frakcję obserwacji która wpada do   
    przedziału typowych wartości: [Me-0.5Q ; Me+0.5Q], gdzie Me oznacz medianę  a Q rozstęp  
    kwartylowy. 
3. Oceń typ asymetrii danej próby. 
 
Pytania ogólne.: 

1.  Co to jest populacja generalna (jej zasadnicze atrybuty)? 

2.  Co to jest próba statystyczna i jakie powinna spełniać 

podstawowe postulaty? 

3.  Jakie wyróżniamy typy cech? (określić charakter, skalę  

zmienności, jednostki pomiarowe), Podać przykłady 

4.  Co to są tzw. Outliery , jak je rozpoznawać? 

5.  Co to są typowe przedziały zmienności? 
6.  Podać analogon współczynnika zmienności Pearsona(momentowy), 

który wykorzystuje w próbie znaczenie mediany. Zinterpretować 
ich sens. 

7.  Za pomocą jakich statystyk możemy określić podobieństwo rozkładu 

empirycznego (z próby)  z rozkładem normalnym? 

 
 Patrz np. pozycja:  
     Rachunek  prawdopodobieństwa i statystyka matematyczna w zadaniach.                        
     Część II. Statystyka matematyczna, Krysicki W.,  Bartos  J., Dyczka W., Królikowska K.,   
     Wasilewski M., PWN, Warszawa, 1993, Wyd.III.  strony 1-31 
 
 
Zadania dotyczące klasycznego rachunku prawdopodobieństwa 
 
1. Opanować podstawowe elementy kombinatoryki: 
      a) permutacje bez powtórzeń i z powtórzeniami 
      b) wariacje  bez powtórzeń i z powtórzeniami 
      c) kombinacje bez powtórzeń i z powtórzeniami 

Zwrócić uwagę na rodzaj obiektów z matematycznego punktu widzenia (tj. podciągi, podzbiory) 

i zastosowanie elementarnej kombinatoryki do konstrukcji przestrzeni  zdarzeń elementarnych ω 
oraz obliczania mocy zbioru Ω.  

Patrz np. pozycja:  

    

 Rachunek  prawdopodobieństwa i statystyka matematyczna w zadaniach.                        

     Część I. Rachunek  prawdopodobieństwa, Krysicki W.,  Bartos  J., Dyczka W., Królikowska K.,   
     Wasilewski M., PWN, Warszawa, 1993, Wyd.III.  strony 32-34. 

 
2. Zadania polecane do rozwiązania z powyższej pozycji: 
    Zad. 1.38. (Rozważamy doświadczenie D, polegające  na obserwacji liczby i  łącznej masy   
                       pojazdów, znajdujących się w określonej chwili na moście……..) 
    Zad. 1.40;  Zad. 1.43; 1.45; 1.47; 1.58; 1.63, 1.71 

 

3.  Niech prawdopodobieństwo tego, że statystyczny student nie jest przygotowany do ćwiczeń,  
wynosi  1/3. prowadzący ćwiczenia wybiera 5 osób. Oznaczmy przez liczbę osób, spośród 
wybranych, które nie są przygotowane do ćwiczeń (osobę nieprzygotowaną możemy zakodować jako 
1 (umownie sukces), a w przeciwnym wypadku jako 0 ). 
 a) Określ rozkład prawdopodobieństwa zmiennej losowej X 

background image

 b) Wyznacz najbardziej prawdopodobną liczbę sukcesów, jeżeli losowo wybrana grupa z większej  
       podpopulacji liczy n=27 osób, następnie n=35 osób. Podaj rozwiązanie dla dowolnej wartości n
 
4. Prom kursuje pomiędzy przystaniami A i B, znajdującymi się na dwu przeciwległych brzegach 
rzeki i odległymi od siebie o k metrów. Wiadomo, że prawdopodobieństwo P(A) znajdowania się 
promu na przystani A wynosi 0.1, a na przystani B,  P(B) = 0.2. Ponadto prom jeździ ze stałą 
szybkością, nie zatrzymuje się na rzece (poza przystaniami) i prawdopodobieństwo, tego że znajduje 
się na rzece wynosi 0.7. Niech X oznacza odległość promu od przystani A. 
   a) znaleźć dystrybuantę F

X

 zmiennej losowej X 

   b) obliczyć wartość oczekiwaną E(X), wariancję Var(X), medianę Me(X) oraz odległość  
        międzykwartylową  d

Q

=(Q

3

-Q

1

)/2. 

 
5. W pęku n podobnych kluczy jest tylko jeden klucz otwierający zamek. Niech p

k

 oznacza 

prawdopodobieństwo zdarzenia losowego A

k

, polegającego na tym, że otworzyliśmy  zamek za  

k-tym razem. Udowodnić, że P(A

k

)=1/n, zatem nie zależy od  k.  

 

6. Zbadać przebieg zmienności funkcji gęstości  f(x)  rozkładu normalnego N(μ, 

σ)  postaci 

   

       

2

(

)

1

2

2

( )

2

x

f x

e

μ

σ

π σ

=

     i  podaj interpretację analityczną i probabilistyczną  parametrów  

 

 μ  i  

σ

2

  oraz przedziałów zmienności: (μ - 

σ  ; μ + σ) ,  (μ - 2σ  ; μ + 2σ),  (μ - 3σ  ; μ + 3σ). 

7. Wytrzymałość lin stalowych pochodzących z masowej produkcji jest zmienna losową X o 
rozkładzie normalnym  N(μ, 

σ) = N(100MPa ,  5MPa). Obliczyć: 

 

a) ile przeciętnie  lin spośród 1000 ma wytrzymałość mniejszą niż 90 MPa? 
b) co która przeciętnie lina ma wytrzymałość mniejszą niż 90 MPa? 
c) ile przeciętnie lin spośród 1000 ma wytrzymałość określoną przez przedział [Q

, Q

3

]; wyznacz go.  

 

8. Na płaszczyźnie poprowadzono proste równoległe, w równej odległości 2a. Na płaszczyznę tę 
rzucamy w sposób przypadkowy okrągłą monetę o promieniu r < a. Znaleźć prawdopodobieństwo 
tego, że moneta nie spadnie na żadna prostą. 
 
9. Dla jakiej wartości A następujące funkcje są gęstościami pewnych zmiennych losowych: 
 

         a)  

2

( )

x

x

A

e

e

f x

+

=

                b)  

4

| | 1

0

| |

( )

A

dla x

x

dla x

f x

1

<

=

     

 
10.  Czas T bezawaryjnej  pracy pewnego urządzenia ma rozkład wykładniczy z parametrem λ=5
Obliczyć: 
               a) wartość przeciętną i wariancję bezawaryjnego czasu pracy urządzenia 
               b) medianę i odległość międzykwartylową 
               c) prawdopodobieństwo, że czas  bezawaryjnej pracy urządzenia wyniesie co najmniej 5  
                   jednostek czasowych zmiennej losowej T. 
 
 
 

 

Opracował dr Andrzej Michalski