background image

 

1

Egzamin ze statystyki, Studia Licencjackie Stacjonarne                                  wrzesień 2008 
 

ZESTAW I 

 

(imię, nazwisko, numer albumu) ......................................................................................................... 

 
Przy rozwiązywaniu zadań, jeżeli nie zostało zaznaczone inaczej, należy przyjąć poziom 
istotności 0,05. Wariancja z próby podawana jest w postaci nieobciążonego estymatora. 
 
 

Zadanie 1.  
Obiektem badania są rozkłady dochodów miesięcznych na głowę mieszkańców miasta Ź w latach 
2007 i 1999. Wylosowano dwie próby liczące po 1000 osób, a wyniki zostały przedstawione w 
poniższych tabelach: 
 
2007 r. 

dochód w 
zł/mies. 

600-800  800-1000  1000-1200 1200-1400 1400-1600 1600-1800 1800-2000 ponad 

2000 

udział 
osób 

0,1 0,15 0,25 0,12 0,07 0,06 0,05  0,2 

 

1999 r. 

dochód w 
zł/mies. 

400-500 500-600 600-700 700-800 800-900 900-1000 

1000-1100 

ponad 

1100 

liczba 
osób 

80 170  250  110  80  60  50  200 

 

1.1. Posługując się miarami pozycyjnymi należy porównać zróżnicowanie dochodów w obu latach. (
pkt.
)
 
Wskazówka: rozwiązanie tego zadania nie wymaga pracochłonnych obliczeń. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1.2. Średni dochód w 2007 r. obliczony na podstawie danych indywidualnych wyniósł 1412 zł. Czy 
gdyby znana była górna granica ostatniego przedziału dochodowego w tabeli, to średnia obliczona 
jedynie na podstawie tej tabeli również wynosiłaby 1412 zł? (odpowiedź proszę uzasadnić) (1pkt.) 
 
 
 
 
 
 
 

background image

 

2

1.3. Proszę ocenić kierunek i siłę asymetrii rozkładu z 1999 r. Można w tym celu posłużyć się miarami 
pozycyjnymi lub wykresem. (2 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Zadanie 2. 
Jan Lognormalny twierdzi, że w 2007 r. logarytm naturalny dochodów w mieście Ź miał rozkład 
normalny. Aby sprawdzić tę hipotezę podzielił próbę na 10 przedziałów i obliczył wartość statystyki 
testowej χ

2

 = 16,5 (parametry rozkładu oszacował na podstawie próby). 

 
2.1. Czy wynik testu pozwala przyznać rację Janowi L., jeżeli przyjąć poziom istotności 0,05? (2 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
2.2. Proszę podać poziom istotności, przy którym nie można zaprzeczyć tezie o normalności rozkładu? 
(2 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

background image

 

3

Zadanie 3 
Przedstawiciel Ligi Mężczyzn Polskich twierdzi, że w mieście Ź. przeciętne dochody mężczyzn w 
2007 r. były wyższe od przeciętnych dochodów kobiet. W celu sprawdzenia tego przypuszczenia 
wykorzystał przedstawioną W Zadaniu 1 próbę losową. Średnie wartości dochodu dla kobiet i 
mężczyzn wyniosły, odpowiednio, 1370 i 1440 zł przy odchyleniach standardowych 880 zł i 990 zł. W 
próbie znalazło się 400 kobiet i 600 mężczyzn. 
 
Czy powyższy wynik można uznać za sprzeczny z opinią Ligi? (4 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Zadanie 4 
W próbie z 2007 r. opisanej w Zadaniu 1 odsetek osób z dochodami poniżej 900 zł wyniósł 20%. 
 
Należy wyznaczyć przedział, w którym najprawdopodobniej znajdzie się odsetek osób z dochodami 
poniżej 900 charakteryzujący populację generalną. Metoda powinna zapewniać, iż ów odsetek zmieści 
się w przedziale z prawdopodobieństwem 0,95. (3 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

background image

 

4

Zadanie 5 
Wśród kobiet i mężczyzn wylosowanych do próby zostały obliczone odsetki osób otrzymujących 
świadczenia społeczne. Poniższa tabela przedstawia procentowe rozkłady liczby osób otrzymujących 
świadczenia dla obu grup. 
 

Otrzymują 

świadczenia 

Nie otrzymują 

świadczeń 

mężczyźni 

18% 82% 

kobiety  

22% 78% 

 
Łącznie zbadano 400 kobiet i 600 mężczyzn 
 
5.1. Proszę ocenić czy w badanej próbie istnieje zależność między płcią i otrzymywaniem świadczeń 
społecznych. Na pytanie można odpowiedzieć bez wykonywania żadnych obliczeń. (2 pkt.) 
 
 
 
 
 
 
 
 
5.2. Czy na podstawie tej próby można też stwierdzić istnienie zależności w populacji generalnej? (
pkt.
)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Zadanie 6 
Dla próby z roku 2007 oszacowano model liniowy, w którym zmienną objaśnianą był dochód osoby 
(Y), zaś objaśniającą liczba ukończonych lat edukacji (X). Wyniki oszacowania parametrów 
strukturalnych modelu były następujące: 
 

i

i

i

e

x

y

+

+

=

99

,

892

29

,

55

 

 
Ponadto znane są odchylenia standardowe:   S(X)=2,26   S(Y)=325,8   S(e)=301,01 
 
6.1. Czy zależność liniowa między dochodem i wykształceniem jest statystycznie istotna? (3 pkt.) 
 
 

background image

 

5

 
 
 
 
 
 
 
 
 
 
 
6.2. Proszę ocenić dopasowanie powyższego modelu do danych. (3 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
Zadanie 7 
W badanych próbach średnie wydatki na konsumpcję w 1999 r. w cenach bieżących wynosiły 760 zł, 
w 2007 r. 1390 zł. Ponadto, znana była struktura konsumpcji badanej próby w 1999 r. oraz zmiany cen 
czterech grup towarów w latach 2007/1999: 
 

Grupa 
towarów 

Indeks 

cen 

2007/1999 

Udział 

wydatków 

Żywność 1,55  35% 
Mieszkanie 1,64 

20% 

Ubranie 1,50 8% 
Pozostałe 1,52  37% 

 
 
7.1. O ile procent zmienił się wolumen (fizyczne rozmiary) konsumpcji w badanym okresie? (3 pkt.) 
Wskazówka: grupy towarów można potraktować jak pojedyncze towary. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

background image

 

6

7.2. Ile wynosiła średnia roczna zmiana nominalnych wydatków konsumpcyjnych (w cenach 
bieżących) w tym okresie? (1 pkt.) 
 
 
 
 
 
 
 
 
 
 
 

CZĘŚĆ TESTOWA (9 punktów

 
Przy wszystkich pytaniach należy otoczyć kółkiem prawidłową odpowiedź T-tak lub N-nie. 
 
Punktacja

: odpowiedź poprawna 1 pkt; brak odpowiedzi 0 pkt; odpowiedź błędna -1 pkt. 

Jeżeli całkowita suma punktów z tej części będzie ujemna, jako wynik zostanie przyjęte 0 
pkt. 
 
1. Jeżeli wariancja zmiennej o rozkładzie normalnym w próbie nr 1 jest wyższa niż wariancja w 
próbie nr 2 zaś średnie i  liczebności prób są jednakowe, to: 
a/ przedział ufności wyznaczony za pomocą próby nr 1 będzie dłuższy,                                          T   N 
 
b/ możliwa jest sytuacja, że identyczną hipotezę o wartości  średniej w populacji generalnej przy 
identycznym poziomie istotności odrzuci się dla próby nr 2, nie odrzuci zaś dla próby nr 1,           T   N 
 
c/ oznacza to, że próby zostały wylosowane z różnych populacji generalnych.                                T   N 
 
2. Oszacowanie parametrów modelu regresji liniowej: 
a/ pozwala wyznaczyć oszacowanie warunkowej wartości oczekiwanej zmiennej objaśnianej (Y) dla 
dowolnej danej wartości zmiennej objaśniającej (X),                                                                        T   N 
 
b/ wymaga danych jedynie w postaci wartości zmiennej objaśniającej i objaśnianej,                      T   N 
 
c/ powinno być wykorzystywane do prognozowania wartości Y na podstawie X, jedynie wtedy gdy 
statystyka t (Studenta) dla zmiennej X przekroczy wartość krytyczną.                                             T   N 
 
3. Linie lotnicze sprzedają codziennie 2000 biletów na samoloty mające w sumie 1960 miejsc a 
prawdopodobieństwo rezygnacji z lotu przez pasażera z wykupionym biletem wynosi 0,02. Czy 
jest prawdą, że: 
a/ Nigdy nie zdarza się aby do odlotu zgłosiło się więcej pasażerów niż wynosi liczba miejsc w 
samolocie,                                                                                                                                           T   N 
 
b/ Do obliczenia przybliżonego prawdopodobieństwa, że w losowo wybranym dniu zgłosi się mniej 
pasażerów niż 1950 można wykorzystać twierdzenie graniczne,                                                      T   N 
 
c/ Prawdopodobieństwo,  że liczba zgłaszających się do odlotu pasażerów będzie niższa od 1950 
wynosi w przybliżeniu tyle samo ile prawdopodobieństwo, że liczba pasażerów przekroczy 1970. 
                                                                                                                                                            T   N 

background image

 

7

Egzamin ze statystyki, Studia Licencjackie Stacjonarne                                  wrzesień 2008 
 

ZESTAW II 

 

(imię, nazwisko, numer albumu) ......................................................................................................... 

 
Przy rozwiązywaniu zadań, jeżeli nie zostało zaznaczone inaczej, należy przyjąć poziom 
istotności 0,05. Wariancja z próby podawana jest w postaci nieobciążonego estymatora. 
 
 

Zadanie 1.  
W poniższych tabelach zostały przedstawione rozkłady dochodów miesięcznych na głowę w mieście 
Ó. Pierwsza tabela przedstawia dochody w gospodarstwach o dochodach mniejszych niż 800 zł 
miesięcznie, w drugiej w pozostałych. Obydwie próby liczyły po 1000 osób. 

 

dochód w 
zł/mies. 

100-200 200-300 300-400 400-500 500-600 600-700 700-800 

liczba 
osób 

50  60  140 250 250 170  80 

 
 

dochód w 
zł/mies. 

800-

1000 

1000-

1200 

1200-

1400 

1400-

1600 

1600-

1800 

1800-

2000 

ponad 

2000 

udział 
osób 

0,25 0,14  0,11  0,15  0,1  0,1  0,15 

 
1.1. Wśród osób z dochodami co najmniej 800 zł miesięcznie średni dochód obliczony na podstawie 
danych indywidualnych wyniósł 1365 zł. Czy gdyby znana była górna granica ostatniego przedziału 
dochodowego w tabeli, to średnia obliczona jedynie na podstawie tej tabeli również wynosiłaby 1365 
zł? (odpowiedź proszę uzasadnić) (1 pkt.) 
 
 
 
 
 
 
1.2. Proszę zilustrować graficznie pierwszy z rozkładów i na podstawie rysunku ocenić, która z 
poniższych wartości klasycznego współczynnika asymetrii może być dla niego prawdziwa: 
 

-3,4        -0,34         0,34         3,4                                                                        (2 pkt.) 

 

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

background image

 

8

1.3. Posługując się miarami pozycyjnymi należy ocenić, w której grupie zróżnicowanie dochodów 
było większe. (2 pkt.) 
Wskazówka: rozwiązanie tego zadania nie wymaga pracochłonnych obliczeń. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Zadanie 2. 
Odchylenie standardowe dochodów w próbie opisanej w punkcie 1.1. wynosi 440 zł. 
 
Należy wyznaczyć przedział, w którym najprawdopodobniej znajdzie się średnia w populacji 
generalnej. Metoda powinna zapewniać, iż ów odsetek zmieści się w przedziale z 
prawdopodobieństwem 0,95. (3 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
 
 
Zadanie 3. 
Rzecznik Praw Mężczyzn twierdzi, że w mieście Ó odsetek osób z dochodami poniżej 800 zł jest 
wyższy wśród mężczyzn niż wśród kobiet. W celu weryfikacji tego przypuszczenia wylosowano 800 
kobiet i 800 mężczyzn, wśród których stwierdzono wartości tych odsetków równe, odpowiednio: 0,26 
i 0,3. 
 
Czy wyniki te potwierdzają przypuszczenie Rzecznika? (4 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
 
 

background image

 

9

 
 
 
 
 
 
Zadanie 4 
Stowarzyszenie Na Rzecz Normalności postanowiło sprawdzić, czy logarytm naturalny dochodów w 
mieście Ó miał rozkład normalny. Aby sprawdzić tę hipotezę ekspert Stowarzyszenia podzielił badaną 
próbę na 8 przedziałów i obliczył wartość statystyki testowej χ

2

 = 11,2 (parametry rozkładu oszacował 

na podstawie próby). 
 
4.1. Czy wynik testu zaprzecza tezie o normalności rozkładu, jeżeli przyjąć poziom istotności 0,1? (
pkt
.)
 
 
 
 
 
 
 
 
 
4.2. Proszę podać poziom istotności, przy którym nie można zaprzeczyć tezie o normalności rozkładu? 
(2 pkt.) 
 
 
 
 
 
 
 
 
Zadanie 5 
Wylosowano 1000 osób posiadających dzieci w celu zbadania zależności między wykształceniem 
głowy gospodarstwa domowego i liczbą dzieci. W próbie znalazło się 700 osób z wykształceniem 
średnim i 300 z wykształceniem wyższym. Poniższe tabele przedstawiają procentowe rozkłady liczby 
dzieci dla obu grup. 
 
 

Wykształcenie średnie  

Wykształcenie wyższe 

Liczba dzieci 

 

Liczba dzieci 

1 lub 2 

3 lub więcej 

 

1 lub 2 

3 lub więcej 

70% 30% 

 

75% 25% 

 
 
5.1. Proszę ocenić czy w badanej próbie istnieje zależność między wykształceniem i liczbą dzieci. Na 
pytanie można odpowiedzieć bez wykonywania żadnych obliczeń. (2 pkt.) 
 
 
 
 
 
 
 
 
 

background image

 

10

 
 
5.2. Czy na podstawie tej próby można też stwierdzić istnienie zależności w populacji generalnej? (
pkt.
)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Zadanie 6 
Posługując się próbą liczącą 1000 elementów oszacowano model liniowy, w którym zmienną 
objaśnianą był dochód na głowę (DOCH), zaś objaśniającą liczba dzieci w gospodarstwie (LD). 
Wyniki oszacowania parametrów strukturalnych modelu były następujące: 
 

i

i

i

e

LD

DOCH

+

+

=

1225

180

 

 
Ponadto znane są odchylenia standardowe:  S(DOCH)=615     S(LD)=1,04      S(e)=586 
 
6.1. Proszę ocenić dopasowanie powyższego modelu do danych. (3 pkt.) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6.2. Czy zależność liniowa między zmienna objaśnianą i objaśniającą jest statystycznie istotna? (
pkt
.)
 
 
 
 
 

background image

 

11

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Zadanie 7 
W roku 2007 r. wśród wszystkich zbadanych gospodarstw wydatki konsumpcyjne w cenach bieżących 
wynosiły 1375 zł, zaś w 2003 r.  1010 zł (również w cenach bieżących). Ponadto, znana była struktura 
konsumpcji badanej próby w 2003 r. oraz indeksy ilości dla czterech grup towarów w latach 
2007/2003: 
 

 Mieszkanie 

energia 

Żywność i 

używki 

Transport i 

łączność 

 

Pozostałe 

Indeks ilości 

2007/2003 

1,02 1,08 1,3 1,4 

Udział 

wydatków 

0,25 0,4 0,1 0,25 

 
 
7.1. Ile wynosiła średnia roczna zmiana nominalnych wydatków konsumpcyjnych (w cenach 
bieżących) w okresie 2003 - 2007? (1 pkt.) 
 
 
 
 
 
 
 
 
7.2. O ile procent wzrosły w tym okresie ceny konsumpcji? (3 pkt.) 
Wskazówka: grupy towarów można potraktować jak pojedyncze towary. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

background image

 

12

 
 
 

 
 
 
 
 

CZĘŚĆ TESTOWA (9 punktów

 
Przy wszystkich pytaniach należy otoczyć kółkiem prawidłową odpowiedź T-tak lub N-nie. 
 
Punktacja

: odpowiedź poprawna 1 pkt; brak odpowiedzi 0 pkt; odpowiedź błędna -1 pkt. 

Jeżeli całkowita suma punktów z tej części będzie ujemna, jako wynik zostanie przyjęte 0 
pkt. 

 
1. Oszacowany został model regresji liniowej 

β

α

+

=

X

Yˆ

a/ Jeżeli oszacowanie parametru α jest statystycznie istotne, to współczynnik korelacji 
(zależności) liniowej między X i Y w tej samej próbie jest statystycznie różny od zera,     

T   N

 

 
b/  Jeżeli dopasowanie modelu do danych jest słabe, to współczynnik korelacji liniowej 
r(X,Y) jest niski,                                                                                                                    

T   N

 

 
c/ Jeżeli oszacowanie parametru α jest większe od błędu standardowego tego oszacowania, to 
zmienna X wywiera istotny wpływ na zmienną Y.                                                               

T   N

 

 
2. Linie lotnicze dysponują dziennie samolotami mającymi w sumie 1455 miejsc. 
Prawdopodobieństwo zgłoszenia się do odlotu pasażera z wykupionym biletem wynosi 
0,97 a linie sprzedają codziennie 1500 biletów. Czy jest prawdą, że:

 

a/ Prawdopodobieństwo,  że liczba zgłaszających się do odlotu pasażerów przekroczy 1460 
osób wynosi w przybliżeniu tyle samo ile prawdopodobieństwo, że liczba pasażerów będzie 
niższa od 1450.                                                                                                                      

T   N

 

 
b/ Nigdy nie zdarza się aby do odlotu zgłosiło się więcej pasażerów niż wynosi liczba miejsc 
w samolocie?                                                                                                                         

T   N

 

 
c/ Do obliczenia przybliżonego prawdopodobieństwa, że w losowo wybranym dniu zgłosi się 
więcej pasażerów niż 1460 można posłużyć się granicznym rozkładem normalnym.         

T   N

 

 
3. Wariancja estymatora parametru Θ:

 

a/ jest miernikiem jego precyzji,                                                                                           

T   N

 

 
b/ nie może być oszacowana na podstawie próby,                                                                

T   N

 

 
c/ powinna być znana aby można było wykonać test dla wartości parametru Θ w populacji 
generalnej.                                                                                                                             

T   N