Ad1
Lp |
Typ gospodarstwa |
Zużycie wody |
(xi - ) |
(xi - )2 |
1 |
Gospodarstwo domowe284 |
210 |
-74 |
5476 |
2 |
Gospodarstwo domowe |
240 |
-44 |
1936 |
3 |
Gospodarstwo domowe |
320 |
36 |
1296 |
4 |
Gospodarstwo domowe |
374 |
90 |
8100 |
5 |
Gospodarstwo domowe |
288 |
4 |
16 |
6 |
Gospodarstwo domowe |
254 |
-30 |
900 |
7 |
Gospodarstwo domowe |
285 |
1 |
1 |
8 |
Gospodarstwo domowe |
304 |
20 |
400 |
9 |
Gospodarstwo domowe |
265 |
19 |
361 |
10 |
Gospodarstwo domowe |
300 |
16 |
256 |
Razem |
x |
2840 |
x |
18742 |
Zbiorowością statystyczną są gospodarstwa domowe 4 - osobowe zamieszkałe w bloku x w Poznaniu.
Jednostką statystyczną jest gospodarstwo domowe ......... .
Cechą zmienną - wielkość rocznego zużycia wody w gospodarstwie ............... .
Średnia arytmetyczna dla szeregu szczegółowego = = = 284 m3
Średnia wielkość rocznego zużycia wody w gospodarstwie domowym 4 - osobowym w bloku x w Poznaniu wynosi 284 m3.
Mediana dla szeregu szczegółowego : Me =
210, 240, 254, 265, 285, 288, 300, 304, 320, 374.
Me = = = 286,5 m3
Połowa gospodarstw domowych zużywa nie więcej jak 286,5 m3, wody, a druga połowa nie mniej jak 286,5 m3.
Wariancja dla szeregu szczegółowego :
S2 = = = 1874,2
Odchylenie standardowe :S = = = 43,29 m3
Zużycie wody w poszczególnych gospodarstwach domowych różni się od średniej arytmetycznej o 43,29 m3
Współczynnik zmienności : V(s) = 100 = 100 = 15 %
Względna miara dyspersji wskazuje na małe zróżnicowanie zużycia wody w gosp. domowych .......... bowiem odchylenie standardowe stanowi 15 % średniej arytmetycznej.
Ad2
Zbiorowością statystyczną są biura podróży.
Jednostką biuro podróży
Cechą zmienną cena skierowania w zł.
Obliczanie miar asymetrii.
Cena |
Liczba |
Środki |
Ilo |
Obliczenia pomocnicze |
|||
skierow. w zł. xio - xi1 |
biur podróży ni |
przedziałów xi |
Czyn xi ni |
(xi - ) |
(xi - )2 |
(xi - )2 ni |
(xi - )3 ni |
300 - 350 |
14 |
325 |
4550 |
106,7 |
11384,89 |
159388,46 |
-17006748,7 |
350 - 400 |
24 |
375 |
9000 |
56,7 |
3214,89 |
77157,36 |
-4374822,3 |
400 - 450 |
42 |
425 |
17850 |
6,7 |
44,89 |
1885,38 |
-12632 |
450 - 500 |
20 |
475 |
9500 |
43,3 |
1874,89 |
37497,8 |
1623654,7 |
500 - 550 |
12 |
525 |
6300 |
93,3 |
8704,89 |
104458,68 |
9745994,8 |
550 - 600 |
8 |
575 |
4600 |
143,3 |
20534,89 |
164279,12 |
23541197,9 |
Razem |
120 |
X |
51800 |
109,8 |
45759,34 |
544666,8 |
13516643 |
Średnia arytmetyczna : ( miara średniego poziomu )
Pozycja X = 0,5(n = 1 ) = 60
X = = = 431,7 zł
Średnia cena skierowania na 2-tyg wczasy krajowe wynosi 431,7 zł.
Odchylenie standardowe : ( miara zróżnicowana / dyspersji /
Pokazuje o ile średnio różnią się poszczególne jednost
ki od średniej arytmetycznej.
S == = 67,37
Cena poszczególnych skierowań różni się od średniej arytmetycznej ceny skierowań średnio o 67,37 zł.
Współczynnik zmienności : ( określa czy dyspersja jest duża czy mała )
V(s) = 100 = 100 = 15,6 %
Odchylenie standardowe ceny skierowania stanowi 15,6 % średniej ceny skierowania.
Zróżnicowanie / dyspersja / małe. / dolna granica min. 0 % /.
Moment trzeci centralny : ( miara pokazująca kierunek asymetrii )
/ liczba nie ma znaczenia lecz znak + lub - /
μ3 = = =112638,69
Moment trzeci centralny : ( miara pokazująca kierunek i siłę asymetrii )
-2 < α3 < 2
α3 = = = 0,37
Szereg asymetryczny o umiarkowanie dodatniej asymetrii.
D = x0 + c0
D = 400 + 50 = 422,5
Najczęściej spotykaną ceną skierowania jest 422,5 zł.
Obliczanie współczynnika asymetrii :
A( ) = = = 0,14
Otrzymany wynik potwierdza wniosek o umiarkowanej dodatniej asymetrii rozkładu ilości biur podróży .
Ad3
Powierzchnia w |
Odsetek |
Skumulowany |
Przedział |
ha xio - xi1 |
gospodarstw Wi |
odsetek |
Kwantyla |
1,00-1,.99 |
17,9 |
17,9 |
|
2,00-4,99 |
35,3 |
53,2 |
Q1Me |
5,00-6,99 |
14,8 |
68 |
|
7,00-9,99 |
14,8 |
82,8 |
Q3 |
10,00-14,99 |
11,2 |
94 |
|
15 i więcej |
6,0 |
100 |
|
Razem |
100 |
x |
|
Średnia arytmetyczna : ( miara średniego poziomu )
Pozycja Me = 0,5(n + 1 ) = 50,5
Me = 2 + ( - 17,9) = 4,8 ha
Połowa gospodarstw na powierzchnię nie większą jak 4,8 ha, a druga połowa gospodarstw ma powierzchnię nie mniejszą jak 4,8 ha.
Pozycja Q1 = = 25,3
Q1 = 2 + ( - 17,9 ) = 4,14 ha
Jedna czwarta gospodarstw ma powierzchnię nie większą jak 4,14 ha, a trzy czwarte nie mniejszą jak 4,14 ha.
Pozycja Q3 = = 75,75
Q3 = 7 + ( - 68 ) = 8,6 ha
Trzy czwarte gospodarstw na powierzchnię nie większą jak 8,6 ha, a jedna czwarta powierzchnię nie mniejszą jak 8,6 ha.
II Miary dyspersji.
Odchylenie ćwiartkowe :
Q = = = 4,46 ha
Współczynnik zmienności :
V(Q) = 100 = 92,9 %
Duże zróżnicowanie gospodarstw pod względem powierzchni.
Dotyczy środkowej części gospodarstw.
III Miara asymetrii.
-1 < A(Q) < 1
Współczynnik skośności zbudowany na podstawie kwartyli
A(Q) = = = 0,70
Silna asymetria dodatnia.
Miara ta dotyczy tylko środkowych 50 % miast .
Ad4
Q1 = 3,5 mln zł
Q3 = 7 mln zł
Me = 4,5 mln zł
Pozycyjne miary dyspersji :
Rozstęp kwartylowy : R(Q) = Q3 - Q1 = 3,5 mln zł
Różnica między skrajnymi wartościami pensji zaobserwowanymi u środkowych 50 % pensji wynosi 3,5 mln zł.
Odchylenie ćwiartkowe :Q = = 1,75 mln zł
Współczynnik zmienności : V(Q) = 100 = 38,9 %
Względna miara dyspersja rozkładu wskazuje na umiarkowane zróżnicowanie wysokości płac, bowiem odchylenie ćwiartkowe dotyczące środkowej połowy płac pracowników finansów i ubezpieczeń wynosi 1,75 mln co stanowi 38,9 % mediany.
Pozycyjne miary asymetrii.
Współczynnik skośności :A (Q) = = 0,42
-1 < A(Q) < 1
Umiarkowana asymetria dodatnia.
Miara ta dotyczy tylko środkowych 50 % miast .
Ad5
Mężczyźni |
x = 29,55 lat |
D = 26 lat |
V(s) = 39,3 % |
A(x) = 0,3 |
s = 11,7 |
Kobiety |
x = 22 lata |
D = 24 lat |
V(s) = 30 % |
A(x) = - 0,3 |
s = 6,6 lat |
Średnia wieku mężczyzn w chwili ożenku różni się o 7,55 od średniej wieku kobiet.
Najliczniejsza grupa kobiet związek małżeński zawarła w wieku 24 lat, a mężczyźni w wieku 2 o lata starszym.
Jednocześnie na podstawie otrzymanych wyników A(x) można powiedzieć o umiarkowanej dodatniej asymetrii rozkładu wieku w momencie zawierania związku małżeńskiego wśród mężczyzn, a o umiarkowanej ujemnej wśród kobiet.
Wiek kobiet w momencie zawierania związku małżeńskiego różni się od średniej arytmetycznej średnio o 6,6 lat, a mężczyzn o około 5 lat więcej.
Ad6
Przebieg |
Odsetek |
Skumuloo |
Środki |
Iloczyn |
Obliczenia pomocnicze |
|||
w tys km |
taksówek ni |
wany dsetek ncum |
Przedz iałów xi |
xini |
(xi - ) |
(xi - )2 |
(xi - )2 ni |
(xi - )3 ni |
0,8 - 1,2 |
2 |
2 |
1 |
2 |
|
0,88 |
1,77 |
-1,65 |
1,2 - 1,6 |
15 |
17 |
1,4 |
21 |
|
0,29 |
4,37 |
-2,35 |
1,6 - 2,0 |
41 |
58 |
1,8 |
73,8 |
|
0,02 |
0,80 |
-0,11 |
2,0 - 2,4 |
33 |
91 |
2,2 |
72,6 |
|
0,07 |
2,23 |
0,60 |
2,4 - 2,8 |
6 |
97 |
2,6 |
15,6 |
|
0,44 |
2,61 |
1,74 |
2,8 - 3,2 |
3 |
100 |
3 |
9 |
|
1,12 |
3,37 |
3,56 |
Razem |
|
x |
|
194 |
x |
2,82 |
15,15 |
1,79 |
Radio - Taxi |
x = 1,94 tys km |
s = 0,15 tys km |
α3 = 0,016 |
V(s) = 7,73 |
Halo - Taxi |
x = 2,056 tys km |
s = 0,406 tys km |
α3 = - 0,497 |
V(s) = 19,7 |
Sredni przebieg taksówek firmy Radio-Taxi różni się o 116 km od średniego przebiegu taksówek firmy Halo - Taxi. Przebieg taksówek firmy Radio - Taxi różni się od średniej arytmetycznej o 15 km,a drugiej o 40 km.
Otrzymany wynik V(s) mówi nam o małym zróżnicowaniu pod względem przebieg wśród taksówek obu firm.
Natomiast wynik α3 informuje nas iż rozkład taksówek pod względem przebiegu w firmie Radio - Taxi jest lekko asymetryczny o dodatniej wartości, natomiast w Halo - Taxi lekko asymetryczny o ujemnej wartości.
Związki między dwoma zjawiskami bądź cechami tej samej zbiorowości.
Graficzny obraz współzależności między wiekiem, a ilością awarii pojazdów samochodowych.
x=xi |
11 |
12 |
10 |
11 |
12 |
9 |
12 |
8 |
8 |
4 |
9 |
2 |
7 |
3 |
3 |
6 |
1 |
2 |
10 |
4 |
7 |
6 |
9 |
y=yi |
2 |
3 |
1 |
2 |
3 |
3 |
2 |
1 |
2 |
0 |
3 |
0 |
1 |
3 |
1 |
3 |
0 |
2 |
1 |
4 |
2 |
1 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x=xi |
8 |
10 |
9 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y=yi |
0 |
1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Źródło: Materiały dydaktyczne.
Układ punktów na wykresie informuje że mamy do czynienia ze związkiem liniowym o kierunku dodatnim tzn. wraz ze wzrostem wieku rośnie liczba awarii pojazdów samochodowych. Umiarkowany rozrzut punktów świadczy o umiarkowanej sile związku / współzależności / pomiędzy zmiennymi.
Temat : Analiza współzależności zjawisk I.
Obliczanie współczynnika korelacji liniowej Pearsona mierzącego siłę związku pomiędzy wiekiem (x) i liczbą awarii (y) samochodów dostawczych kompanii transportowej JW. „x” ( stan na dzień 31.12.93 r. )
Wiek w latach xi |
Liczba awarii yi |
xi yi |
xi2 |
yi2 |
11 |
2 |
22 |
121 |
4 |
12 |
3 |
36 |
144 |
9 |
10 |
1 |
10 |
100 |
1 |
11 |
2 |
22 |
121 |
4 |
12 |
3 |
36 |
144 |
9 |
9 |
3 |
27 |
81 |
9 |
12 |
2 |
24 |
144 |
4 |
8 |
1 |
8 |
64 |
1 |
8 |
2 |
16 |
64 |
4 |
4 |
0 |
0 |
16 |
0 |
9 |
3 |
27 |
81 |
9 |
2 |
0 |
0 |
4 |
0 |
7 |
1 |
7 |
49 |
1 |
3 |
3 |
9 |
9 |
9 |
3 |
1 |
3 |
9 |
1 |
6 |
3 |
18 |
36 |
9 |
1 |
0 |
0 |
1 |
0 |
2 |
2 |
4 |
4 |
4 |
10 |
1 |
10 |
100 |
1 |
4 |
4 |
16 |
16 |
16 |
7 |
2 |
14 |
49 |
4 |
6 |
1 |
6 |
36 |
1 |
9 |
1 |
9 |
81 |
1 |
8 |
0 |
0 |
64 |
0 |
10 |
1 |
10 |
100 |
1 |
9 |
2 |
18 |
81 |
4 |
193 |
44 |
352 |
1719 |
106 |
r = -1 związek funkcyjny ujemny
-1 < r < 0 związek korelacyjny ujemny
r = 1 związek funkcyjny dodatni
0 < r < 1 związek korelacyjny dodatni
Współczynnik można stosować do badania korelacji między dwoma zmiennymi gdy związek jest liniowy, badane zmienne są ilościowe, a dane są zapisane w postaci szeregów lub w postaci tablicy korelacyjnej.
Rxy = = = 660/ 2470,8 = 0,27
= 0,22
Współczynnik korelacji jest większy od zera, a zatem mamy do czynienia z korelacją dodatnią, co oznacza że wraz ze wzrostem wieku pojazdu rośnie liczba awarii. Wartość współczynnika równa 0,22 jedności świadczy o bardzo małej sile związku.
2. Badanie regresji.
Temat : Analiza współzależności zjawisk II
Obliczanie parametrów funkcji regresji opisującej wpływ wieku (x) na liczbę awarii (y) samochodów dostawczych kompanii transportowej jw. x ( stan na dzień 31.12.93 r.)
Wiek w latach xi |
Liczba awarii
yi |
xi yi |
xi2 |
|
2 |
(yi -y)2 |
11 |
2 |
22 |
121 |
2,12 |
0,02 |
0,1 |
12 |
3 |
36 |
144 |
2,24 |
0,58 |
1,72 |
10 |
1 |
10 |
100 |
2 |
1 |
0,48 |
11 |
2 |
22 |
121 |
2,12 |
0,02 |
0,1 |
12 |
3 |
36 |
144 |
2,24 |
0,58 |
1,72 |
9 |
3 |
27 |
81 |
1,88 |
1,25 |
1,72 |
12 |
2 |
24 |
144 |
2,24 |
0,06 |
0,1 |
8 |
1 |
8 |
64 |
1,76 |
0,58 |
0,48 |
8 |
2 |
16 |
64 |
1,76 |
0,06 |
0,1 |
4 |
0 |
0 |
16 |
1,28 |
1,64 |
2,86 |
9 |
3 |
27 |
81 |
1,88 |
1,25 |
1,72 |
2 |
0 |
0 |
4 |
1,04 |
1,08 |
2,86 |
7 |
1 |
7 |
49 |
1,64 |
0,41 |
0,48 |
3 |
3 |
9 |
9 |
1,16 |
3,39 |
1,72 |
3 |
1 |
3 |
9 |
1,16 |
0,03 |
0,48 |
6 |
3 |
18 |
36 |
1,52 |
2,19 |
1,72 |
1 |
0 |
0 |
1 |
0,92 |
0,85 |
2,86 |
2 |
2 |
4 |
4 |
1,04 |
0,92 |
0,1 |
10 |
1 |
10 |
100 |
2 |
1 |
0,48 |
4 |
4 |
16 |
16 |
1,28 |
7,4 |
5,34 |
7 |
2 |
14 |
49 |
1,64 |
0,13 |
0,1 |
6 |
1 |
6 |
36 |
1,52 |
0,27 |
0,48 |
9 |
1 |
9 |
81 |
1,88 |
0,77 |
0,48 |
8 |
0 |
8 |
64 |
1,76 |
3,1 |
2,86 |
10 |
1 |
10 |
100 |
2 |
1 |
0,48 |
9 |
2 |
18 |
81 |
1,88 |
0,01 |
0,1 |
193 |
44 |
360 |
1719 |
43,96 |
2959 |
31,64 |
b = = 0,12 a = = 0,8
funkcja regresji ŷ = a + bx
ŷ = 0,8 + 0,12x
Średnia liczba awarii zwiększy się o 0,12 jeżeli samochód będzie starszy o
rok.
Badanie dopasowania funkcji regresji do danych empirycznych
/ analiza wahań przypadkowych /
Różnica między wartościami zaobserwowanymi a wyznaczonymi
2 = 29,59
Miarą wahań przypadkowych jest wariancja resztowa
S2e = = = 1,23
Se =
Se = = 1,11 awarii
Zaobserwowana liczba awarii różni się od oszacowanej funkcją regresji /ŷ = 0,45 + 0,35x/ średnio o 0,85 awarii.
Ile awarii może mieć samochód 10 - letni ?
funkcja regresji ŷ = a + bx
ŷ = 0,8 + 0,12x
ŷ(x=10) = 0,8 + 0,12 · 10 = 2
Ve(x) = · 100 = · 100 =
ŷ(x=10) - Se < y(x=10) < ŷ(x=10) + Se
0 < y(x=10) < 3
Spodziewać się należy że pojazd 10 letni eksploatowany w tych warunkach może mieć od 0 do 3 awarii.
Współczynnik zbieżności
Miara wahań przypadkowych
0 < ϕ2 < 1
Im bliżej 0 tym funkcja lepiej dopasowana do danych empirycznych. Inter współczynnika zbieżności informuje jaka część zmienności zmiennej zależnej nie została wyjaśniona wpływem zmiennej niezależnej /x/ , lecz jest czynnikiem działania innych czynników.
ϕ2 = = = 0,94
94 % zmienności ilości awarii nie zależy od wieku pojazdu a od innych czynników.
Współczynnik determinacji
R2 = 1 - ϕ2 = r2
Informuje jaka część zmiennych zmiennej zależnej została wyjaśniona wpływem zmiennej niezależnej.
R2 = 1 - ϕ2 = r2 = 1 - 0,94 = 0,06
Około 6 % zmienności liczby awarii zależy od wieku pojazdu.
Pierwiastek ze współczynnika determinacji, zwany indeksem korelacji określa siłę współzależności między zmiennymi i w przypadku związku liniowego jest on równy współczynnikowi korelacji liniowej Pearsona .
R =
Współczynnik korelacji - R = 0,24
Współczynnik korelacji Pearsona r = 0,27
Współczynnik korelacji ma wartość zbliżoną do współczynnika Pearsona. Różnica wyniku jest następstwem przyjęcia zaokrąglonych wielkości parametrów regresji a i b.