background image

Jadłospis na dzisiaj:

Jadłospis na dzisiaj:

Dania z zeszłego tygodnia: powtórka 
Przystawka: Miary kształtu rozkładu
Danie główne : Sztuczki i kruczki SPSS

Standaryzacja 

Graficzne prezentacje danych:

Dzielenie na podzbiory

Filtrowanie  obserwacji

background image

Dania z zeszłego tygodnia: powtórka

Jakie znasz grupy statystyk?
MTC to?
O czym informuje nas odchylenie standardowe?
Wariancja to...?
Mediana to ...?
Co to jest dolny kwartyl?

background image

 

Charakterystyki rozkładów cd:

Miary kształtu rozkładu

background image

STATYSTYKI – kształt rozkładu

SKOŚNOŚĆ

odnosi  się  do  symetryczności  rozkładu,  wyznacza  ją 

proporcja  odchyleń  od  średniej  powyżej  średniej  do 

proporcji  odchyleń  poniżej  średniej  (podniesione  do 

trzeciej  potęgi).  Można  powiedzieć  też,  że  rozkład, 

który jest skośny, jest niesymetryczny.  Oznacza, to, że 

np.  pewne  wartości  po  jednej  ze  stron  średniej  są 

bardziej skrajne (osiągają bardziej ekstremalne wartości 

– dla określonej zmiennej). 

background image

STATYSTYKI – kształt rozkładu

SKOŚNOŚĆ

dodatnia:dużo niskich wartości, mało wysokich 

(powyżej średniej)  – wartości ekstremalne znajdują 

się powyżej średniej

g1 > 0 – np. rozkład ocen z klasówki o wysokiej 

trudności – dużo osób nie zalicza, mało dostaje 

najwyższe oceny. 

background image

STATYSTYKI – kształt rozkładu

SKOŚNOŚĆ

 

ujemna: dużo wysokich wartości, mało niskich 

(poniżej średniej) – wartości ekstremalne znajdują 

się poniżej średniej 

g1 < 0  – np. rozkład optymizmu w społeczeństwie – 

bardzo mało jest osób, które są skrajnie 

pesymistyczne, natomiast większość ludzi jest 

pozytywnie nastawiona do otaczającego świata. 

background image

STATYSTYKI – kształt rozkładu

KURTOZA -  szpiczastość rozkładu zmiennej

dodatniag2 > 0 – rozkład szpiczasty, leptokurtyczny 

– w takim rozkładzie istnieje jedna, lub kilka grup 

ustawionych koło siebie, które wybijają się powyżej 

innych. 

Np. kiedy w ciągu określonego miesiąca mieliśmy 

przewagę dni o określonej temperaturze, 

niekoniecznie wysokiej, albo niskiej (czyli mieliśmy 

do czynienia z rozkładem symetrycznym).

background image

STATYSTYKI – kształt rozkładu

KURTOZA -  szpiczastość rozkładu zmiennej

Ujemna– g2 < 0 – rozkład płaski, platykurtyczny – w 

takim rozkładzie nie ma jakichś silnie wybijających 
się wartości. 

Przykładem może być miesiąc o bardzo umiarkowanej 

temperaturze, gdzie była podobna ilość dni ciepłych, 
zimnych i letnich.

symulacja

background image

STATYSTYKI – kształt rozkładu

KURTOZA i SKOŚNOŚĆ 

w spss

g1 i g2 należą do miar rozkładu, a więc > częstości > 

statystyki... (i swiat w 1995) 

Otwórz dane > SPSS > Świat95
Zadanie: Porównaj ze sobą, pod względem znanych ci 

miar rozkładu, zmienne:

- death_rt    vs  birth_rt

- lit_male           vs      lit_fema  

background image

STATYSTYKI – rozkładu podsumowanie 1

Średnia, mediana, modalna, wariancja, rozstęp, 
odchylenie standardowe zależą od skali 
pomiarowej – oznacza to, że nie możemy 
bezpośrednio porównywać rozkładów o różnych 
skalach. Np. nie ma sensu porównanie odchylenia 
standardowego zarobków (skala 0 – 10000) i 
wzrostu (0 – 255)

Skośność i kurtoza mogą być porównywane 
niezależnie od użytej skali

background image

STATYSTYKI – rozkładu podsumowanie 2

Gdy rozkład jest skośny dodatnio (większe 
ekstremum po stronie wysokich) to MO < ME < 
ŚR (temperatury w zimnym miesiącu)

Gdy rozkład jest skośny ujemnie (większe 
ekstremum po stronie niskich) to MO > ME > ŚR 
(temperatury w gorącym miesiącu)

Gdy rozkład jest normalny, symetryczny to MO = 
ME = ŚR (oceny z plasytki).

background image

STATYSTYKI – rozkładu podsumowanie 3

Dodawanie stałej zmienia: średnią, medianę i 
modalną, ale nie zmienia SD i wariancji

Co to znaczy, jeśli wszyscy zaczną zarabiać o 1000 
zł więcej? – średnia wzrośnie o 1000, tak samo 
mediana i modalna, a rozkład zarobków będzie tak 
samo rozproszony jak był

Jeżeli mnożymy wartości zmiennej to zmieni się 

wszystko (me mo śr s i sd).

background image

STATYSTYKI – zastosowania praktyczne

STANDARYZACJA

Zamiana wyników surowych na wyniki 

standaryzowane. Cel: możliwość porównywania 

wartości zmiennych niezależnie od skali pomiarowej!

Siła PSI

magazyn Wróżka: wynik Wojtka = 15

Książka „siła Psi”: wynik Zosi = 8

background image

STATYSTYKI – zastosowania praktyczne

STANDARYZACJA

Sama informacja bez kontekstu nic nam nie mówi!

Potrzebujemy znać: Śr i SD

Magazyn Wróżka: wynik Wojtka = 15; M=12; SD=1,5

Książka „siła Psi”: wynik Zosi = 8: M = 4; SD = 2

Kto ma więcej PSI?....

background image

STATYSTYKI – zastosowania praktyczne

STANDARYZACJA

Zadanie: Oblicz wyniki Z oceny z klasówki ze 

statystyki:

Marek = 4; M=3; SD=0,5

Zenek = 5: M = 6; SD = 1

Kto powinien się bardziej cieszyć?

background image

Notatka do zajęć

Jak uzyskać miary: skośności  i kurtozy w spss 
(ścieżka dostępu)?

Czym się różnią od siebie skośność i kurtoza?

Co to jest rozkład platykurtyczny?

Po co standaryzuje się zmienne?

Co czytać? “Wieczorkowska” s. 99 – 111 (rozdział 

3 – wizualizacja danych) 

background image

Praca domowa

W dowolnym pliku z danymi wyszukaj trzy takie 
zmienne, które będą skośne ujemnie i trzy, które będą  
płaskie. 

Dla tych 6 zmiennych oblicz wszystkie (uwaga na 
poziom pomiaru) miary rozkładu

Napisz krótkie podsumowanie na temat dwóch 
wybranych zmiennych