Statystyka
dr Stanisław Lipski
wykł. 1 i 2
Jak się uczyć?
polubić
krok po kroku
systematycznie
ze zrozumieniem
prowadzić własne notatki
NIE NA PAMIĘĆ!!!
Przedmiotem statystyki są zjawiska, czyli procesy masowe.
Statystyka zajmuje się badaniem tych zjawisk w czasie i w przestrzeni.
Umożliwia analizę trendów, kierunków i tempa ich zmian.
Praktyczne zastosowania statystyki np.
Ocenić
zarobki mieszkańców miasta X
liczbę ryb w jeziorze, dorsza w Bałtyku
liczbę dorosłych Polaków (nie) popierających urzędującego Prezydenta
Zbadać
Wpływ ceny na wielkość sprzedaży
Wielkość odsetka mieszkańców, którzy w przyszłości zachorują, wyprowadzą się z miasta, kupią samochód
Zaplanować
Rozmiary funduszu odszkodowań za wypadki samochodowe
Wielkość przeciętnej emerytury
Jest nauką, która ułatwia poznanie jakiegoś skomplikowanego wycinka rzeczywistości.
Pozwala ogarnąć coś, co na pierwszy rzut oka może przytłaczać ilością elementów i stopniem skomplikowania.
Pomaga wprowadzić porządek tam gdzie na pozór panuje chaos.
Bazy danych liczbowych
Zbieranie, analiza i interpretacja danych
Cel = otworzyć usta liczbom, tak aby same mówiły. Prawdę!
Zbiorowość statystyczna
Jednostka statystyczna
Cechy statystyczne stałe i zmienne
Średnia arytmetyczna
Dominanta statystyczna
Mediana
Wariancja
Odchylenie standardowe
Współczynnik zmienności cechy
Norma statystyczna
Zadanie 1:
W minionym roku akademickim grupa studentów SWW zdawała egzaminy ze statystyki i otrzymała następujące oceny:
4,5,3,5,4,2,4,4,3,5,5,4,3,3,4
Polecenie. Określ:
-zbiorowość statystyczną
-jednostkę statystyczną
-cechy statystyczne stałe i jej rodzaj
-zmienną cechę statystyczną i jej rodzaj
Oblicz wartość i interpretację średniej arytmetycznej, dominanty, mediany, wariancji, odchylenia standardowego, współczynnika zmienności cechy i wyznacz przedział normy statystycznej ocen studenckich.
Rozwiązanie- Pytania
Pytanie 1. Co lub kto jest badany? Odpowiedź na to pytanie pozwoli Państwu określić tzw. Zbiorowość statystyczną.
Pytanie 2. Czym elementy tworzące zbiorowość statystyczną różnią się między sobą? Odpowiedź na to pytanie pozwoli nam określić tzw. Zmienną cechę statystyczną.
Zbiorowość statystyczna
W zadaniu występują dwa elementy: studenci + ocena.
Z liczb (4,5,3,5,4,2,4,4,3,5,5,4,3,3,4)
Wynika, że 15 studentów zdawało egzamin ze statystyki.
Pierwszy otrzymał4, drugi 5 itd.
Odp. 1. Badani są studenci. Oni tworzą zbiorowość statystyczną
Studenci są jednostkami czyli ”elementami” tworzącymi zbiorowość statystyczną
Zbiorowość generalna
Jeśli zbiorowość statystyczna obejmuje wszystkie elementy będące przedmiotem badania
Zbiorowość generalną może tworzyć skończona lub nieskończona liczba elementów
Zbiorowość próbna – próba reprezentacyjna
Podzbiór zbiorowości generalnej – z reguły o znacznie mniejszej liczbie elementów
Jeśli taki podzbiór ma identyczną strukturę jak zbiorowość generalna wówczas nosi nazwę próby reprezentacyjnej
Pytanie 2. Czym elementy tworzące zbiorowość statystyczną różnią się między sobą?
Z naszego zadania wynika, że elementy zbiorowości statystycznej różnią się ocenami. Zatem cechą zmienną jest ocena z egzaminu.
Wniosek ogólny: Jest to logiczne!
Załóżmy przez przekorę, że badane są oceny. Czyli oceny to zbiorowość statystyczna.
Czym zatem będą się różnić oceny jako elementy tej zbiorowości pomiędzy sobą?
Może studentami?
Widać, że popełniliśmy błąd.
Odpowiedź prawidłowa na pytanie:
Zbiorowość statystyczna składa się z jednostek statystycznych. Zbiorowość studentów z zadania tworzą studenci. Zatem jednostką statystyczną jest jeden student.
Cechą zmienną w tym zadaniu jest ocena z egzaminu. Zatem dalsze obliczenia będą dotyczyć cechy zmiennej
W naszym zadaniu wystąpiły następujące cechy stałe:
-cecha stałą rzeczowa: studenci.
-cecha stała przestrzenna: Warszawa
-cecha stała czasowa luty 2008
Cechą zmienną jest ocena z egzaminu, która jest cechą ilościową, mierzalną i przyjmuje wartości skokowe.
Zmienne mierzalne można przedstawić za pomocą wartości liczbowych: lizcba ludności, wartość zysku, wskazania przyrządów pomiarowych.
Zmiennym niemierzalnym odpowiadają kategorie jakościowe: poziom wykształcenia, pochodzenie społeczne, płeć, itp.
Zmienne mierzalne i niemierzalne dzielą się na skokowe (dyskretne) i ciągłe
Zmienna mierzalna dyskretna przyjmuje skończoną liczbę wartości np. liczba osób, rzeczy itp.
Zmienna mierzalna ciągła przyjmuje nieskończoną liczbę wartości, jednak z określonego przedziału liczbowego np. wiek, waga, temperatura itp.
Tworzą dane i surowe informacje pochodzące z list, spisów, ankiet, wywiadów i in.
Mogą być uporządkowane lub nieuporządkowane
Szeregiem uporządkowanym jest zbiór informacji o określonej populacji uporządkowany wg wybranej cechy.
Średnia arytmetyczna
Średnią arytmetyczną n liczb a1,a2,...,an nazywamy liczbę :
Średnia arytmetyczna jest właśnie tym, co w potocznym języku określa się mianem średniej. Można ją również określić jako średnią potęgową rzędu 1.
Na przykład średnią liczb 2, 2, 5 i 7 jest:
Dominanta- wartość cechy zmiennej, która dominuje, czyli występuje najczęściej
Dx- dominanta
xo - dolna granica przedziału, w którym występuje dominanta
L- rozpiętość przedziału liczbowego dominanty
no- liczebność przedziału dominanty
n-ı - liczebność przedziału poprzedzającego przedział dominanty
n ı -liczebność przedziału następującego po przedziale dominanty
Mediana – wartość środkowa
Me-Mediana jest to wartość cechy zmiennej, jaką posiada jednostka stojąca pośrodku uporządkowanego szeregu.
Wzór na pozycję mediany
Poz Me = (n+1):2
Sposób określenia mediany dla tych, którzy zdali egzamin:
1.Ustawić studentów od najniższej oceny do najwyższej i odczytać ocenę pośrodku szeregu.
2.Podstawić dane do wzoru, czyli (14+1):2 =7,5
3.Nie ma takiego studenta
4.Zapytać 7 i 8-go studenta w szeregu jaką ocenę dostali, zsumować i podzielić na pół:
Rozwiązanie: 3,3,3,3,4,4,4,4,4,4,5,5,5,5
Odpowiedź: poz ME= 7,5, Me =4
Interpretacja mediany
Połowa studentów otrzymała ocenę 4, lub mniej, a pozostała połowa czwórkę lub więcej
Średnia kwadratowa z indywidualnych różnic wszystkich wartości cechy badanej od średniej arytmetycznej
Określone jest jako pierwiastek z wariancji
Ocena egzaminacyjna ze statystyki badanej grupy różni się przeciętnie 0,88 jednostki
Współczynnik zmienności cechy
Wyrażą się stosunkiem odchylenia standardowego i średniej arytmetycznej
Wartość tego współczynnika informuje, że odchylenie standardowe stanowi około 22,8% wartości średniej oceny ze statystyki w badanej grupie studentów
Jest przedział utworzony na podstawie średniej arytmetycznej, do której dodajemy i odejmujemy wartość jednego odchylenia standardowego.
Czyli wykorzystując dane z zadania 1 mamy: 3,86 ± 0,78=<3,08;4,64>
W celu łatwiejszej analizy dużej ilości danych należy się posłużyć pojęciem szeregu rozdzielczego
Powstaje po zebraniu informacji o badanej zbiorowości, które to informacje są przydzielone do określonych przedziałów wyróżnionej cechy.
W ten sposób tworzy się tzw. Liczebność przedziału klasowego
W mieście Firmowo zebrano informacje o 40 małcyh firmach prywatnych zatrudniającyh do 30 osób. Oto one uszeregowane nie malejąco.
1,1,2,2,3,4,5,5,6,6,6,7,7,7,7,8,9,9,10,10,12,12,12,12,13,14,14,14,15,15,15,15,15,15,16,18,20,23,25,30
Polecenie: Dokonaj agregacji danych poprzez budowę szeregu rozdzielczego o jednakowej rozpiętości przedziałów klasowych oraz oblicz wartość średniej arytmetycznej, dominanty, mediany, wariancji, odchylenia standardowego i współczynnika zróżnicowania zatrudnienia w małych firmach
Wzór:
Zatem mamy 6 jednakowych przedziałów: (o,5], (5,10], (10,15], (15,20], (20,25], (25,30]
Stwierdzić, czy następujące zmienne są typu ilościowego, czy jakościowego oraz czy są to:
Zmienne skokowe, czy ciągłe
A)waga dziecka w okresie pierwszego roku życia;
B)liczba nakładów inwestycyjnych na środki trwałe;
C)kursy walut obcych wyrażone w złotych polskich;
D)gatunki zbiorów ziemiopłodów;
E)sprzedaż wybranych towarów konsumpcyjnych;
F)liczba gmin w województwie;
G)kolor włosów;
H)siła uczuć kobiety i mężczyzny.
Zadanie 4- do samodzielnego rozwiązania
Właściciel stacji benzynowej zanotował w ciągu 30 dni kwietnia ilość sprzedanego paliwa (etylina 94)
Otrzymał następujące wielkości ( w litrach):
3200; 1870; 2420; 3100; 3860; 4000; 2510; 3470; 1714; 1720; 2068; 2935; 2753; 2174; 3020; 3308; 2010; 4500; 2325; 2870; 2890; 3440; 2880; 4700; 1500; 3010; 2800; 2350; 4010; 2422.
Zbudować szereg rozdzielczy z przedziałami klasowymi.
Obliczyć wartość średnią sprzedanego paliwa z szeregu indywidualnego oraz z szeregu rozdzielczego.
Wyjaśnić ewentualne różnice między wartością średnią obliczoną z szeregu rozdzielczego i szeregu indywidualnego.
W dwóch gminach P i R z których każdą zamieszkuje 10 000 osób, gęstość zaludnienia wynosi odpowiednio 30 i 60 osób/km2.
Jaka jest średnia gęstość zaludnienia w obu gminach?
Jaka jest łączna powierzchnia zajmowana przez obie gminy?
P.S. egzamin będzie składał się z dwóch części. Części pisemnej i ustnej.