background image

Statystyka i opracowanie wyników 

badań

background image

Statystyka i opracowanie wyników 
badań 

Główne zagadnienia do omówienia

Opis ilościowy próby (statystyka 
opisowa)

Prezentacja wyników, liczne zbiory 
danych 

Zmienne losowe, ich funkcje i 
charakterystyka

Formułowanie wniosków statystycznych

background image

Statystyka i opracowanie wyników 
badań 

Plan pracy w trakcie semestru

15 godzin po 2 godz. w I poł. sem 

praca własna – 15 godzin !!!

kalkulator, 

www.inmat.pw.edu.pl

, tablice statystyczne

sprawdzian pisemny - zaliczenie

Zagadnienia wstępne 

Parametry pozycyjne i rozproszenia próby

Wykresy i grupowanie danych

Gęstość i dystrybuanta zmiennej losowej

Proste testy stat. - Istotność wart. oczekiwanej 

Błędy grube i pomyłki

Wiele zmiennych – korelacja i regresja

background image

Statystyka i opracowanie wyników 
badań 

Literatura pomocnicza

D.Bobrowski „Probabilistyka w zastosowaniach 

technicznych” WNT

M.Maliński „Weryfikacja hipotez statysty-

cznych wspomagana komputerowo” WPŚl

A.Plucińska, E.Pluciński „Probabilistyka” WNT

S. Brandt „Analiza danych” PWN

L. Kukiełka „Podstawy badań inżynierskich” PWN

W.Klonecki „Statystyka dla inżynierów” PWN

T. Zieliński „Jak pokochać statystykę, czyli STATISTICA 

do poduszki” StatSoft Kraków

M.R.Spiegel „Statistics” McGraw-Hill

background image

Statystyka i opracowanie wyników 
badań 

Badane i opisywane cechy

Cechy

– Jakościowe

• Nominalne (np. preferencje kulinarne)
• Porządkowe (wykształcenie podstawowe, średnie, ...)

– Ilościowe

• Interwałowe (A większe od B o x, np. [

o

C])

• Iloczynowe (A 3 razy większe od B, np. [K])

– Ciągłe 
– Dyskretne 

Ograniczenia

background image

Statystyka i opracowanie wyników 
badań 

Wyniki pomiarów jednej cechy

Populacja i próba. 

Charakteryzowanie – statystyka 

opisowa.

– wartość średnia
– odchylenie standardowe
– współczynniki wyższych rzędów
– mediana, kwantyle
– dominanta
– inne charakterystyki pozycyjne i 

rozproszenia

background image

Statystyka i opracowanie wyników 
badań 

Wartość średnia – funkcja efektu

Funkcja efektu:

Suma

Iloczyn

Suma odwrotności

...

Średnia:
arytmetyczna
geometryczna
harmoniczna
...

)

,

...

,

,

(

)

,

...

,

,

(

.

arg

2

1

 

 

n

śr

śr

śr

n

x

x

x

f

x

x

x

f

Typowe błędy i ograniczenia

background image

Statystyka i opracowanie wyników 
badań 

Wartości średnie

n

i

i

n

i

i

n

i

n

i

i

x

n

x

x

n

x

x

x

na

arytmetycz

1

1

1

1

1

n

n

i

i

n

n

i

i

n

i

n

i

i

x

x

x

x

x

x

na

geometrycz

1

1

1

1

~

~

~

n

i

i

h

h

n

i

i

n

i

h

n

i

i

x

n

x

x

n

x

x

x

a

harmoniczn

1

1

1

1

1

1

1

1

background image

Statystyka i opracowanie wyników 
badań 

Charakterystyka jednej cechy 

(w konkretnej 

próbie/populacji)

– odchylenie 

standardowe

– współczynnik 

skośności

– współczynnik 

rozproszenia

3

)

(

1

)

(

1

)

(

1

4

1

4

3

1

3

1

2

s

x

x

n

e

s

x

x

n

a

x

x

n

s

n

i

i

n

i

i

n

i

i

background image

Statystyka i opracowanie wyników 
badań 

Inne charakterystyki

– rozstęp R = x

max

 - x

min

– środek rozstępu x

R

 = (x

max

 + x

min

)/2

– dominanta d (wartość występująca 

najczęściej – o ile jest taka)

– mediana m

• dane uporządkowane (rosnąco lub malejąco)
• nieparzysta liczba wyników: m=x

(n+1)/2

• parzysta liczba wyników: m=(x

n/2 

+x

(n+2)/2

)/2

background image

Statystyka i opracowanie wyników 
badań 

Prezentacja graficzna jednej cechy

– histogram z danych empirycznych
– dystrybuanta
– graficzne wyznaczanie wybranych 

parametrów:

• mediana
• kwantyle
• dominanta

background image

Statystyka i opracowanie wyników 
badań 

Histogram z danych empirycznych

– duża liczność próby (n > 30)
– decyzja o liczbie klas (k):

(n/2) < k < n
• k  1 + 3,3 log n
• k < 5 log n
• dla j(2 ; k-1) liczność j-tej klasy, n

j

5

– stała szerokość klasy   R/k
– początek podziału x

p

<=x

min

; przy czym 

x

max

<=x

p

+k

– j-ty przedział klasowy: < x

p

+(j-1); x

p

+j )

– środek j-tego przedziału x

p

+(j-0,5)

background image

Statystyka i opracowanie wyników 
badań 

Dystrybuanta z danych empirycznych 

– podział na klasy jak do histogramu
– liczność skumulowana N

j

j

l

l

j

n

N

1

Alternatywne formy histogramu i 

dystrybuanty:

– częstość (liczność względna) f

= n

j

/n

– częstość skumulowana F

= N

j

/n

background image

Statystyka i opracowanie wyników 
badań 

Zmienne losowe

Reprezentacja zmiennej losowej

 gęstość prawdopodobieństwa
 dystrybuanta

Charakteryzowanie zmiennej losowej

 wartość oczekiwana
 odchylenie standardowe
 współczynniki wyższych rzędów
 mediana, kwantyle
 dominanta

background image

Statystyka i opracowanie wyników 
badań 

Gęstość prawdopodobieństwa i 
dystrybuanta
zmiennej losowej ciągłej 

dx

x

dF

x

f

dx

x

f

b

x

P

b

F

dx

x

dP

x

f

dx

x

f

b

x

a

P

b

b

a

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(



background image

Statystyka i opracowanie wyników 
badań 

Gęstość prawdopodobieństwa i 
dystrybuanta
zmiennej losowej ciągłej 

1

)

(

0

)

(

0

)

(

)

(

1

)

(

;

0

)

(



dx

x

f

x

f

a

F

a

F

F

F

background image

Statystyka i opracowanie wyników 
badań 

Wartość oczekiwana, odchylenie 
standardowe, wsp. skośności i 
rozproszenia zmiennej losowej

dx

x

f

x

dx

x

f

x

)

(

)

(

)

(

2

3

)

(

)

(

)

(

)

(

4

4

3

3

dx

x

f

x

dx

x

f

x

background image

Statystyka i opracowanie wyników 
badań 

Mediana i kwantyle zmiennej losowej

)

(

2

1

)

(

F

m

F

background image

Statystyka i opracowanie wyników 
badań 

Hipotezy statystyczne

Testowanie prostych hipotez 
statystycznych

– poziom ufności, poziom istotności
– błędy pierwszego i drugiego rodzaju
– hipoteza zerowa, dobór hipotezy alternatywnej
– poziom istotności
– obliczanie statystyki
– interpretacja wyników testu - obszar krytyczny, 

istotność statystyczna (wartość p)

background image

Statystyka i opracowanie wyników 
badań 

Eliminacja wyników wątpliwych (1 
cecha)

– Błędy grube i pomyłki
– Ograniczenia testu „inżynierskiego”, 

zwanego również testem trzech sigma 

– Liczność próby, rozkład wartości, kolejne 

iteracje, wybór wyników wątpliwych (x

w

) do 

testowania

– Uproszczona forma testu statystycznego
– Wynik wątpliwy x

w

 odrzucamy, jeśli:

w

w

x

bez

obliczamy

s

i

x

s

x

s

x

x

3

;

3

background image

Statystyka i opracowanie wyników 
badań 

Pomiary dwóch cech - wstęp

Korelacja

Korelacja

 

(badanie czy zmienne są 
niezależne)

Regresja

Regresja

 

(dopasowanie zależności funkcyjnej 
między cechami)

Wykresy zależności 

Wykresy zależności 

funkcyjnych

funkcyjnych


Document Outline