background image

 

w w w . c h o m i k u j . p l / M a r W a g 9 8 7  

STATYSTYKA – EGZAMIN: 

 

1.

 

Statystyka – to zbiór metod służących do: pozyskiwania, prezentacji i analizie danych. 
Proces  pozyskiwania  danych,  to  badanie  statystyczne  polegające  na  obserwacji 
statystycznej. 

2.

 

Podstawowe zadania statystyki to: 

-

 

analiza  (sprowadzająca  się  do  sumarycznego  opisu  zbioru  danych),  przy 
wykorzystaniu metod i opisu statystycznego; 

-

 

interpretacja danych. 

3.

 

Statystyka  matematyczna  –  W  wielu  rzeczywistych  sytuacjach  zebranie  wszystkich 
potencjalnych  danych  nie  jest  możliwe,  a  analizy  dokonuje  się  na  podstawie 
odpowiednio  zebranych  danych  częściowych  o  badanym  zjawisku.    Jest  to  analiza 
wykorzystująca metody rachunku prawdopodobieństwa. 

4.

 

Populacja  generalna  –  Badanie  statystyczne  dotyczy  zawsze  pewnej  zbiorowości, 
której  elementami  są  obiekty  materialne  lub  zjawiska.  Badana  zbiorowość 
statystyczna to „populacja generalna” lub „zbiorowość generalna”. 

5.

 

Cecha  statystyczna  –  Elementy  populacji  generalnej  mogą  mieć  różne  właściwości 
które  podlegają  obserwacji  i  które  pozwalają  na  rozróżnianie  elementów  
w populacji. Właściwości te to „cechy statystyczne”. 

6.

 

Rozkład  cechy  –  Jeżeli  elementy  populacji  różnią  się  między  sobą  wartościami 
analizowanej  cechy,  to  mówi  się  o  rozkładzie  cechy  w  populacji.  Celem  badania 
statystycznego  na  ogół  jest  poznanie  rozkładu  interesującej  nas  cechy  w  populacji 
generalnej  oraz  uzyskanie  informacji  o  wartościach  syntetycznych  charakterystyk 
tego rozkładu.  

7.

 

Badania

-

 

b. pełne – obejmują wszystkie elementy zbiorowości generalnej; 

-

 

b. częściowe – obejmują część elementów populacji generalnej. 

8.

 

Próba – podzbiór elementów populacji generalnej podlegających badaniu. 

9.

 

Próba losowa – to próba otrzymana w wyniku doboru losowego. 

10.

 

Warunki dla zapewnienia losowego doboru próby: 

-

 

każdy 

element 

populacji 

generalnej 

 

ma 

dodatnie, 

znane 

prawdopodobieństwo znalezienia się w próbie losowej; 

-

 

istnieje  możliwość  ustalenia  prawdopodobieństwa  znalezienia  się  w  próbie 
dla każdego zespołu elementów populacji. 

11.

 

Wnioskowanie  statystyczne  –  Podstawowym  zagadnieniem  pojawiającym  się  
w badaniach częściowych jest możliwość uogólnienia uzyskanych na podstawie próby 
wyników  na  całą  populację  oraz  oszacowanie  popełnionych  przy  tym  błędów.  Jest  
to „wnioskowanie statystyczne”. Wyróżnia się: 

-

 

estymację (szacowanie) nieznanych wartości parametrów rozkładu cechy; 

-

 

sprawdzanie (weryfikację) hipotez dotyczących wartości parametrów rozkładu 
lub postaci samego rozkładu. 

12.

 

Cechy  skokowe  (dyskretne)  –  cechy  statystyczne  (mierzalne),  które  przyjmują 
wartości całkowite. 

13.

 

Cechy ciągłe – to cechy statystyczne przyjmujące wartości rzeczywiste. 

14.

 

Szereg pozycyjny – Jeżeli próba dotycząca jednej cechy mierzalnej nie jest zbyt liczna, 
tzn. dotyczy 

 30 jednostek, to wstępne jej opracowanie polega na uszeregowaniu w 

porządku rosnącym danych liczb. Jest to „szereg pozycyjny”. 

background image

 

w w w . c h o m i k u j . p l / M a r W a g 9 8 7  

-   wyniki surowe:  

4 5 0 1 2 4 0 9 4 5 

-   po uporządkowaniu:  0 0 1 2 4 4 4 5 5 9 
 
15.

 

Szereg rozdzielczy  - jeżeli liczebność próby jest duża (orientacyjnie > 30), to drugim 
etapem jej opracowania jest dokonanie grupowania (klasyfikacji). Grupowanie polega 
na  podziale  próby  na  podzbiory  zwane  grupami  lub  klasami.  Wartościami 
reprezentującymi  poszczególne  klasy  są  ich  środki  oraz  ich  liczebności,  czyli  liczby 
jednostek  próby  należących  do  danej  klasy.  Tworzą  one  razem  „szereg  rozdzielczy 
(histogram)”. 

16.

 

Zmienna  losowa    -  jest  to  taka  zmienna,  która  w  wyniku  doświadczenia  przybiera 
jedną i tylko jedną wartość ze zbioru tych wszystkich wartości, jakie ta zmienna może 
przyjąć.  Wartości  zmienne  losowej  to  inaczej  realizacje  zmiennej  losowej.  Zmienna 
losowa przybiera różne wartości z różnym prawdopodobieństwem. 

P(X=x

i

) = p

i

 – funkcja rozkładu prawdopodobieństwa 

 

=

=

n

i

p

1

1

1  

17.

 

Rodzaje zmiennych losowych: 

-

 

skokowe, to takie , które mają skończony lub przeliczalny zbiór wartości; 

-

 

ciągłe, to takie, które mogą przybierać dowolne wartości liczbowe z pewnego 
przedziału liczbowego. 

18.

 

Rozkład zmiennej losowej: 

Niech  X  jest  zmienną  losową  dyskretną,  która  może  przyjmować  wartości  x

1

,  x

2

,  ... 

odpowiednio  z  prawdopodobieństwem  p

1

,  p

2

,  ...  Każdej  realizacji  zmiennej  losowej  X 

przyporządkowane  jest  więc  pewne  prawdopodobieństwo.  Rozkładem  skokowej 
(dyskretnej)  zmiennej  losowej  X  nazywa  się  prawdopodobieństwo  tego,  że  zmienn  X 
przybiera wartości x

i

 (i=1,2,...): 

P(X=x

i

) = p

i

  

=

=

n

i

p

1

1

1  

19.

 

Dystrybuanta  zmiennej  losowej  –  (skumulowane  prawdopodobieństwo),  to  funkcja 
oznaczona przez F(x), określona: 

F(x) = P(X<x) 

Określa ona prawdopodobieństwo tego, że zmienna losowa X przyjmuje jakąkolwiek 
wartość mniejszą od z góry przyjętej danej wartości x. 

20.

 

Rozkład Normalny Gaussa

Zmienna  losowa  ciągła  X  ma  rozkład  normalny  o  wartości  średniej  M  i  odchyleniu 
standardowym 

σ

co 

zapisujemy 

M(m; 

σ

), 

jeśli 

jej 

funkcja 

gęstości 

prawdopodobieństwa wyraża się wzorem: 

]

2

)

(

[

2

2

2

1

)

(

π

π

σ

=

m

x

e

x

f

 

21.

 

Rozkład Bernoulli’ego

To rozkład dwumianowy, dotyczący zmiennej losowej dyskretnej, w którym wykonuje 
się  serię  n  niezależnych  doświadczeń  w  takich  samych  warunkach,  gdzie  
w  wyniku  pojedynczego  doświadczenia  może  zrealizować  się  pewne  zdarzenie  A  
z prawdopodobieństwem P(A) = p lub zdarzenie przeciwne A z prawd. P(A) = 1-p = q. 
Prawd., że wśród przeprowadzonych n doświadczeń zrealizuje się k razy zdarzenie A 
jest określone wzorem: 

background image

 

w w w . c h o m i k u j . p l / M a r W a g 9 8 7  

k

n

k

p

p

k

n

k

X

P

=

=

)

1

(

)

(

)

(

 

gdzie x = 0,1,2,...n 

 
 
 
 

22.

 

Rozkład Poisson’a

To  rozkład  dwumianowy,  dotyczący  zmiennej  losowej  dyskretnej,  w  którym  liczba 
doświadczeń  jest  wystarczająco  duża  (n>50)  natomiast  prawdopodobieństwo  jest 
bliskie zeru (p<0,1). Rozkład jest określony wzorem: 

x

n

x

p

p

x

n

k

X

P

=

=

)

1

(

)

(

)

(

 

gdzie: x = 0,1,2,...n 

23.

 

Reguła trzech 

σσσσ

Jeżeli x jest zmienną losową ciągłą o rozkładzie N(

µ

;

σ

), to zachodzi: 

P(

µ

-3

σ

 

 x 

 

µ

+3

σ

) = 0,9973 

Tzn.,  takie  jest  prawdopodobieństwo,  że  zmienna  losowa  przyjmuje  takie  wartości, 
które  różnią  się  od  wartości  oczekiwanej 

µ

  nie  więcej  niż  o 

±

3  odchylenia 

standardowe 

σ

24.

 

Rozkład wykładniczy

Zmienna  losowa  X  ma  wykładniczy  rozkład  prawdopodobieństwa,  jeśli  jej  funkcja 
gęstości wyraża się wzorem: 

0

,

0

0

;

0

{

)

(

>

>

=

λ

λ

λ

x

x

dla

e

x

f

x

 

Parametr 

λ

 jest związany z wartością oczekiwaną  i wariancją: 

E(x) = 1/

λ

 

 

D

2

(x) = 1/

λ

2

 

25.

 

Estymacja przedziałowa funkcji

To  szacowanie  parametru  w  postaci  przedziału  ufności,  który  z  dużym  prawdopod. 
obejmuje prawdziwą wartość parametru. 
MODEL 1: 
Badana  cecha  w  populacji  generalnej  ma  rozkład  normalny  N(

µ

;

σ

).  Gdzie 

µ

  jest 

nieznane,  natomiast 

σ

  jest  znana.  Z  populacji  tej  wylosowano  niezależnie  próbę  

o liczebności n elementów. Przedział ufności dla średniej 

µ

 populacji: 

α

σ

µ

σ

α

α

=

+

<

<

1

{

n

u

x

n

u

x

P

 

gdzie 1-

α

 to współczynnik ufności przyjęty z góry; u

α

 to kwantyl rozkładu normalnego 

odczytany z tablicy. 

 

MODEL 2: 
Badana cecha w populacji generalnej ma rozkład normalny N(

µ

;

σ

). Gdzie 

µ

 oraz 

σ

 są 

nieznane.  Z  populacji  tej  wylosowano  niezależnie  małą  próbę  o  liczebności  n  (n<30) 
elementów. Przedział ufności dla średniej 

µ

 populacji: 

α

µ

α

α

=

+

<

<

1

{

n

s

t

x

n

s

t

x

P

 

background image

 

w w w . c h o m i k u j . p l / M a r W a g 9 8 7  

gdzie 1-

α

 to współczynnik ufności przyjęty z góry; u

α

 to kwantyl rozkładu t-Studenta 

odczytany z tablicy. 

26.

 

Weryfikacja  (testowanie)  hipotez  statystycznych  –  to  drugi  obok  estymacji 
podstawowy rodzaj wnioskowania statystycznego. 

27.

 

Hipoteza  statystyczna  –  to  każde  przypuszczenie  dotyczące  wielkości  parametru 
rozkładu zmiennej losowej w populacji generalnej lub próbnej, albo też postaci tego 
rozkładu, uzyskane na podstawie próby losowej. 

28.

 

Hipotezy statystyczne

-

 

parametryczne, związane z wartościami parametrów; 

-

 

nieparametryczne, związane z postacią rozkładów. 

29.

 

Hipoteza  zerowa  –  to  hipoteza  głosząca  że  różnica  pomiędzy  parametrem 

Θ

  a  jego 

oceną T jest statystycznie nieistotna (jest na poziomie zerowym): H

0

 : 

Θ

 = T 

Hipoteza alternatywna – to hipoteza określająca dla hipotezy zerowej zależność: 

H

1

 : 

Θ

 

 T 

lub 

H

1

 : 

Θ

 > T 

lub 

H

1

 : 

Θ

 < T 

Hipotezę zerową weryfikuje się za pomocą określonego testu, po czym określa obszar 
krytyczny odrzuceń hip. zerowej dla danego poziomu istotności 

α

30.

 

Test  zgodności  –  Wprowadza  się  charakterystykę,  będącą  miarą  odległości  między 
dystrybuantą rozkładu empirycznego, a dystrybuantą rozkładu hipotetycznego: 

=

=

r

i

i

p

n

p

r

n

1

2

1

1

2

)

(

χ

 

gdzie:  n

i

  –  liczebność  empiryczna  i-tego  przedziału  klasowego  (>10);  r  –  liczba 

przedziałów  klasowych;  p

i

  –  prawdopodobieństwo  odpowiadające  wartości  badanej 

cechy w i-tej klasie. 

31.

 

Eksperyment – seria doświadczeń. 

Cel planowania eksperymentu – wyznaczanie opisu matematycznego obiektu badań 
lub  zjawiska,  tzw.  modelu  matematycznego,  umożliwiającego  analizę  jego 
zachowania i ustalenia czynników wpływających na zachowanie obiektu. 

32.

 

Obiekt badań – można go przedstawić jako czarną skrzynkę: 

 
 
 

x

1

, x

2

, x

n

 – zmienne wejściowe (czynniki); 

y

1

, y

2

, y

n

 – zmienne wyjściowe, charakteryzujące stan obiektu w zależności od 

zmiennych wejściowych (zmienne stanu); 
z – zmienna przypadkowa o nieokreślonym rozkładzie, niekontrolowana (zakłócenie). 

33.

 

Eksperyment  wstępny  –  przeprowadza  się  w  przypadku,  gdy  brak  jakiejkolwiek 
informacji  o  obiekcie  badań.  Jego  celem  jest  uzyskanie  wstępnych  informacji  o 
obiekcie niezbędnych do przeprowadzenia eksperymentu podstawowego. 

Zadaniem  „eksperymentu  podstawowego”    jest  uzyskanie  modelu  badanego 
obiektu,  który  wykorzystuje  się  dla optymalizacji obiektu  (lub  procesu)  lub  jako  opis 
matematyczny służący do badania jego

 zachowa

ń