background image

Regresja  pozwala  na  opisanie  związku  pomiędzy  zmiennymi  objaśniającymi  a  zmienną  objaśnianą, 
oszacowanie  średniej  wartości  zmiennej  objaśnianej  w  zależności  od  zmiennych  objaśniających,  a 
także na wybranie zmiennych istotnie wpływających na zmienną objaśnianą.   
 

 

Ogólna postać modelu regresji liniowej. W tym równaniu nieznane  są parametry β

0   

i  β

1, 

nieznana jest także wartość ε, którą uważamy za zmienną losową. 
 

                                                                           część losowa/zakłócenia 

     

Y = β

+ β

1 * 

X +  ε

 

 

 

 

 

 

 
część deterministyczna 

          Y~ X ( „ Y zależy od X ”, „ Y jest funkcją  X”)  

gdzie,  
Y – zmienna objaśniana (zależna) 
– wektor p zmiennych objaśniających   
β

0  

i  β

1 

to  tzw. parametry strukturalne modelu, 

ε  (epsilon)    -  czynnik  (  składnik)    losowy.    Wyraża  on  wpływ  wszystkich  innych  czynników,  które 
oprócz  zmiennej  X  mogą  wpływać  na  wartość  zmiennej  Y  a  także  wyraża  on  do  pewnego  stopnia 
nasza niepewność co do rzeczywistego kształtu powiązania pomiędzy Y i X.   
 

 

Co znaczy że dany parametr modelu regresji liniowej jest statystycznie istotny?   

Istotność parametrów modelu  
Parametrami modelu są liczby β

0  

i β

1

. Badanie istotności parametrów modelu zakłada  osobne badanie 

poszczególnych  parametrów.  Przy  analizie istotności parametrów  modelu testuje  się hipotezy  o  tym, 

że  parametry  te  są  różne  od  0.  Najważniejszym  testem  jest  test,  który  sprawdzi  czy  parametr  β

jest 

równy 0. Gdyby się okazało w procesie testowanie, że nie możemy odrzucić hipotezy o tym, że β

= 0 

oznaczałoby to , że zmienna X nie jest powiązana z Y.  
 
 Analizując parametr β

1

 

H

0

: β

= 0   

H

1

: β

≠ 0 

W przypadku, gdy odrzucamy hipotezę zerową. Parametr β

posiada jakąś wartość różną od zera,  

a więc jest statystycznie istotny. β

stojąc przy zmiennej X( objaśniającej) wpływa na zmienną Y 

( objaśnianą)  
W  przypadku  gdy  przyjmujemy  hipotezę  zerową.  Parametr  β

1   

jest  równy    zero,  a  więc  nie  jest 

statystycznie istotny. β

stojąc przy zmiennej X(objaśniającej) nie wpływa na zmienną Y( objaśnianą). 

Zmienna X nie jest powiązana z Y.  
 

 

Przypomnienie zasad testowania hipotez  

Hipotezy statystyczne to pewne przypuszczenia na temat populacji, w szczególności hipoteza, że β

0 odnosi się do modelu Y = β

+ β

1 * 

X + ε , który opisuje zależność między X i Y w populacji.  

Stawiamy zawsze dwie hipotezy: zerową ( H

0

) i hipotezę alternatywną ( H

1

                                            
 

 H

0

: β

= 0   vs.          H

1

: β

≠ 0 

 

background image

                      brak powiązania między      istnieje  powiązanie między   

 

 

 

 

         X i Y 

 

 

        X i Y 

 

 

 

 

 

 

 

 

 

 

 

 

 

   Obie hipotezy dotyczą populacji  

 
Z procesem  testowania hipotez wiąże się pojęcie istotności testu α ( na ogół α = 0,05). 
 
W  programach  komputerowych  proces  usuwania  hipotez  polega  na  wyznaczeniu  p  –  wartości  (  p  – 
value) . 
  
Wnioskowanie: 
Im mniejsza p – wartość tym większe przeświadczeni, że H

0

 trzeba odrzucić i przyjąć H

1)

 

gdy p – value ≤ α, to odrzucamy H

0

 i przyjmujemy H

1

 

2)

 

gdy  p  –  value  >  α,  to  uznajemy,  nie  ma  podstaw  do  odrzucenia  H

0

  (  w  uproszczeniu 

przyjmujemy , że H

jest prawdziwe). 

 
Testowanie hipotezy o istotności parametru β

0

1.

 

określamy H

0

 i H

1

 

             H

0

: β

0

=0 vs H

1

: β

0

2.

 

Określamy p – wartość 

3.

 

poziom istotności testu ( α=0,05) 

gdy p – value ≤ α, to odrzucamy H

0

 i przyjmujemy H

1

 

gdy p – value > α, to uznajemy, nie ma podstaw do odrzucenia 
 

Testowanie hipotezy o istotności parametru β

1

1.

 

określamy H

0

 i H

1

 

            H

0

: β

1

=0 vs H

1

: β

1

2.

 

Określamy p – wartość  

3.

 

poziom istotności testu ( α=0,05) 

gdy p – value ≤ α, to odrzucamy H

0

 i przyjmujemy H

1

 

gdy p – value > α, to uznajemy, nie ma podstaw do odrzucenia 

 
Testowanie hipotezy o istotności parametru β

2

1.

 

określamy H

0

 i H

1

 

             H

0

: β

2

=0 vs H

1

: β

2

2.

 

Określamy p – wartość  

3.

 

poziom istotności testu ( α=0,05) 

gdy p – value ≤ α, to odrzucamy H

0

 i przyjmujemy H

1

 

gdy p – value > α, to uznajemy, nie ma podstaw do odrzucenia 

 

 
Interpretacja parametrów  
β

1  – 

określa  o  ile  jednostek  wzrośnie  (lub  zmaleje,  gdy  β

<  0)  wartość  zmiennej  Y,  gdy  wartość 

zmiennej X wzrośnie o jednostkę. 
β

0   

-  na    ogól  nie  jest  interpretowane.  Niekiedy  można  jednak  go  zinterpretować  jako  wartość  Y  w 

sytuacji  gdy  X  = 0,  ale  dotycz  to  wyłącznie  przypadków  gdy  ma  sens  mówienie  o  zerowej  wartości 
cechy Y

 .   

 

background image

Przykład:                     

  enzym Y ( z daszkiem) = 87,7 + 4,1 * enzym X 

 

 

 

 

 

 

 

 

oszacowanie dla β

1

 

Interpretacja dla 4,1: 
Wzrost enzymu X o jednostkę sugeruje wzrost enzymu Y o około 4,1.