Metoda analizy macierzy współczynników korelacji
Jest to metoda, która bazuje na macierzy współczynników korelacji R opisanej wzorem (3.6) obliczonej dla pierwotnego zbioru zmiennych diagnostycznych. W tym przypadku kryterium klasyfikacji jest tzw. wartość krytyczna ![]()
, która może być wskazana przez badacza lub wyznaczona ze wzoru:

(3.7)
gdzie:
![]()
- wartość teoretycznej statystyki odczytana z tablic t-Studenta dla zadanego poziomu istotności α i N - 2 stopni swobody
N - liczba obserwacji.
Algorytm doboru zmiennych diagnostycznych jest następujący.
Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których zachodzi nierówność:
![]()
(3.8)
gdzie rj0 jest współczynnikiem obliczonym dla j-tej zmiennej diagnostycznej i zmiennej grupującej.
Na tym etapie z pierwotnego zbioru zmiennych diagnostycznych usuwa się takie, które nie są skorelowane ze zmienną grupującą.
Spośród pozostałych potencjalnych zmiennych jako zmienną objaśniającą wybiera się zmienną Xh dla której zachodzi warunek
![]()
(3.9)
Zmienna Xh jest nośnikiem największego zasobu informacji o zmiennej objaśnianej.
Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których zachodzi nierówność:
![]()
(3.10)
Są to zmienne zbyt silnie skorelowane ze zmienna objaśniającą xh, co powoduje powielanie informacji.
Postępowanie w punktach 2-3 powtarza się aż do wyczerpania pierwotnego zbioru zmiennych diagnostycznych.