ZBIORY PRZYBLIŻONE

Historia i zastosowania



Teoria ZP została sformułowana przez Zdzisława Pawlaka

w 1982 roku



Wykorzystywana jako narzędzie do syntezy

zaawansowanych i efektywnych metod analizy oraz do

redukcji zbiorów danych.



Zastosowanie m.in. w eksploracji danych i odkrywaniu

wiedzy, złożonych zadaniach klasyfikacji oraz w

komputerowych systemach wspomagania decyzji.



Dziedziny, w których teoria ZP została zastosowana:



Medycyna



Biznes (bankowość, badania rynku)



Rozpoznawanie mowy



Sieci neuronowe



Sztuczna inteligencja

System informacyjny



Pożądane cechy struktur

przechowujących dane



Efektywność



Uniwersalność



Tablicowy sposób reprezentacji danych –

system informacyjny



Atrybuty – w kolumnach



Obiekty – w wierszach



Wartości atrybutów dla poszczególnych

obiektów – przecięcie wierszy i kolumn

System informacyjny (cd.)



Uporządkowana czwórka:

SI = (U, A, V, f)



U jest niepustym, skończonym zbiorem zwanym
uniwersum



A jest niepustym, skończonym zbiorem
atrybutów



V jest dziedziną atrybutu



f jest funkcją informacji





)

(

)

(

System informacyjny -
przykład

Pacje

Ból głowy

(g)

Ból mięśni

(m)

Temperatura

(t)

Grypa (c)

Nie

Tak

Wysoka

Tak

Nie

Wysoka

Tak

Bardzo

wysoka

Tak

Nie

Tak

Bardzo

wysoka

Tak

Nie

Wysoka

Nie

nie

Tak

normalna

Nie

U = {1, 2, 3, 4, 5, 6}
A = {Ból głowy, Ból mięśni, Temperatura, Grypa}
V = V

Ból głowy

U V

Ból mięśni

U V

Temperatura

U V

Grypa

Ból głowy

= {nie, tak}

f(1, Ból głowy) = nie; f(3, Grypa) = tak

Tab. źródło 1

Relacja nierozróżnialności



Niech SI = (U,A,V,f) będzie systemem informacyjnym i
niech B A



Relację nierozróżnialności na zbiorze obiektów U
generowaną przez zbiór atrybutów B określamy jako:



Poszczególne pary obiektów należą do relacji wtedy,
gdy posiadają te same wartości dla wszystkich
atrybutów ze zbioru B



Relacja nierozróżnialności jest relacją równoważności,
ponieważ jest relacją:



Zwrotną



Symetryczną



Przechodnią



)}

(

)

(

)

(

)

{(

)

(

IND













Klasy abstrakcji



Klasa abstrakcji elementu y X względem

relacji równoważności R w zbiorze X to zbiór

elementów x X, które są w relacji R z y.



Dla danej relacji nierozróżnialności IND

(B)

rodzinę wszystkich klas abstrakcji tej relacji

oznacza się przez: U/IND

(B).



Poszczególne klasy nazywamy zbiorami B –

elementarnymi, zaś przez I

SI,B

(x) oznaczamy

klasę tej relacji zawierającą obiekt x.



SI,B

(x) = {y U | (x, y)

IND

(B)}



Aproksymacja
(przybliżenie)



Jeśli SI = (U, A, V, f) jest systemem informacyjnym takim,

że

B A oraz X U, to:



B – dolnym przybliżeniem zbioru X w systemie

informacyjnym nazywamy zbiór:



B – górnym przybliżeniem zbioru X nazywamy zbiór:



B – pozytywnym obszarem zbioru X nazywamy zbiór



B – negatywnym obszarem zbioru X nazywamy zbiór:



B – brzegiem (granicą) zbioru X nazywamy zbiór:

}

)

(

{









}

)

(

{











POS



)

(

NEG





)

(





)

(

Klasyfikacja zbiorów
przybliżonych



Niech X U będzie zbiorem przybliżonym. Taki
zbiór może należeć do jednej z 4 klas:



Zbiorów w przybliżeniu B – definiowalnych, gdy:



Zbiorów wewnętrznie B – niedefiniowalnych,
gdy:



Zbiorów zewnętrznie B – niedefiniowalnych, gdy:



Zbiorów całkowicie B – niedefiniowalnych, gdy:































Redukty



Niech SI=(U, A, V, f) będzie systemem

informacyjnym oraz B A. Atrybut a

nazywamy zbędnym w B, gdy:

IND

(B) = IND

(B-{a})

w przeciwnym przypadku atrybut a

nazywamy niezbędnym w B.



Zbiór atrybutów B nazywamy

niezależnym w systemie informacyjnym

SI, gdy każdy atrybut należący do B jest

niezbędny w B, w przeciwnym przypadku

zbiór B nazywamy zależnym.



Redukty (cd.)



Zbiór atrybutów Q (Q B) nazywamy reduktem

zbioru atrybutów B w systemie informacyjnym

SI i oznaczamy R

(B) , gdy:



zbiór atrybutów Q jest niezależny



IND

(B) = IND

(Q)



Zbiór wszystkich reduktów zbioru atrybutów B

w systemie informacyjnym SI oznaczamy przez

RED

(B).



Rdzeniem (ang. core) zbioru reduktów

RED

(B) nazywamy zbiór określony wzorem:

Rdzeń zbioru reduktów RED

(B) zawiera

wszystkie atrybuty niezbędne w zbiorze B.



CORE

RED



)

(

)

(





Document Outline