background image

Baza danych Document Understanding

Baza danych Document Understanding dotyczy jednostronicowych dokumentów. Baza zostaªa utwo-

rzona w oparciu o trzydzie±ci kopii listów biznesowych wysªanych przez rm¦ Olivetti. Spo±ród wszystkich
komponentów logicznych listów, zwanych blokami, wyró»niono pi¦¢, na podstawie których utworzono klasy
decyzyjne. Bloki te identykowane s¡ poprzez nast¦puj¡ce jednoargumentowe relacje: sender, receiver,
logo, reference oraz date. Wiedz¦ dziedzinow¡ stanowi¡ jednoargumentowe relacje okre±laj¡ce wªasno±ci
wszystkich bloków (np. with-very-small(block), position-top(block)) oraz dwuargumentowe relacje okre-
±laj¡ce zwi¡zki zachodz¡ce pomi¦dzy dokumentem a blokiem lub mi¦dzy blokami danego dokumentu (np.
part-of(document,block), above(block

1

,block

2

)).

c

1

(sender)

c

21

(receiver)

c

3

(logo)

c

8

(date)

c

5

c

14

(reference)

c

24

c

7

Rysunek 1: Jednostronicowy dokument