Baza danych Document Understanding Baza danych Document Understanding dotyczy jednostronicowych dokumentów. Baza zostaªa utwo-rzona w oparciu o trzydzie±ci kopii listów biznesowych wysªanych przez rm¦ Olivetti. Spo±ród wszystkich komponentów logicznych listów, zwanych blokami, wyró»niono pi¦¢, na podstawie których utworzono klasy decyzyjne. Bloki te identykowane s¡ poprzez nast¦puj¡ce jednoargumentowe relacje: sender, receiver, logo, reference oraz date. Wiedz¦ dziedzinow¡ stanowi¡ jednoargumentowe relacje okre±laj¡ce wªasno±ci wszystkich bloków (np. with-very-small(block), position-top(block)) oraz dwuargumentowe relacje okre-

±laj¡ce zwi¡zki zachodz¡ce pomi¦dzy dokumentem a blokiem lub mi¦dzy blokami danego dokumentu (np.

part-of(document,block), above(block1,block2)).

c8 (date)

c1 (sender)

c21 (receiver)

c3 (logo)

c14 (reference)

c5

c24

c7

Rysunek 1: Jednostronicowy dokument