background image

 

 

 

 

ZASTOSOWANIE ALGORYTMÓW GRUPOWANIA  

W SIECI WWW I E-BIZNESIE 

 

 

 

Sprawozdanie VII 

 

Grupowanie wyników wyszukiwania 

 

 

 

Czemiel Paulina 

Hałaburda Krzysztof 

 

 

 

 

background image

Zadanie 1 

Narzędzia: SearchEngine (praca dyplomowa Wojciecha Rakowskiego), Carrot (Dawid 
Weiss: 

http://search.carrot2.org/stable/search)

 

1.

 

(Carrot+Lingo oraz Google) Wyszukać następujące informacje uŜywając systemu Carrot z algorytmem Lingo 
oraz Google|Bing 

 

Podać imiona bohaterów i nazwiska grających ich aktorów w serialu „Czterej pancerni i pies” 

 

Podać nazwy gatunków drzew chronionych w Polsce 

 

pytanie 

Google 

Carrot 

Janusz Gajos

 

Janek Kos 

Franciszek Pieczka

 

Gustlik Jeleń 

Włodzimierz Press

 

Grigorij Saakaszwili 

Pola Raksa

 

Marusia "Ogoniok" 

Wiesław Gołas

 

Tomasz Czereśniak 

Roman Wilhelmi

 

Olgierd Jarosz 

Małgorzata Niemirska

 

Lidka Wiśniewska 

Witold Pyrkosz

 

Franek Wichura 

 

Janusz Gajos

 

Janek Kos 

Franciszek Pieczka

 

Gustlik Jeleń 

Włodzimierz Press

 

Grigorij Saakaszwili 

Pola Raksa

 

Marusia "Ogoniok" 

Wiesław Gołas

 

Tomasz Czereśniak 

Roman Wilhelmi

 

Olgierd Jarosz 

Małgorzata Niemirska

 

Lidka Wiśniewska 

Witold Pyrkosz

 

Franek Wichura 

background image

Barbara Krafftówna

 

Honorata 

Tadeusz Fijewski

 

Czereśniak 

Janusz Kłosiński

 

Czernousow 

Barbara Krafftówna

 

Honorata 

Tadeusz Fijewski

 

Czereśniak 

Janusz Kłosiński

 

Czernousow

 

 

cis pospolity (Taxus baccata ), 

 

sosna limba (Pinus cembra ), 

 

 brzoza ojcowska (Betula × oycoviensis), 

 

jarząb szwedzki (Sorbus intermedia ), 

 

 jarząb brekinia (Sorbus torminalis), 

 

sosna górska (Pinus mugo ). 

 

brzoza ojcowska,  

 

cis pospolity,  

 

jarząb brekinia,  

 

jarząb szwedzki,  

 

limba. 

Określić w kaŜdym przypadku czas, w którym wyszukano informacje. 

 

W  pierwszym  przykładzie  wpisaliśmy  w  obu  wyszukiwarkach:  ‘aktorzy  czterej  pancerni  i  pies’.  Obie 

wyszukiwarki  w  pierwszej  pozycji  wyszukały  stronę:  http://www.filmweb.pl/Czterej.Pancerni.I.Pies/cast.  Lista  pełnej 

obsady  była  zawarta  w  pierwszo  wybranym  przez  nas  linku  ,  dlatego  czas  wyszukania  pełnych  informacji  w  obu 

przypadkach był bardzo szybki a wyniki pełne. 

W drugim przykładzie jako słowa  kluczowe  wpisaliśmy: ‘drzewa chronione  w Polsce’.  Wyszukiwarka Google 

jako  pierwszy  wynik  wyświetliła  stronę:  http://www.okop.om.pttk.pl/zrzut/obrazki.pdf.  Informacje  w  wybranym  pliku 

były pełne, zawierające nazwy polskie i łacińskie drzew oraz obrazki. Liczba chronionych drzew w Polsce wg tej strony 

wynosi  6.  Czas  wyszukania  pełnych  informacji  był  bardzo  szybki.    Wyszukiwarka  Carrot  w  pierwszej  pozycji 

wyświetla link do strony: http://portalwiedzy.onet.pl/24211,,,,rosliny_chronione_w_polsce,haslo.html. Informacje na tej 

stronie są ogólne i niepełne. Liczba chronionych drzew dla tej strony wynosi 5. Znalezienie dokładniejszych wyników 

zajmuje więcej czasu. Wyszukiwarka Carrot nie zasugerowała nam strony wybranej przez nas w wyszukiwarce Google.