background image

19.11.2013, Sapa 

Jak działa wyszukiwarka? 

Nie widzi wszystkiego, ale i tak znajdzie więcej niż człowiek może "wchłonąć".   

Wyszukiwarki indeksują słowa ważne, znaczące; nie indeksują : na, do, od, i, oraz, pod, a, lub, itp. 

Wyszukiwarki nie indeksują całych dokumentów! 

 Wyszukiwarka ze względów funkcjonalnych zbudowana jest z 4 podstawowych elementów: [ang. 
search engine] 

 

1 – Szperacz (inaczej: bot, robot)- program indeksujący (software), 
który wędruje po linkach od strony do strony i je indeksuje 

2 – Indeks (inaczej : baza wyszukiwarki) – lista terminów, które 
szperacz znalazł w sieci, np. dokonuje analiz statystycznych. Jest 
efektem pracy szperacza 

3 – Interfejs – część webu która odpowiada za komunikację między 
Internetem a użytkownikiem. Pozwala na zadanie pytania i 
otrzymanie odpowiedzi. Interfejs jest tym co widzą użytkownicy 

4 – Algorytm rankingowy – decyduje o kolejności wyświetlania 
wyników w zbiorze wyników wyszukiwania. 

SZPERACZ - dla informatyków: search engine;  

Jeżeli interfejs nie pozwala nam zapytać (nie mamy narzędzia by o coś zapytać) to mimo tego że dane 
są w bazie, nie mamy możliwości by je odnaleźć.  

Interfejs ważny jest w dwóch momentach: zadania pytania i odbierania wyników.  

Wyniki wyszukiwania są przedstawione w formie listy, uporządkowane wg relewantności 
(Odpowiedności wobec zapytania) 

Dziś 

relewantność 

oznacza zgodność z potrzebą (przykład Sapy: chcę makowca – dostaję makowca); 

tradycyjnie oznacza odpowiednią zgodność z zapytaniem (przykład Sapy: chce makowca – proszę 
ciasto – dostaję sernik). 

Pertynentność 

natomiast oznacza zaspokajanie potrzeb. 

Czyli… 

Odpowiedź relewantna – odpowiedź zgodna z potrzebą; 

Odpowiedź pertynentna – odpowiedź zgodna z zadanym pytaniem (Choć nie otrzymujemy tego czego             
potrzebujemy) 

background image

 

www.ranking.pl 

% ludzi, którzy używają konkretnych wyszukiwarek: 

onet - poniżej 1  % 

67% google 

17% Bing 

12 % Yahoo 

http://www.thumbshots.com 

Literatura dla chętnych: 

Tomaszczyk Jacek (2008). Clustering w wyszukiwarkach internetowych. Praktyka i Teoria Informacji 
Naukowej i Technicznej, nr 1, s. 26-31 

Algorytm rankingowy: (co decyduje o tym, że wyniki ustawione są w takiej a nie innej kolejności) jest 
bardzo ważny dla interesów które reklamują się w Internecie (np. księgarnie internetowe) 

wiedzę na temat działania algorytmów czerpiemy między innymi z wyszukiwarek  (porady jak 
efektywnie wyszukiwać).