background image

Wyszukiwarki 

Metawyszukiwarki

Katalogi

 

Google Docs

uzytkownik: wsus.katowice

hasło: wsus1234

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Zasada działania wyszukiwarek:

- robot (pająk) "chodzący" po sieci hipertekstu
- zapis do baz danych zawartości stron automat.,
- indeksowanie zawartości stron i obiektów na stronach
- dostęp - moduł wyszukujący - odnalezienie fraz w indeksach i 
wyświetlenie listy skojarzonych z frazą stron

jakość odpowiedzi:
 - algorytmy szeregujące listy odpowiedzi
- "zakres" wyszukiwarki (ilość stron, typy dokumentów, 
geografia)
- indeksowanie plików różnych formatów 

background image

Wyszukiwarki, metawyszukiwarki, katalogi

http://www.link2city.com/web-marketing-how-search-engine-work.htm

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Zasada działania wyszukiwarek:

ranking odpowiedzi zależy od:

- proporcji liczby szukanych słów w tekscie do całkowitej ilosci 
słów - ile razy dane słowo wystepuje w tekscie,
- wystepowania hasła w tytule strony, w jednym z nagłówków,
- pozycji (strony, na których poszukiwane słowo jest na 
poczatku tekstu sa zwykle waniejsze),
- wystepowania hasła w nazwie domeny, katalogu lub pliku,
- wystepowania hasła w tzw. znacznikach META linków 
(połaczen) do tej strony z innych stron.

jak to robi Google?

(cytowania, anchory, ruch + 97 innych)

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Polskojęzyczne wyszukiwarki:

Google - 

http://www.google.pl

Gooru - 

http://www.gooru.pl

Netsprint - 

http://www.netsprint.pl

Szukacz - 

http://www.szukacz.pl

Inne:

http://www.altavista.com/
http://search.yahoo.com
http://www.alltheweb.com
http://ask.com
http://www.bing.com/

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Zasada działania metawyszukiwarek (zwanych też 
multiwyszukiwarkami):

- "meta", czyli "nad"
- odpytują równolegle wiele wyszukiwarek
- usuwają (lub scalają) wyniki powielone
- nie posiadają własnych indeksów

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Metawyszukiwarki - przykłady:

Metacrawler - 

http://www.metacrawler.com

7metasearch - 

http://7metasearch.com

All4One - 

http://www.all4one.com

Mamma - 

http://www.mamma.com

Kartoo - 

www.kartoo.com

i szereg innych

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Wyszukiwarki kontekstowe:

- pozwalają grupować wyniki wyszukiwania według 
dodatkowych powiązań tematycznych pomiędzy dokumentami 
- wskazują dodatkowy kontekst, w którym występuje słowo lub 
wyrażenie wyszukiwawcze podane przez użytkownika
-kontekst w oparciu o podobieństwo (logiczne, probabilistyczne, 
lingwistyczne)

Clusty - 

http://www.clusty.com

Scirus - 

http://www.scirus.com

 (także Deep Web)

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Charakterystyka katalogów:

- są tworzone przez redaktorów (ręcznie), (może być wspomagane przez automaty)
- w katalogach indeksowane są wyłącznie strony główne witryn internetowych;
- zasoby pojedyńczego katalogu stanowią zaledwie mały procent baz danych 
wyszukiwarek internetowych;
- budowa:
    a. informacje dostępne są w systemie hierarchicznym, co umożliwia przeglądanie 
poszczególnych kategorii
głównych, podrzędnych oraz powiązanych
    b. informacje nie są indeksowane pełnotekstowo - umieszczane są tylko podstawowe 
metadane dotyczące zasobu internetowego: tytuł strony, opis zawartości, adres URL oraz 
opcjonalnie słowa kluczowe, typ zasobu i
autor (indywidualny lub korporatywny)
- budowa katalogu wpływa na możliwości wyszukiwania w nim informacji: jest nim 
przeglądanie zasobów poprzez wertowanie kategorii lub też korzystanie z wyszukiwarki 
wewnętrznej, która pozwala jednak na przeszukanie wyłącznie tych informacji, które są 
zaindeksowane;

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Katalogi - przykłady:

- Yahoo!Directory - 

http://dir.yahoo.com/

- Google - 

http://www.google.pl/dirhp

- Excite - 

http://www.excite.com/

- DMOZ - 

http://www.dmoz.org/

- DMOZ (polski) - 

http://www.dmoz.org/World/Polski/

- Wirtualna Polska - 

http://katalog.wp.pl/

- Onet - 

http://katalog.onet.pl/

tysiące katalogów SEO

 (magazyny linków dla Google)

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Wyszukiwanie - ograniczanie zakresu wyszukiwania:

Metawyszukiwanie -wyszukiwanie w określonych częściach strony 
internetowej. 
title: pozwala na wyszukanie stron internetowych i dokumentów 
elektronicznych, które w tytule zadaną frazę:
intitle: "fraza" (w tytule)
lub
allintitle: fraza (wszystko w tytule)

url: (inurl: allinurl: ) poszukuje słów lub wyrażeń w adresach 
internetowych stron i dokumentów

text: (intext: allintext: ) poszukuje słów lub wyrażeń wyłącznie w tekście 
strony lub dokumentu (pomijając tytuł,
opisy grafiki, opisy hiperłączy itp.)

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Wyszukiwanie - ograniczanie zakresu wyszukiwania:

anchor: (inanchor: allinanchor: ) poszukuje słów lub wyrażeń w treści 
hiperłączy zdefiniowanych na stronach
internetowych i w dokumentach

site: przeszukuje zawartość jednej wybranej witryny internetowej lub 
domeny (np. us.edu.pl lub gov.pl) Zapytania z
użyciem site: mają postać:
"granty europejskie" site:gov.pl

filetype: poszukuje określonego formatu pliku. Polecenie filetype: ma 
składnię podobną do polecenia site:
"Jan K." filetype:ppt (wyszuka prezentacje PowerPoint zawierające w 
tekście wyrażenie "Jan K.")
drzewo filetype:pdf (wyszuka dokumenty w formacie PDF zawierające 
słowo "drzewo")

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Wyszukiwanie - ograniczanie zakresu wyszukiwania:

related: odnajduje strony internetowe powiązane z adresem z 
zapytania np.:
related: onet.pl (w wynikach znajdziemy portale i serwisy informacyjne, 
gdyż takim serwisem jest Onet)
related: toyota.com (w wynikach otrzymamy strony firm 
motoryzacyjnych)

link: w odpowiedzi otrzymamy strony, na których znajdują się 
hiperłącza do witryny, o którą pytamy, np.:
link:onet.pl (w odpowiedzi otrzymamy strony internetowe zawierające 
odsyłacz do serwisu Onet)

define: (składnia specjalna obsługiwana w wyszukiwarce Google) 
pozwala odszukać definicje encyklopedyczne i słownikowe. (ang.)
define:infobroker

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Wyszukiwanie - modyfikacje warunków wyszukiwawczych:

Operatory logiczne: 
AND 
OR
NEAR
"" (fraza)
- (wykluczenie)

* (zastępowanie) 

ale jest "wyszukiwanie zaawansowane", np.:

http://www.google.pl/advanced_search?hl=pl
http://www.netsprint.pl/serwis/search?adv=1
http://search.yahoo.com/web/advanced?ei=UTF-8&fr=yfp-t-701
http://www.alltheweb.com/advanced?advanced=1&&q=

background image

Wyszukiwarki, metawyszukiwarki, katalogi

Ciekawostki:

http://www.chacha.com/

 

http://www.mahalo.com/

http://www.wolframalpha.com/

http://tineye.com/

 

http://www.uczelnie.org/

www.yasni.de

 

http://wyczajka.com/

 

Monitoring wyszukiwawczy:

Google Alert

 - wysyłanie wyników wyszukiwania na maila.