Motori di ricerca: Caratteristiche, pregi e difetti di web directory e spider engines

Motori di ricerca: Caratteristiche, pregi e difetti di web directory e spider engines

Web directory e spider engines

Le tipologie dei motori di ricerca si suddividono in queste due macrocategorie: web directory engine e spider engine.
Le prime forniscono liste di siti web, suddivise in categorie a seconda dell’argomento, con una breve descrizione. Trovata la lista dei risultati, ci si muove da un menù all’altro, facendo una selezione dopo l’altra, finché non si giunge al punto in cui si trovano i siti ai quali si è interessati.
Si può anche effettuare una ricerca sulla descrizione dei siti contenuti nella categoria. Categorie e descrizioni sono suggeriti dagli sviluppatori dei siti web ed esaminati da persone specializzate.

Mentre le directory raccolgono poche informazioni dei siti (la semplice descrizione), uno spider engine raccoglie tutte le informazioni su tutte le pagine web che trova tramite due tecniche: con il sistema add-url, che permette ad ogni utente di segnalare la singole pagina del sito al motore di ricerca, specificandone l’indirizzo (definito con la sigla url) e con il sistema spider, che non è altro che un programma che scandaglia il web cercando tutte le pagine che riesce a trovare e le registra nell’archivio generale.
Da tener conto poi che una pagina è un documento di qualsiasi dimensione, da poche righe fino ad un libro intero. Un sito potrebbe contenere centinaia o migliaia di pagine. Il motore di ricerca non aspetta che qualcuno gli comunichi il contenuto di un sito ma a tale scopo si avvale di programmi robot detti crawler, o indicizzatori che navigano in Internet ed archiviano il testo completo di ogni pagina trovata.

In tal modo lo spider indicizza ciascuna parola trovata dai crawler e ne memorizza anche l’ordine in modo che si possano ricercare anche frasi complete. Mentre nell’uso delle directory è necessaria una certa conoscenza specifica dell’oggetto di ricerca, nell’uso degli spider è consentito di partire da un unico elemento, come un nome o una frase, senza ulteriori specifiche informazioni.
Le directory sono organizzate da esseri umani e quindi basate sul loro giudizio personale e non sempre le loro scelte sono compatibili al nostro modo di pensare ed alle esigenze dell’utente.
Gli indici dei motori di ricerca sono generati in modo automatico in relazione alle parole o sulle frasi trovate sulle pagine web. Di conseguenza le informazioni non vengono filtrate né riorganizzate e se si è padroni dei metodi di ricerca si può ottenere direttamente ciò che si vuole.

Con l’andare del tempo, le directory rischiano di diventare obsolete mentre i motori di ricerca non sono soggetti a questo tipo di pericolo perchè i loro risultati non vengono classificati ed anzi si arricchiscono con l’indicizzazione di nuove pagine web.
I siti, comprendendo diverse pagine che possono avere argomento diverso, possono essere spesso difficilmente classificabili sotto un’unica categoria. Non si corre questo rischio, invece, con il motore di ricerca, poiché considera ogni pagina come singola. Le directory vengono organizzate come biblioteche. Al contrario, gli indici dei motori di ricerca non sono organizzati così che il computer possa aiutare a raccogliere qualsiasi informazione da un caos immenso in qualunque circostanza.

Al contrario delle biblioteche dove domande troppo specifiche richiederanno grandi tempi di consultazione, gli indici degli spider engines hanno in questi casi risposte immediate. Se il quesito è generico, si ritroveranno viceversa un gran numero di documenti sull’argomento.

Motori di ricerca: Caratteristiche, pregi e difetti di web directory e spider engines

Pregi e difetti di web directory e spider engines

Le web directory operano delle selezioni e tendono a non comprendere ogni cosa, mirano cioè più alla qualità che alla quantità delle informazioni.
Col passare del tempo le informazioni delle directory rischiano di invecchiare e di diventare imprecise, al pari di un elenco telefonico dell’anno precedente: non controllano infatti i contenuti del sito una volta avvenuto l’inserimento ma sta a chi li gestisce segnalare eventuali cambiamenti.

I motori di ricerca si sforzano invece di indicizzare tutte le pagine web senza entrare nel merito delle informazioni contenute. Esse vengono aggiornate periodicamente ed in maniera automatica dai crawler che costantemente controllano tutto il contenuto di Internet per fornire risposte pronte e precise alle singole richieste.
Per aggiungere informazioni ad una directory, i contenuti dei siti devono prima essere esaminati da persone specializzate e l’inserimento non può quindi essere automatico.
Quando si chiede di aggiungere un nuovo url (indirizzo di pagina web), il motore di ricerca attiva il crawler che raccoglie tutto il testo trovato all’indirizzo. Chiunque, non solo chi gestisce un sito, può proporre un url, per segnalare ad esempio una pagina ricca di informazioni utili che si vogliono rendere note ad altri.
Se si sottopone l’url di una pagina inesistente verrà segnalato un errore 404 e la pagina verrà rimossa automaticamente. Chiunque è quindi in grado di aiutare la comunità degli utenti segnalando, al motore di ricerca in questione eventuali link non validi.

Comunque sia, non esiste un miglior motore di ricerca, quindi conviene scegliere quelli che sembrano più validi, tra quelli più importanti: le caratteristiche più importanti di riferimento per esprimere un giudizio sono la velocità di accesso e l’interfaccia gradevole e funzionale.

Motori di ricerca - Caratteristiche, pregi e difetti di web directory e spider engines

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: www.vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *