Caratteristiche, obiettivi e utilizzi dell’Information Retrieval in informatica

Caratteristiche, obiettivi e utilizzi dell’Information Retrieval in informatica

L’Information Retrieval (IR), che significa letteralmente “reperimento delle informazioni”, è l’insieme delle tecniche utilizzate per gestire la rappresentazione, la memorizzazione, l’organizzazione delle informazioni e l’accesso ad oggetti contenenti informazioni quali documenti, pagine web, cataloghi online e oggetti multimediali, al fine di rendere agevole all’utente il soddisfacimento dei propri bisogni informativi.

I problemi centrali dell’Information Retrieval sono:

  1. capire quali documenti sono impotanti e quali non lo sono per l’utente; non è semplice caratterizzare esattamente i bisogni informativi dell’utente.
  2. le decisioni di solito dipendono da un algoritmo di ranking basato sul concetto di rilevanza del documento; questo concetto è determinato dal modello di Information Retrieval adottato.

Caratteristiche, obiettivi e utilizzi dell'Information Retrieval in informatica

In altre parole, l’Information Retrieval è un processo con cui un utente pùo convertire il suo bisogno di informazioni in un elenco di documenti in memoria contenenti informazioni utili per lui. E’ il processo di ritrovamento o di scoperta delle informazioni memorizzate. Information Retrieval abbraccia gli aspetti intellettuali della descrizione delle informazioni e le sue specifiche per la ricerca, e anche qualunque sistema, tecnica, o macchina che venga impiegata per effettuare questa operazione. Infine, Information Retrieval è fondamentale per la documentazione e l’organizzazione della conoscenza.

Scopo e processo dell’Information Retrieval

Lo scopo di questa importante branca dell’informatica è quello di soddisfare il cosiddetto User Information Need, cioè il “bisogno informativo dell’utente”, ovvero garantire a quest’ultimo, in seguito ad una sua ricerca, tutti quelli che sono i documenti e le informazioni rilevanti per quella che è stata la richiesta da egli effettuata.

Due concetti sono di fondamentale importanza per analizzare un sistema di Information Retrieval, query ed oggetto:

  1. Le query(“interrogazioni”) sono stringhe di parole-chiave che rappresentano l’informazione richiesta. Vengono digitate dall’utente in un sistema IR, come ad esempio un motore di ricerca, e rappresentano la concretizzazione di quello che è il reale bisogno informativo dell’utente.
  2. Un oggetto è un’entità che possiede informazioni che potrebbero essere la risposta all’interrogazione dell’utente. Un documento di testo ad esempio, è un oggetto di dati.

Un processo di Information Retrieval inizia quando un utente inserisce una query nel sistema; una query non identifica univocamente un singolo oggetto della collezione, invece alcuni oggetti potrebbero corrispondere alla query, con diversi gradi di rilevanza.

Le query dell’utente vengono poi confrontate con le informazioni del database. La maggior parte dei sistemi di Information Retrieval calcolano un punteggio numerico per ciascun oggetto nel database corrispondente alla query, e classificano gli oggetti in base a questo valore; gli oggetti top ranking vengono infine mostrati all’utente. Il processo pùo quindi essere ripetuto se l’utente desidera rifinire la query.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: www.vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *