Differenza tra Tassonomia, Thesaurus e Ontologia nel Web Semantico

Differenza tra Tassonomia, Thesaurus e Ontologia nel Web Semantico

Cos’è il Web Semantico

Gli utenti del Web si imbattono spesso nel termine “Web Semantico”. Tipicamente si associa a questo concetto l’idea che le applicazioni o i servizi Internet, ad esempio i motori di ricerca, siano capaci di intendere il linguaggio umano. Nel caso specifico dei motori di ricerca, ci si aspetta di poter “interagire” con questi attraverso il linguaggio naturale e non più attraverso parole chiave.

In realtà, secondo la definizione data da Tim Berners-Lee, direttore del World Wide Web Consortium e già inventore del WWW, nel suo libro “Semantic Web”:

“The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.”

“Il Semantic Web è un’estensione del Web attuale in cui le informazioni sono strutturate con un senso compiuto, migliorando la cooperazione tra le persone ed i computer.”

è chiaro che il Web Semantico ha obiettivi differenti rispetto al pensiero comunemente condiviso tra gli utenti e si propone di seguire una metodologia ben precisa. Il Web tradizionale era costituito semplicemente di testi e di collegamenti ipertestuali. La navigazione tra i link creava una sorta di conoscenza, ma era comunque dettata dal produttore dei contenuti. Là dove il link non esiste, non esiste informazione o conoscenza aggiuntiva. Al contrario, nel Web Semantico le relazioni tra i documenti non sono dettate a priori, ma sono dinamiche e automatizzate.

Per concretizzare questo rapporto dinamico tra i dati presenti su Internet, il Web Semantico si propone di arricchire gli stessi con informazioni aggiuntive che li descrivano: i metadati (cioè, come sostiene Berners-Lee), dando una struttura più formale alle informazioni. Questo consente una collocazione di senso e di contesto delle informazioni cos`ı descritte.

Ad esempio la parola “albero” può essere collocata in almeno tre contesti diversi: l’informatica, per la struttura dei dati, la botanica o la nautica. Come può una macchina capire il vero contesto a cui ci si riferisce?

È proprio questo il compito dei metadati. Una volta capito il significato esatto della parola sarà possibile collegarla con altri concetti appartenenti alla stessa area semantica.
In questo modo le applicazioni e/o i servizi Internet possono dedurre automaticamente dai metadati informazioni altrimenti implicite, imitando, in un certo senso, le deduzioni umane e ottenendo la “collaborazione tra macchine e esseri umani” sostenuta da Berners-Lee.

Differenza tra Tassonomia, Thesaurus e Ontologia nel Web Semantico

La rappresentazione della conoscenza

Il Web Semantico si propone, quindi, di trovare dei metodi che siano adatti alla creazione della conoscenza, attraverso collegamenti semantici e alla rappresentazione (grafica e astratta) delle relazioni tra concetti. I metadati atti alla descrizione dei concetti e delle loro relazioni devono seguire una struttura ben precisa.
La struttura dei metadati non è una prerogativa del Web Semantico, ma può essere utilizzata in qualsiasi contesto si trovi necessario una classificazione ed un ordinamento delle informazioni. Questa classificazione può essere fatta attraverso metodi diversi, descritti nei paragrafi seguenti.

Tassonomia

La tassonomia di una porzione di conoscenza permette una classificazione gerarchica di concetti (ad esempio di essere viventi, di luoghi, ecc.). La classificazione gerarchica consiste nel definire tra i concetti una relazione di ereditarietà, ossia la relazione padre-figlio. La relazione di ereditarietà non è, sufficiente a descrivere in maniera completa le relazioni esistenti nel mondo reale, ma è l’unico modo efficace per strutturare in modo ordinato ed organizzato le informazioni riguardanti una porzione di conoscenza, definito anche come dominio.
Un esempio di tassonomia è riportato qui di seguito. Ad esempio, il concetto Persona è figlio del concetto Agente ed è padre dei due concetti Manager e Impiegato. La semplice tassonomia non consente la creazione di una relazione di uguaglianza.
Infatti, nell’esempio proposto, non sarebbe possibile definire il concetto Dirigente come sinonimo del concetto Manager.
Classificare i dati, la conoscenza, attraverso una sola relazione è fortemente restrittivo, soprattutto se si considera la complessità delle aree di conoscenza che ci apprestiamo a rappresentare attraverso il Web Semantico.

Thesaurus

Per risolvere i problemi di una classificazione troppo restrittiva tipica della tassonomia, il thesaurus aggiunge, alle relazioni sopra descritte, ulteriori relazioni più complesse. In un Thesaurus esistono, infatti, sei tipi di relazioni differenti:

  • BT, broader term. È l’analogo del concetto di padre. Fa riferimento ad un concetto più ampio e meno preciso.
  • NT, narrower term. È l’analogo del concetto di figlio. Fa riferimento ad un’entità più dettagliata.
  • SN, scope note. Definisce il significato, l’aerea semantica del termine.
  • USE, definisce l’esistenza di un sinonimo di un determinato termine. Tipicamente indica anche la preferenza di utilizzare un termine al posto del termine per cui è definito.
  • TT, top term. Identifica la radice della gerarchia.
  • RT, related term. Identifica un termine in relazione con un altro, che non corrisponde alle relazioni di BT, NT o USE.

Ontologia

L’ontologia è un modello utilizzato per descrivere “una porzione di mondo”, cioè un dominio di conoscenza. Per la formalizzazione di un’area semantica sono utilizzate diverse risorse con caratteristiche differenti: le classi, le proprietà e le relazioni. La particolarità di questo tipo di classificazione è che sia le classi che le proprietà possono essere create ex-novo.
La struttura ontologica è quella maggiormente utilizzata per la classificazione della conoscenza del Web. Probabilmente questo trova in parte giustificazione nelle potenzialità delle ontologie di descrivere in maniera più accurata concetti e relazioni di un dato dominio, dando cos`ı una struttura più organizzata alla complessità dei dati presenti su Internet.

L’ontologia, quindi, descrive il modo in cui diversi concetti vengono combinati in una struttura dati contenente tutte le entità rilevanti e le loro relazioni all’interno di un dominio. I programmi informatici usano le ontologie per una varietà di scopi, tra cui il ragionamento induttivo, la classificazione, ecc.

Come già sottolineato in precedenza, la classificazione ontologica supera quella tassonomica e quella del thesaurus perchè consente di specificare classi (definite anche come tipi), proprietà, relazioni e istanze. Le istanze sono gli oggetti reali o ideali descritti attraverso un particolare insieme di tipi e di proprietà. Lo scopo dell’ontologia è di rendere le informazioni comprensibili ai programmi senza comprometterne l’intelligibilità agli esseri umani.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *