Definizione e differenza tra IR (Information Retrieval) e Sentiment Analysis (SA)

Definizione e differenza tra IR (Information Retrieval) e Sentiment Analysis (SA)

Definizione e differenza tra IR (Information Retrieval) e Sentiment Analysis (SA)

Information Retrieval

L’Information Retrieval (IR) è l’insieme delle tecniche utilizzate per gestire la rappresentazione, la memorizzazione, l’organizzazione e l’accesso ad oggetti contenenti informazioni quali documenti, pagine web, cataloghi online e oggetti multimediali. Il termine è stato coniato da Calvin Mooers alla fine degli anni quaranta del Novecento, ma oggi è usato quasi esclusivamente in ambito informatico.
Scopo di tale importante branca dell’informatica è quello di soddisfare il cosiddetto “bisogno informativo dell’utente”, ovvero, garantire a quest’ultimo, in seguito ad una sua ricerca, tutti quelli che sono i documenti e le informazioni rilevanti per quella che è stata la richiesta da egli effettuata.

Due concetti sono di fondamentale importanza per analizzare un sistema di IR, query ed oggetto:

  • Le query (“interrogazioni”) sono stringhe di parole-chiavi rappresentanti l’informazione richiesta. Vengono digitate dall’utente in un sistema IR (per esempio, un motore di ricerca) e rappresentano la concretizzazione di quello che è il reale bisogno informativo dell’utente.
  • Un oggetto è un’entità che possiede informazioni le quali potrebbero essere risposta dell’interrogazione dell’utente. Un documento di testo, per esempio, è un oggetto di dati.
    Comunemente è possibile dare la definizione di quello che prende il nome di task di un sistema di Information Retrieval, ovvero, una situazione tipica che un sistema di questo genere deve risolvere.

Un utente nel momento in cui intende usare un qualsiasi sistema di ritrovamento dell’informazione (un motore di ricerca) per poter acquisire informazioni su un determinato argomento deve tradurre tale necessità in quella che è una query e, a partire da questa, il sistema di I.R. ha il compito di restituire tutti quelli che sono i documenti che risultano essere rilevanti per la richiesta effettuata.

Sentiment Analysis

Il termine Sentiment Analysis (SA) si riferisce all’insieme di tecniche di elaborazione del linguaggio naturale, analisi del testo e linguistica computazionale per identificare ed estrarre le informazioni soggettive (opinioni) nelle fonti di testo scritto o parlato (documenti, pagine web, articoli, gruppi di discussione online, recensioni, web blog e Social media); se queste informazioni soggettive fanno sono prelevate da grandi quantità di dati, e quindi da opinioni di grandi nuclei di persone, il Sentiment Analysys può anche essere chiamato Opinion Mining, mentre in questo progetto l’attenzione è rivolta all’andamento del sentimento e dell’orientamento di un singolo utente, metodo che è meno diffuso rispetto all’Opinion Mining.

In generale, il Sentiment Analysis, che è considerato una branca dell’Information Retrieval, mira a determinare l’atteggiamento di un oratore o scrittore rispetto a qualche argomento, ed il compito fondamentale è la classificazione della polarità contestuale complessiva di un dato testo di un documento, frase, o di una espressione lessicale, ovvero dedurre se il parere espresso è positivo, negativo o neutro.

L’atteggiamento può essere il proprio giudizio o valutazione, stato emotivo (vale a dire, lo stato emotivo dell’autore durante la scrittura o discorso), o la comunicazione emozionale prevista (vale a dire, l’effetto emotivo che l’autore desidera avere sull’oratore).
Ultimamente l’ascesa dei social media come blog e social network ha alimentato interesse per il Sentiment Analysis. Con la proliferazione delle opinioni, giudizi, consigli e altre forme di espressione on-line, questo campo si è trasformato in una sorta di moneta virtuale per le aziende che cercano di commercializzare i loro prodotti, identificare nuove opportunità e di gestire la loro reputazione.
Uno dei problemi principali nell’utilizzo di queste tecniche è che la maggior parte degli algoritmi di Sentiment Analysis usano termini semplici per esprimere il sentimento di un prodotto o servizio. Tuttavia, i fattori culturali, sfumature linguistiche e contesti differenti rendono estremamente difficile trasformare una stringa di testo scritto in un semplice sentimento pro o contro.

Precedente NLP: Differenza tra analisi lessicale, grammatica, sintattica e semantica Successivo Che cos'è e a cosa serve un SDK (Software Development Kit)

Lascia un commento