Differenza tra Natural Language Processing (NPL) e Sentiment Analysis (SA)

Differenza tra Natural Language Processing (NPL) e Sentiment Analysis (SA)

NLP: Differenza tra analisi lessicale, grammatica, sintattica e semantica

Natural Language Processing

L’Elaborazione del linguaggio naturale, detta anche NLP (dall’inglese Natural Language Processing), è il processo di trattamento automatico mediante un calcolatore elettronico delle informazioni scritte o parlate in una lingua naturale.
Questo processo è reso particolarmente difficile e complesso a causa delle caratteristiche intrinseche di ambiguità del linguaggio umano. Per questo motivo il processo di elaborazione viene suddiviso in fasi diverse, tuttavia simili a quelle che si possono incontrare nel processo di elaborazione di un linguaggio di programmazione:

  • analisi lessicale: scomposizione di un’espressione linguistica in token (in questo caso le parole)
  • analisi grammaticale: associazione delle parti del discorso a ciascuna parola nel testo
  • analisi sintattica: arrangiamento dei token in una struttura sintattica (ad albero: parse tree)
  • analisi semantica: assegnazione di un significato (semantica) alla struttura sintattica e, di conseguenza, all’espressione linguistica

Nell’analisi semantica la procedura automatica che attribuisce all’espressione linguistica un significato tra i diversi possibili è detta disambiguazione. Infatti, l’approccio semantico viene utilizzato in molte applicazioni per costruire un modello lessicale per la descrizione di verbi , sostantivi e aggettivi da utilizzare in Sentiment Analysis.

Sentiment Analysis

Il termine Sentiment Analysis (SA) si riferisce all’insieme di tecniche di elaborazione del linguaggio naturale, analisi del testo e linguistica computazionale per identificare ed estrarre le informazioni soggettive (opinioni) nelle fonti di testo scritto o parlato (documenti, pagine web, articoli, gruppi di discussione online, recensioni, web blog e Social media); se queste informazioni soggettive fanno sono prelevate da grandi quantità di dati, e quindi da opinioni di grandi nuclei di persone, il Sentiment Analysys può anche essere chiamato Opinion Mining, mentre in questo progetto l’attenzione è rivolta all’andamento del sentimento e dell’orientamento di un singolo utente, metodo che è meno diffuso rispetto all’Opinion Mining.

In generale, il Sentiment Analysis, che è considerato una branca dell’Information Retrieval, mira a determinare l’atteggiamento di un oratore o scrittore rispetto a qualche argomento, ed il compito fondamentale è la classificazione della polarità contestuale complessiva di un dato testo di un documento, frase, o di una espressione lessicale, ovvero dedurre se il parere espresso è positivo, negativo o neutro.

L’atteggiamento può essere il proprio giudizio o valutazione, stato emotivo (vale a dire, lo stato emotivo dell’autore durante la scrittura o discorso), o la comunicazione emozionale prevista (vale a dire, l’effetto emotivo che l’autore desidera avere sull’oratore).
Ultimamente l’ascesa dei social media come blog e social network ha alimentato interesse per il Sentiment Analysis. Con la proliferazione delle opinioni, giudizi, consigli e altre forme di espressione on-line, questo campo si è trasformato in una sorta di moneta virtuale per le aziende che cercano di commercializzare i loro prodotti, identificare nuove opportunità e di gestire la loro reputazione.
Uno dei problemi principali nell’utilizzo di queste tecniche è che la maggior parte degli algoritmi di Sentiment Analysis usano termini semplici per esprimere il sentimento di un prodotto o servizio. Tuttavia, i fattori culturali, sfumature linguistiche e contesti differenti rendono estremamente difficile trasformare una stringa di testo scritto in un semplice sentimento pro o contro.

Pubblicato da Vito Lavecchia

Lavecchia Vito Ingegnere Informatico (Politecnico di Bari) Email: [email protected] Sito Web: https://vitolavecchia.altervista.org

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *