Caratteristiche, funzionamento e limiti di ChatGPT in informatica

Che cos’è ChatGPT

ChatGPT è un chatbot progettato per rispondere alle domande, un nuovo modello linguistico, ma può anche essere utilizzato per eseguire il debug del codice. Lo ha sviluppato OpenAI, la società che sta dietro AlphaFold e GPT-3.

La società, sostenuta da Microsoft, ha sviluppato un modello linguistico di grandi dimensioni progettato per interagire con gli utenti in “modo colloquiale”.

OpenAI afferma che il formato di dialogo del modello consente a ChatGPT di rispondere a domande di follow-up, ammettere i propri errori, sfidare premesse errate e rifiutare richieste inappropriate.

ChatGPT (Chat Generative Pretrained Transformer) è un modello di pari livello di InstructGPT, rilasciato lo scorso gennaio e progettato per fornire una risposta dettagliata a un’istruzione in un prompt.

Cosa si può chiedere a ChatGPT

Ci sono tantissime cose che possiamo chiedere, per avere risposte utili.

In sostanza possiamo usarlo sia per avere informazioni in modo diretto (più diretto rispetto a un motore di ricerca) sia per aiutarci a scrivere qualcosa.

Esempi di utilizzo:

Richiesta di informazioni di base – ChatGPT può aiutarvi a ottenere informazioni di base su qualsiasi cosa. Ad esempio, potete usare ChatGPT per semplici ricette.
Scrivere un saggio o un riassunto su qualsiasi argomento – Chat GPT può aiutare a scrivere un saggio su quasi tutti gli argomenti.
Scrivere una canzone o poesia su qualsiasi argomento.
Scrivere un’e-mail in uno stile definito.
Scrivere una sceneggiatura cinematografica.
Scrivere un codice.
Eseguire il debug del codice.
Chiedere consigli su qualsiasi cosa: come ad esempio turismo, viaggi, diete, sport, vita quotidiana, ecc.

Consigli per l’uso di ChatGpt

Meglio essere specifici. Come spiega Bloomberg, se chiediamo ChatGPT “Che cos’è il marxismo?”, per esempio, avremo risposta passabile, probabilmente non migliore di quella su Wikipedia o Google. Invece, rendete la domanda più specifica: “Quali sono stati gli sviluppi importanti del marxismo francese nella seconda metà del XIX secolo?”. ChatGPT farà molto meglio, ed è anche il tipo di domanda a cui è difficile rispondere con Google e Wikipedia.
ChatGPT farà ancora meglio se gli farete domande una dopo l’altra, per approfondire o spiegare meglio punti specifici. Chiedetegli informazioni sugli specifici marxisti francesi che cita, su cosa facevano e su come si differenziavano dalle loro controparti tedesche.
ChatGPT è particolarmente bravo nel “confronto e nella contrapposizione”. In sostanza, ChatGPT ha bisogno lo indirizziamo bene. Una domanda ben fatta gli dà più punti di riferimento fissi. Dovete impostare l’atmosfera, il tono e il livello intellettuale della vostra domanda, a seconda del tipo di risposta che desiderate.
Un altro modo per affinare le capacità di ChatGPT è quello di chiedere risposte con la voce di una terza persona. Se chiediamo: “Quali sono i costi dell’inflazione?”, potreste ottenere risposte che non sono esattamente sbagliate, ma nemmeno tanto interessante. Più interessante: “Quali sono i costi dell’inflazione? Rispondete utilizzando le idee di Milton Friedman”.

Come funziona ChatGPT?

ChatGPT un tipo di intelligenza artificiale progettata per generare testi simili a quelli umani in base agli input ricevuti. Utilizza algoritmi di apprendimento automatico per elaborare l’input e generare risposte coerenti e appropriate in linguaggio naturale.

Il bot deriva da modelli di apprendimento automatico per l’elaborazione del linguaggio naturale noti come Large Language Model (LLM). Gli LLM analizzano enormi quantità di dati testuali e deducono le relazioni tra le parole all’interno del testo. Colgono insomma le correlazioni statistiche (pattern) tra una parola e l’altra. In questa maniera possono poi “scrivere” una risposta prevedendo una parola dopo l’altra.

Questi modelli sono cresciuti negli ultimi anni grazie ai progressi della potenza di calcolo. I LLM accrescono le loro capacità con l’aumentare delle dimensioni dei dataset di input e dello spazio dei parametri.

L’addestramento più elementare dei modelli linguistici prevede la previsione di una parola in una sequenza di parole. Più comunemente, è quanto viene definito come next-token-prediction e masked language-modeling.

I dati di addestramento del bot sono costituiti da una vasta quantità di testi provenienti da diverse fonti, tra cui libri, articoli e forum online. Questo permette al bot di comprendere il contesto e la struttura del linguaggio usato in diverse situazioni e di generare risposte adeguate all’input dato.

Utilizza una combinazione di tecniche, tra cui una rete neurale ricorrente (RNN) e un modello di trasformazione (transformer). La RNN elabora l’input che l’assistente riceve e lo utilizza per generare una sequenza di parole o token. Il modello di trasformazione prende il risultato della RNN e lo usa per generare il testo finale. Questa combinazione di tecniche permette al chatbot di generare risposte coerenti e appropriate in tempo reale.

In particolare, ChatGPT è stato costruito utilizzando l’apprendimento per rinforzo dal feedback umano (RLHF). Il metodo è progettato per eliminare le risposte errate premiando le risposte corrette mentre corregge quelle che non lo sono.

Un modello iniziale è stato addestrato utilizzando la messa a punto supervisionata: i formatori di AI umani hanno fornito conversazioni in cui hanno giocato sia l’utente che un assistente AI. I formatori hanno avuto accesso a suggerimenti scritti su modelli per aiutarli a comporre le loro risposte.

Limiti di ChatGPT

ChatGPT è effettivamente un chatbot e come altri è soggetto a generare output offensivo, come nel caso di BlenderBot 3 di Meta. OpenAI afferma di aver preso lezioni dai modelli precedenti, come GPT-3 e Codex, per cercare di migliorare l’affidabilità di ChatGPT, incluso l’utilizzo della sua tecnica di apprendimento per rinforzo per ottenere “sostanziali riduzioni di output dannosi e non veritieri”. Ha applicato anche filtri etici per limitare hate speech e disinformazione.

Tuttavia, l’azienda di intelligenza artificiale riconosce che il suo modello ha dei limiti. Ad esempio, a volte scrive risposte plausibili ma errate o senza senso. Ha problemi anche nel fare calcoli. A volta ha quelle che gli esperti chiamano “allucinazioni”, confondendo realtà con fantasia. GPT coglie infatti, come detto, i rapporti statistici tra le parole; ma non ha contezza dei rapporti tra parole e il mondo. Non conosce né capisce insomma, davvero, ciò che scrive.

Può alimentare così la disinformazione, ad esempio in ambito medico o politico, come rilevato da molti esperti, nonostante i filtri presenti.

Il modello è anche prolisso, tende ad avere uno stile piatto e abusa di alcune frasi, come riaffermare che si tratta di un modello linguistico addestrato da OpenAI – che secondo la società deriva da pregiudizi nei dati di addestramento.

OpenAI afferma anche che l‘AI potrebbe avere una conoscenza limitata degli eventi o delle conoscenze dopo il 2021, in base a quando il modello è stato addestrato.

“Abbiamo fatto molti sforzi per far sì che il modello rifiuti richieste inappropriate, ma a volte risponderà a istruzioni dannose o mostrerà comportamenti distorti“, ha detto OpenAI. “Stiamo usando l’API di moderazione per avvisare o bloccare determinati tipi di contenuti non sicuri, ma ci aspettiamo ancora alcuni falsi negativi e positivi“.

Per affrontare i limiti del modello, OpenAI ha dichiarato di volersi impegnare a fare aggiornamenti regolari per migliorarlo e che lavorerà anche per fornire un’interfaccia accessibile.

ChatGPT, i settori aziendali in cui potrebbe essere impiegato

Secondo McKinsey & co., le funzioni in cui modelli come ChatGPT potrebbero essere usati sono:

Marketing e vendite: creazione di contenuti di marketing, social media e di vendita tecnici personalizzati (inclusi testo, immagini e video); Creazione di assistenti allineati ad attività specifiche, come la vendita al dettaglio
Operazioni: generazione di elenchi di attività per l’esecuzione efficiente di una determinata attività
IT/ingegneria: scrittura, documentazione e revisione del codice
Rischio e legale: rispondere a domande complesse, attingere da grandi quantità di documentazione legale e redigere e rivedere relazioni annuali
R&S: accelerare la scoperta di farmaci attraverso una migliore comprensione delle malattie e la scoperta di strutture chimiche.