back to top

CriticGPT corregge il codice di GPT (quando ci riesce)

CriticGPT è il nome di un modello generativo addestrato per svolgere un compito particolare. Si tratta infatti di una sorta di LLM (Large Language Model) di controllo il cui obbiettivo è quello di verificare che GPT restituisca delle risposte precise alle richieste degli utenti. Eventuali errori, o possibili "allucinazioni", verranno così segnalati.

Parliamo quindi di un assistente dedicato a chi deve valutare la qualità degli output prodotti dal modello. Il suo ruolo si rivelerà importante soprattutto quando GPT restituisce degli errori nei codici sorgente che gli esseri umani potrebbero avere delle difficoltà a rilevare. Alla base del suo funzionamento vi è una tecnica di training nota come FSBS (Force Sampling Beam Search).

In sostanza CriticGPT è stato implementato utilizzando dataset relativi ad errori e bug, avendo uno "storico" da cui partire il modello può ricoscere i pattern associati più di frequente alle risposto inesatte. Nel contempo vengono raccolte nuove imprecisioni e nuovi patterne che vengono riutilizzati per rendere l’LLM ancora più accurato.

CriticGPT non è però ancora la soluzione definitiva alle inefficienze di GPT. Anch’esso infatti sarebbe esposto ad errori e falsi positivi che tenderebbero ad emergere in particolare quando devono essere analizzati testi molto lunghi o concetti complessi. I risultati ottenuti con i testi di breve respiro sembrerebbero essere invece abbastanza soddisfacenti.

Vi è poi un problema insito nel metodo utilizzato per l’addestramento. Infatti, quando il sistema si "convince" che un’informazione è corretta o, al contrario, che non lo è, diventa molto difficile riaddestrarlo. A ciò si aggiunge il fatto che CriticGPT viene utilizzato per rilevare imprecisioni in parti specifiche di codice, escludendo diversi scenari in cui potrebbe risultare utile.

Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Copilot Wave 2: piรน AI su Word ed Excel

La Casa di Redmond ha annunciato Wave 2, aggiornamento...

ChatGPT: o1 รจ l’erede di GPT

OpenAI ha presentato o1, modello generativo destinato all'integrazione su...

YouTube Music: Ask Music crea playlist con l’AI

YouTube Music ha lanciato una nuova funzionalitร , chiamata Ask...

AI: previsioni preoccupanti sulle emissioni di CO2

Qual รจ l'impatto sull'ambiente dell'Intelligenza Artificiale? Le AI richiedono...

Strawberry: ChatGPT pensa prima di parlare

Se tutto dovesse andare come previsto da Sam Altman...

Visual Intelligence, la Google Lens di Apple

Visual Intelligence รจ una nuova funzionalitร  sviluppata da Apple...
Pubblicitร