back to top

DeepSeek crea dei modelli generativi che migliorano da soli

La startup cinese DeepSeek guidata da Liang Wenfeng sembrerebbe nuovamente pronta a rivoluzionare il settore dell’intelligenza artificiale. Dopo aver scosso Silicon Valley all’inizio del 2025 con alcuni LLM molto competitivi, starebbe ora sviluppando una nuova generazione di modelli auto-miglioranti implementati con una tecnica che prende il nome di GRM (Generative Reward Modeling).

Cosa è il Self-Principled Critique Tuning di DeepSeek

DeepSeek ha introdotto il metodo SPCT (Self-Principled Critique Tuning) in collaborazione con ricercatori dell’Università di Tsinghua. Esso consente all’AI di valutare e migliorare il proprio comportamento seguendo le preferenze umane e riducendo i costi. I nuovi modelli così ottenuti, chiamati DeepSeek-GRM, saranno rilasciati sotto licenza open source, come già accaduto con le versioni precedenti.

Pubblicità

A questo proposito DeepSeek-GRM avrebbe superato concorrenti come Google Gemini 1.5 Pro, Meta Llama 3.1 e OpenAI GPT-4o in numerosi benchmark. Un risultato sorprendente considerando il budget contenuto con cui l’azienda sviluppa i propri sistemi sfidando l’idea che siano necessari miliardi di dollari per competere nel campo dell’AI.

Modelli generativi avanzati a prezzi contenuti

DeepSeek ha già ottenuto alcuni risultati notevoli grazie all’uso del MoE (Mixture of Experts), un approccio che migliora l’efficienza dei modelli dividendo i compiti tra reti neurali specializzate. La stessa tecnica è stata adottata da Meta nei suoi nuovi Llama 4 Maverick e Scout. Secondo alcune indiscrezioni, il prossimo LLM DeepSeek R2 potrebbe arrivare già a maggio

La società è diventata molto popolare nei primi mesi del 2025, quando il suo chatbot superò ChatGPT per popolarità su App Store e Google Play. Questo boom ha ridimensionato drasticamente la percezione della superiorità occidentale nel settore AI e fatto crollare a suo tempo il valore di mercato di aziende come Nvidia per un totale di circa mille miliardi di dollari.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicità
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Meta utilizza i dati degli utenti per addestrare le sue AI

Meta ha reso noto l'avvio di una nuova fase...

DolphinGemma: l’AI di Google capisce la lingua dei delfini

In occasione della "Giornata Nazionale del Delfino" Google ha...

GPT-4.1: OpenAI rilascia il suo nuovo modello di AI

OpenAI ha annunciato il rilascio della nuova famiglia GPT-4.1,...

Nate: l’e-commerce AI era gestito da esseri umani?

Albert Saniger, il fondatore ed ex CEO della startup...

YouTube Music Assistant crea la musica con l’AI

YouTube presenta una nuova funzionalità basata sull'intelligenza artificiale, chiamata...

OpenAI si prepara a lanciare GPT-4.1

OpenAI si starebbe preparando ad una nuova ondata di...
Pubblicità