back to top

DeepSeek presenta un nuovo modello di AI

Gli sviluppatori di DeepSeek hanno reso disponibile un nuovo modello generativo che prende il nome di DeepSeek-V3-0324. Si tratta di una soluzioni rilasciata sotto licenza open source (MIT license) che potrà essere utilizzata gratuitamente anche in ambito commerciale.

Le caratteristiche del nuovo modello di DeepSeek

DeepSeek V3-0324 ha raggiunto un traguardo storico diventando il miglior modello non-reasoning open source secondo l’Artificial Analysis Intelligence Index. Le sue performance superano infatti quelle di alternative proprietarie come Gemini 2.0 Pro di Google, Claude 3.7 “Sonnet” di Anthropic e Llama 3.3 70B di Meta.

Pubblicità

Sebbene non paragonabile per prestazioni ai modelli di tipo reasoning, come per esempio come DeepSeek R1 o i prodotti di OpenAI e Alibaba, V3-0324 dimostra l’enorme potenziale delle soluzioni open source per applicazioni in tempo reale come chatbot, assistenza clienti automatizzata e traduzioni live. Tutti ambiti dove la velocità di risposta è essenziale.

I modelli non-reasoning forniscono infatti risposte istantanee senza processi di ragionamento interni, caratteristica che li rende ideali per task che prevedono un alto livello di reattività.

Le specifiche di V3-0324

Come sottolineato dai portavoce di Artificial Analysis, è la prima volta che un modello open source guida la classifica degli LLM non-reasoning. I modelli reasoning rimangono però superiori per la risoluzione di problemi complessi.

Il nuovo V3-0324 mantiene molte delle specifiche della versione che venne resa disponibile in precedenza dagli stessi autori:

  • una finestra di contesto di 128 mila token (limitata a 64 mila via API).
  • 671 miliardi di parametri totali.
  • 37 miliardi di parametri attivi.
  • Solo testo (non si tratta quindi di un modello multimodale che può gestire diverse tipologie di contenuti).

DeepSeek-V3-0324 è in grado di limitare il numero di parametri utilizzati in fase di esecuzione, cosa che lo rende efficiente anche quando deve operare su configurazioni hardware particolarmente non avanzate.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicità
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

NVIDIA G-Assist ottimizza il PC con l’AI

Dopo la presentazione nel corso del Computex 2024, Project...

Ora GPT-4o crea e modifica le immagini

OpenAI presenta un'interessante novità dedicata all'intelligenza artificiale visiva con...

Google lancia Gemini 2.5, il suo modello AI più intelligente

Google DeepMind ha annunciato il rilascio di Gemini 2.5...

Hollywood si ribella contro le AI di Google e OpenAI

Oltre 400 personalità del mondo dello spettacolo tra cui...

Instagram testa i commenti creati dall’AI

Gli sviluppatori di Instagram, proprietà di Meta, stanno sperimentando...

WhatsApp: una funzionalità AI per riscrivere i messaggi

WhatsApp, l'app di messaggistica istantanea di Meta utilizzata da...
Pubblicità