back to top

AI: modello generativo creato con meno di 50 dollari

Un team di ricercatori delle università di Stanford e Washington ha sviluppato un modello di AI chiamato s1 in grado di competere con il modello di ragionamento o1 di OpenAI. Ciò che rende notevole questa impresa è il costo estremamente contenuto. Il modello è stato addestrato in soli 26 minuti, con una spesa inferiore ai 50 dollari.

Come nasce l’AI di s1

Questo risultato è stato ottenuto utilizzando una tecnica nota come distillazione che permette a modelli più piccoli di apprendere dalle risposte generate da modelli più grandi. In questo caso s1 è stato affinato utilizzando le risposte del modello di ragionamento di Google, Gemini 2.0 Flash Thinking Experimental. È però importante notare che i termini di servizio di Big G vietano l’uso dell’API di Gemini per sviluppare dei modelli AI concorrenti.

Pubblicità

s1 si basa su Qwen2.5, un modello open source sviluppato da Alibaba Cloud. In fase iniziale i ricercatori hanno utilizzato un dataset di 59 mila domande per l’addestramento ma hanno poi scoperto che un set ridotto di sole mille domande offriva risultati comparabili riducendo il tempo e le risorse necessarie per l’addestramento.

Il training è stato eseguito su 16 GPU Nvidia H100. Una caratteristica distintiva di s1 è l’uso della test-time scaling, una tecnica che consente al modello di “pensare” più a lungo prima di fornire una risposta migliorando l’accuratezza del ragionamento.

I risultati dei test

I test hanno dimostrato che l’AI di s1 supera il modello o1 di OpenAI fino al 27% in domande matematiche. Ciò mette in discussione l’idea che la creazione di modelli di intelligenza artificiale richieda investimenti massicci e risorse computazionali elevate. Aziende come OpenAI, Microsoft, Meta e Google hanno investito invece miliardi di dollari e utilizzato migliaia di GPU per addestrare i loro modelli.

Questo risultato potrebbe avere delle implicazioni importanti per il futuro dell’intelligenza artificiale. Si consideri ad esempio che lo sviluppo di R1, modello di DeepSeek considerato già molto economi, è costato circa 6 milioni di dollari.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicità
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

DeepSeek presenta un nuovo modello di AI

Gli sviluppatori di DeepSeek hanno reso disponibile un nuovo...

NVIDIA G-Assist ottimizza il PC con l’AI

Dopo la presentazione nel corso del Computex 2024, Project...

Ora GPT-4o crea e modifica le immagini

OpenAI presenta un'interessante novità dedicata all'intelligenza artificiale visiva con...

Google lancia Gemini 2.5, il suo modello AI più intelligente

Google DeepMind ha annunciato il rilascio di Gemini 2.5...

Hollywood si ribella contro le AI di Google e OpenAI

Oltre 400 personalità del mondo dello spettacolo tra cui...

Instagram testa i commenti creati dall’AI

Gli sviluppatori di Instagram, proprietà di Meta, stanno sperimentando...
Pubblicità