back to top

AI: modello generativo creato con meno di 50 dollari

Un team di ricercatori delle università di Stanford e Washington ha sviluppato un modello di AI chiamato s1 in grado di competere con il modello di ragionamento o1 di OpenAI. Ciò che rende notevole questa impresa è il costo estremamente contenuto. Il modello è stato addestrato in soli 26 minuti, con una spesa inferiore ai 50 dollari.

Come nasce l’AI di s1

Questo risultato è stato ottenuto utilizzando una tecnica nota come distillazione che permette a modelli più piccoli di apprendere dalle risposte generate da modelli più grandi. In questo caso s1 è stato affinato utilizzando le risposte del modello di ragionamento di Google, Gemini 2.0 Flash Thinking Experimental. È però importante notare che i termini di servizio di Big G vietano l’uso dell’API di Gemini per sviluppare dei modelli AI concorrenti.

Pubblicità

s1 si basa su Qwen2.5, un modello open source sviluppato da Alibaba Cloud. In fase iniziale i ricercatori hanno utilizzato un dataset di 59 mila domande per l’addestramento ma hanno poi scoperto che un set ridotto di sole mille domande offriva risultati comparabili riducendo il tempo e le risorse necessarie per l’addestramento.

Il training è stato eseguito su 16 GPU Nvidia H100. Una caratteristica distintiva di s1 è l’uso della test-time scaling, una tecnica che consente al modello di “pensare” più a lungo prima di fornire una risposta migliorando l’accuratezza del ragionamento.

I risultati dei test

I test hanno dimostrato che l’AI di s1 supera il modello o1 di OpenAI fino al 27% in domande matematiche. Ciò mette in discussione l’idea che la creazione di modelli di intelligenza artificiale richieda investimenti massicci e risorse computazionali elevate. Aziende come OpenAI, Microsoft, Meta e Google hanno investito invece miliardi di dollari e utilizzato migliaia di GPU per addestrare i loro modelli.

Questo risultato potrebbe avere delle implicazioni importanti per il futuro dell’intelligenza artificiale. Si consideri ad esempio che lo sviluppo di R1, modello di DeepSeek considerato già molto economi, è costato circa 6 milioni di dollari.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicità
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Meta: il chip per l’AI ce lo facciamo da soli

Meta sta testando il suo primo chip progettato internamente...

Manus: l’agente AI cinese completamente autonomo

Manus è il primo sistema AI in grado di...

L’AI si testa anche con Super Mario Bros

Negli ultimi anni i ricercatori hanno utilizzato vari titoli...

DeepSeek anticiperà il lancio del modello R2

DeepSeek, la startup cinese che ha scosso il mercato...

Microsoft presenta i nuovi modelli AI Phi-4-mini e Phi-4-multimodal

Microsoft ha annunciato il rilascio di due nuovi modelli...

Mille artisti pubblicano un album contro la AI nella musica

Oltre mille musicisti britannici, tra cui artisti di spicco...
Pubblicità