Un team di ricercatori delle università di Stanford e Washington ha sviluppato un modello di AI chiamato s1 in grado di competere con il modello di ragionamento o1 di OpenAI. Ciò che rende notevole questa impresa è il costo estremamente contenuto. Il modello è stato addestrato in soli 26 minuti, con una spesa inferiore ai 50 dollari.
Come nasce l’AI di s1
Questo risultato è stato ottenuto utilizzando una tecnica nota come distillazione che permette a modelli più piccoli di apprendere dalle risposte generate da modelli più grandi. In questo caso s1 è stato affinato utilizzando le risposte del modello di ragionamento di Google, Gemini 2.0 Flash Thinking Experimental. È però importante notare che i termini di servizio di Big G vietano l’uso dell’API di Gemini per sviluppare dei modelli AI concorrenti.
s1 si basa su Qwen2.5, un modello open source sviluppato da Alibaba Cloud. In fase iniziale i ricercatori hanno utilizzato un dataset di 59 mila domande per l’addestramento ma hanno poi scoperto che un set ridotto di sole mille domande offriva risultati comparabili riducendo il tempo e le risorse necessarie per l’addestramento.
Il training è stato eseguito su 16 GPU Nvidia H100. Una caratteristica distintiva di s1 è l’uso della test-time scaling, una tecnica che consente al modello di “pensare” più a lungo prima di fornire una risposta migliorando l’accuratezza del ragionamento.
I risultati dei test
I test hanno dimostrato che l’AI di s1 supera il modello o1 di OpenAI fino al 27% in domande matematiche. Ciò mette in discussione l’idea che la creazione di modelli di intelligenza artificiale richieda investimenti massicci e risorse computazionali elevate. Aziende come OpenAI, Microsoft, Meta e Google hanno investito invece miliardi di dollari e utilizzato migliaia di GPU per addestrare i loro modelli.
Questo risultato potrebbe avere delle implicazioni importanti per il futuro dell’intelligenza artificiale. Si consideri ad esempio che lo sviluppo di R1, modello di DeepSeek considerato già molto economi, è costato circa 6 milioni di dollari.