Llama 3.1 รจ lโultima versione dellโLLM (Large Language Model) creato da Meta. Stando a quanto affermato dai portavoce della compagnia si tratterebbe di unโevoluzione senza precedenti nello sviluppo di modelli generativi, una notizia particolarmente interessante se si considera che in questo caso parliamo di una soluzione Open Source.
Tra le caratteristiche di Lama 3.1 troviamo lโimpiego di ben 405 miliardi di parametri per il suo addestramento, siamo quindi di fronte allโLLM libero e aperto piรน grande mai realizzato fino ad ora. Ciรฒ dovrebbe riflettersi positivamente sullโaccuratezza degli output, in particolare nelle traduzioni tra lingue differenti e nella risoluzione di task complessi.
Starting today, open source is leading the way. Introducing Llama 3.1: Our most capable models yet.
Today weโre releasing a collection of new Llama 3.1 models including our long awaited 405B. These models deliver improved reasoning capabilities, a larger 128K token contextโฆ pic.twitter.com/1iKpBJuReD
โ AI at Meta (@AIatMeta) July 23, 2024
La finestra di contesto, cioรจ la capacitร di eleborare simultaneamente informazioni contenute in una singola interazione, รจ pari a 128 mila token, mentre per quanto riguarda il supporto linguistico รจ stata migliorata la capacitร di gestire input e output in Inglese, Spagnolo, Portoghese, Francese, Tedesco, Hindi e per nostra fortuna anche in Italiano.
Tra i vantaggi del progetto Llama vi รจ anche il fatto che questโultimo puรฒ essere utilizzato anche per il training di modelli di terze parti. Ciรฒ รจ possibile grazie alla possibilitร di estrapolare dati sintetici riutilizzabili, le conoscenze dellโLLM possono essere inoltre "distillate" in modo che operi come "insegnate" per un modello piรน piccolo e compresso.
Secondo Meta, Llama 3.1 รจ competitivo rispetto a soluzioni come GPT-4 e Claude 3.5 Sonnet. A proposito del modello di Anthropic รจ utile ricordare che nei giorni scorsi รจ stata rilasciata unโapplicazione per Android che ha come modello di riferimento proprio "Sonnet", un LLM multimodale con il supporto degli Artifacts appositamente pensati per la programmazione.