back to top

xAI rilascia Grok-1.5V ed è multimodale

Grok-1.5V (la "v" sta per "vision") è l’ultima versione del modello generativo creato e addestrato dalla xAI, azienda fondata da Elon Musk. Questa versione arriva a pochi giorni di distanza dal rilascio di Grok-1.5 ma si differenzia per il fatto di essere un modello multimodale. è quindi in grado di gestire diversi tipi contenuti andando oltre la sola elaborazione dei prompt testuali.

L’aggiornamento promette un alto livello di efficienza anche nella gestione di immagini, compresi gli screenshot contenenti informazioni che possano essere elaborate, documenti, tabelle, diagrammi e altri grafici. Per il momento siamo soltanto alla fase dell’annuncio e la nuova release sarà disponibile soltanto per un numero ristretto di tester.

Pubblicità

L’anteprima di Grok-1.5V è stata comunque sottoposta a dei test interni e i bechmark avrebbero permesso di registrare performance migliori rispetto ad alcuni modelli alternativi, come quelli di Claude (Claude 3 Opus e Claude 3 Sonnet), Gemini 1.5 Pro e GPT-4-V. Questo in particolare nella capacità di individuare gli elementi che compongono un’immagine.

Chiaramente il training dell’LLM (Large Language Model) ha riguardato anche altri aspetti come per esempio la generazione di codice e, nello specifico, di sorgenti Python. A questo proposito Grok-1.5V è stato in grado di creare un’applicazione prendendo spunto da un diagramma di flusso, dimostrandosi un valido assistente per i programmatori.

Nello stesso modo questa release sarebbe capace di generare autonomamente un file CSV (Comma Separated Values) a partire dai dati contenuti in una tabella, di spiegare il significato di un meme, di creare un racconto dopo l’osservazione di un semplice disegno o di leggere l’etichetta di un alimento e calcolare il suo contributo calorico.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicità
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

TikTok: nuovi strumenti per il parental control

TikTok ha annunciato nuove funzionalità per migliorare il controllo...

Meta: il chip per l’AI ce lo facciamo da soli

Meta sta testando il suo primo chip progettato internamente...

WhatsApp: videochiamate anche a fotocamera spenta

Gli sviluppatori di WhatsApp stanno testando una nuova funzionalità...

X in down a causa di un cyberattacco

La piattaforma social X è stata colpita lunedì da...

HP LaserJet non stampa più: il nuovo firmware blocca la stampante

Negli ultimi giorni, numerosi utenti di stampanti HP LaserJet...

Il DOGE di Elon Musk sostituisce i dipendenti pubblici con le AI

Il DOGE (Department of Government Efficiency) promosso da Elon...
Pubblicità