Firewall for IA è una nuova soluzione per la sicurezza di Cloudflare, uno dei principali provider nel settore della connettività in Cloud, che ha lo scopo di proteggere i dati degli utenti contro gli attacchi basati sulle Intelligenze Artificiali. Tale piattaforma si presenta come un WAF (Web Application Firewall) in grado di operare sulle applicazioni che integrano modelli generativi per l’erogazione di servizi.
Per sottolineare l’utilità del proprio servizio i portavoce di Cloudflare hanno sottolineato le insidie presenti in questo particolare tipo di App. Un utente malintenzionato potrebbe utilizzarle ad esempio per formulare dei prompt destinati a sfruttare falle presenti negli LLM (Large Language Model). Un rischio ancora più accentuato dal fatto che le soluzioni basate sulle AI non sono deterministiche e gli output non sono prevedibili.
Today, Cloudflare is excited to announce the development of Firewall for AI, a protection layer that can be deployed in front of Large Language Models (LLMs) to identify abuses before they reach the models. https://t.co/zAZ8ewLots #SecurityWeek
— Cloudflare (@Cloudflare) March 4, 2024
Questo significa che in questi casi identificare un’azione malevola può rivelarsi anche molto complicato. Ciò ha spianato la strada ad un nuovo tipo di attacco, gli MDoS (Model Denial of Service) che funzionano in modo simile agli attacchi DDoS (Distribuited Denial of Service). Essi però non hanno l’obbiettivo di creare arbitrariamente grandi quantità di traffico ma di veicolare continue richieste verso i modelli.
A questo proposito è possibile citare anche altre tipologie di attacchi, come per esempio la Prompt Injection, cioè il formulare prompt con lo scopo preciso di generare output inattesi o addirittura allucinazioni. O la SID (Sensitive Information Disclosure), una tecnica finalizzata ad interagire con un’applicazione basata su un modello generativo fino ad ottenere informazioni riservate in possesso di un’azienda.
Firewall for IA agisce in parte come un firewall tradizionale in quanto il suo compito è quello di limitare le richieste inviate alle App e di selezionarle sbarrando la strada a quelle che hanno plausibilmente un’origine malevola. Per il momento si tratta di una piattaforma ancora in fase di betatest, ma il rilascio ufficiale in versione stabile dovrebbe essere effettuato entro pochi mesi.