Cos'è Mistral?
Mistral AI è un laboratorio IA con sede a Parigi che sviluppa sia modelli a pesi aperti scaricabili ed eseguibili localmente, sia un assistente ospitato chiamato Le Chat. È la più importante fonte occidentale di modelli aperti di alta qualità.
Il portafoglio comprende modelli a pesi aperti (abbastanza piccoli da poter essere self-hosted) e modelli commerciali più grandi disponibili via API, oltre a Codestral per il codice. Poiché i modelli chiave sono scaricabili, Mistral è una scelta naturale quando devi eseguire l'IA sulla tua infrastruttura per motivi di costo, latenza o residenza dei dati.
Se vuoi una qualità vicina al livello più alto senza inviare dati a un hyperscaler americano, o se vuoi possedere il modello che alimenta il tuo prodotto, Mistral è quello da valutare.
Dove eccelle
- Il self-hosting: modelli a pesi aperti che puoi eseguire sui tuoi server per controllare costi, latenza e dati.
- I deployment sensibili ai dati dove conta tenere l'inferenza nel proprio ambiente (o in una regione europea).
- Un'inferenza conveniente e veloce: ottima qualità rispetto al costo, soprattutto con i modelli più piccoli.
- La generazione di codice con Codestral, un modello specializzato in programmazione.
- La creazione di prodotti su un'API di un fornitore indipendente dai grandi cloud americani.
- L'uso quotidiano di un assistente tramite Le Chat (chat, ricerca Web, caricamento di documenti, generazione di immagini).
Dove fa cilecca
- Il ragionamento assolutamente in testa alle classifiche: i modelli chiusi più grandi di OpenAI, Anthropic e Google tendono ancora a guidare nei test di ragionamento più difficili.
- Il set di funzionalità consumer più ampio: Le Chat è più leggero di ChatGPT o Gemini.
- I team senza voglia di gestire modelli, se scelgono la via del self-hosting (l'API evita questo).
Due modi per accedere: Le Chat o i pesi
Per un assistente normale, usa Le Chat su chat.mistral.ai: registrati e inizia a chattare, con ricerca Web, caricamento di documenti e generazione di immagini disponibili.
Per l'ingegneria, hai una scelta unica in questo gruppo: chiama i modelli tramite l'API di Mistral (La Plateforme), oppure scarica i modelli a pesi aperti ed eseguili tu stesso sul tuo hardware o cloud.
Self-hosting dei modelli aperti
I modelli Mistral a pesi aperti sono pubblicati su piattaforme come Hugging Face e possono funzionare tramite runtime comuni (per esempio vLLM o Ollama). Questo colloca l'inferenza interamente nel tuo ambiente: nulla esce dalla tua rete.
Questo controllo è il vantaggio principale: costo prevedibile su scala, bassa latenza e dati che non toccano mai una terza parte, le stesse ragioni per cui i team fanno self-hosting dei database.
Codestral e l'API
Codestral punta sul completamento e sulla generazione di codice ed è progettato per integrarsi negli strumenti di sviluppo. L'API espone anche i modelli generali e commerciali più grandi con un prezzo a token.
Scegli il modello più piccolo che supera le tue valutazioni: i modelli più piccoli di Mistral sono economici e veloci, e spesso sufficienti per la classificazione, l'estrazione e il routing.
Quanto costa Mistral
Indicativo, in USD, aggiornato al gennaio 2026. I prezzi cambiano spesso. Verifica sul sito ufficiale prima di farci affidamento.
Pesi aperti
0 $ (self-hosting)
Scarica ed esegui tu stesso i modelli aperti; paghi solo per la tua infrastruttura di calcolo.
Le Chat Gratuito
$0
Assistente ospitato con limiti: chat, ricerca Web e caricamento di documenti.
Le Chat Pro
~15 $ / mese
Limiti più elevati e accesso ai modelli più performanti nell'assistente.
API (La Plateforme)
A consumo
Prezzo a token su tutta la gamma di modelli; i modelli piccoli sono economici.
Esempi di prompt
Copiali in Mistral come punto di partenza, poi adattali al tuo compito.
Devo classificare ticket di assistenza in 8 categorie ad alto volume e basso costo. Quale modello Mistral dovrei usare, e scrivimi un prompt di sistema conciso per questo.
Scrivi una funzione Python che valida e normalizza i numeri di telefono nel formato E.164, con test per i casi difficili. Spiega i casi limite che hai coperto.
Dal testo qui sotto, estrai un oggetto JSON con i campi: azienda, ruolo, sede, fascia_salariale. Restituisci solo JSON valido, null per tutto ciò che manca.
Elaboriamo circa 2 milioni di brevi richieste di classificazione al mese e ci interessa la residenza dei dati. Guidami nel decidere se fare self-hosting di un modello Mistral aperto o usare l'API, con i compromessi in termini di costo e operatività.
Mistral
domande frequenti.
Risposte dirette alle domande che ci vengono poste più spesso. Se la tua non c'è, scrivi al team.