Cos'è Loomya e cosa fa?

Loomya è un'AI Agency italiana che aiuta le aziende a integrare l'intelligenza artificiale nei propri processi. Offre tre servizi principali: Flows (automazione intelligente con agenti AI), Studio (generazione contenuti visivi con AI) e Academy (formazione aziendale sull'AI).

Quali servizi offre Loomya alle aziende?

Loomya offre tre servizi: Flows per l'automazione dei processi aziendali con agenti AI e sistemi RAG (riduzione dell'80% dei tempi operativi), Studio per la generazione di contenuti visivi con AI (produzione 10x più veloce), e Academy per la formazione pratica del team sull'intelligenza artificiale.

Come posso verificare se la mia azienda è pronta per l'AI?

Loomya offre un test gratuito di AI Readiness che analizza i processi aziendali e identifica i top 3 processi automatizzabili, le ore di lavoro risparmiabili e fornisce un report personalizzato. Il test è disponibile su loomya.it/ai-readiness.

In quali settori opera Loomya?

Loomya opera in tutti i settori aziendali in Italia, con particolare focus su automazione dei processi, marketing e comunicazione, e formazione del personale sull'intelligenza artificiale.

Dove si trova Loomya?

Loomya ha sede a Santa Croce sull'Arno (Pisa), in Via del Bosco 276, nel cuore del distretto industriale toscano. Operiamo su tutto il territorio italiano.

Small Language Models: perché il 2026 è l'anno dei modelli AI piccoli, privati e specializzati

La corsa ai modelli giganti sta rallentando

Per quattro anni, la narrativa dell'AI è stata una sola: più grande è meglio. Più parametri, più dati, più GPU, più miliardi di investimento. Nel 2022 era GPT-3 con 175 miliardi di parametri, nel 2023 arrivavano i rumor su GPT-4 con trilioni di parametri, e ogni provider faceva a gara a chi aveva il modello più colossale.

Nel 2026 qualcosa è cambiato. Mentre i modelli di frontiera continuano a crescere, sta emergendo una categoria parallela che per molte aziende italiane rappresenta la vera novità concreta: gli Small Language Models (SLM). Modelli con un numero di parametri tra 1 e 15 miliardi, che possono girare su hardware standard — un server aziendale, in alcuni casi un laptop potente — e che per compiti ben definiti raggiungono performance comparabili o superiori ai modelli giganti, a una frazione del costo.

Questa non è una curiosità tecnica per addetti ai lavori. È una delle trasformazioni più importanti del 2026, e ha conseguenze dirette su come una PMI italiana può — e dovrebbe — integrare l'AI nei propri processi.

Cos'è davvero uno Small Language Model

Uno Small Language Model è un modello linguistico che, a differenza dei giganti cloud, è stato progettato per essere piccolo, veloce e specializzato. La dimensione tipica va dai 2 ai 15 miliardi di parametri, contro i 500+ miliardi dei modelli frontier. Ma l'aspetto interessante non è la dimensione in sé: è cosa diventa possibile quando un modello è piccolo.

Gira in locale: su un server aziendale con GPU consumer, o addirittura su CPU per modelli molto piccoli. I dati non escono mai dall'azienda.
Costa pochissimo per inferenza: 10-100 volte meno di una chiamata a GPT-4 o Claude Opus, a parità di volume di richieste.
Risponde velocissimo: latenze sotto i 100 millisecondi sono normali, contro i 2-8 secondi dei modelli cloud.
Si può specializzare (fine-tuning) sul linguaggio, i dati e i processi specifici della tua azienda in poche ore, non settimane.

La logica è cambiata: non più "un modello enorme che sa tutto", ma "tanti modelli piccoli che sanno perfettamente ciò che serve fare". Un SLM specializzato sulle fatture della tua azienda batte un GPT-4 generalista, e costa venti volte meno.

Perché l'approccio piccolo sta vincendo per le PMI

Negli ultimi dodici mesi, la qualità degli SLM open-source e semi-open è cresciuta in modo impressionante. Famiglie come Phi-3 e Phi-4 di Microsoft, Mistral Small, Llama 3.2 nelle versioni piccole, Gemma 2 di Google, e i modelli specializzati italiani come Velvet di Almawave, mostrano che si può avere AI di qualità aziendale senza dipendere da API americane.

Per una PMI italiana, le conseguenze sono molto concrete:

1. Il problema del costo ricorrente sparisce

Un progetto AI basato su API cloud ha un costo variabile che cresce con l'uso. Più lo usi, più paghi. In alcuni casi funziona, in altri diventa una bomba a orologeria di fatture mensili imprevedibili. Con uno SLM in locale, il costo è quasi tutto iniziale (hardware + tempo di setup) e poi i costi marginali di utilizzo sono minimi. Per volumi di utilizzo medio-alti, il break-even contro il cloud si raggiunge tipicamente in 6-14 mesi.

2. La sovranità sui dati non è più un compromesso

Abbiamo parlato in un articolo precedente delle sfide dell'AI Act e del trasferimento extra-UE dei dati. Con uno SLM in locale, il problema semplicemente non esiste: i documenti, le email, i contratti, le conversazioni con i clienti non lasciano mai il perimetro aziendale. Per settori come sanità, studi legali, consulenza fiscale, pubblica amministrazione, è spesso l'unica strada praticabile.

3. La specializzazione batte la generalità

Un modello generico come GPT-4 sa tutto, ma non sa nulla della tua azienda. Uno SLM specializzato, dopo un fine-tuning su qualche migliaio di esempi interni, capisce il tuo gergo tecnico, segue le tue policy di comunicazione, rispetta il tuo stile aziendale. Per casi d'uso ripetitivi come classificazione documenti, estrazione dati, risposte a email standard, gli SLM specializzati superano costantemente i modelli giganti generalisti nei benchmark reali.

4. L'esperienza utente diventa migliore

Un sistema AI che risponde in 80 millisecondi è percepito come istantaneo. Un sistema che impiega 4 secondi è percepito come lento. La differenza di latenza tra SLM locali e modelli cloud è spesso la differenza tra uno strumento che le persone usano volentieri e uno che evitano.

Dove gli SLM funzionano meglio (e dove no)

Sarebbe sbagliato pensare che gli SLM sostituiscano i modelli giganti in ogni scenario. La realtà è più sfumata. Gli SLM eccellono in compiti verticali, ripetitivi e ben definiti. I modelli frontier rimangono insuperabili per compiti aperti, creativi e che richiedono ragionamento generale.

Casi in cui l'SLM è la scelta giusta

Classificazione automatica di email o ticket in categorie aziendali specifiche.
Estrazione strutturata di dati da fatture, ordini, contratti di un settore specifico.
Chatbot interni per HR, IT, policy aziendali, dove le domande sono ricorrenti e il dominio è chiuso.
Riassunto di conversazioni (call center, customer support) in formato strutturato.
Generazione di risposte standard a domande frequenti di clienti o dipendenti.
Redazione di bozze di documenti ripetitivi (contratti standard, proposte, report).

Casi in cui conviene ancora un modello grande

Ragionamento complesso multistep (analisi strategica, pianificazione articolata).
Scrittura creativa originale di alta qualità.
Code generation su progetti nuovi e complessi.
Task che richiedono conoscenza enciclopedica aggiornata.

La verità che emerge dai progetti reali: quasi nessuna PMI ha bisogno di un solo modello. Ha bisogno di un'architettura ibrida, dove compiti ad alto volume e bassa complessità vanno a uno o più SLM locali, e i compiti rari ma critici vengono orchestrati da un modello frontier cloud.

L'architettura che funziona nel 2026

L'approccio che stiamo implementando in diversi progetti di Systems segue tre livelli:

Livello 1 — SLM locale specializzato. Gestisce il 70-85% del volume quotidiano: classificazioni, estrazioni, risposte standard. Costo per richiesta: quasi zero. Latenza: sotto il secondo. Nessun dato esce dall'azienda.

Livello 2 — Modello mid-size (tipo Mistral Large o Claude Haiku). Interviene quando il modello piccolo non è abbastanza confidente nella risposta, o quando il compito richiede più ragionamento. Copre il 10-25% dei casi.

Livello 3 — Modello frontier (Claude Opus, GPT-4.5, Gemini Ultra). Usato solo per i casi più complessi, le decisioni critiche, le analisi strategiche. Rappresenta il 5% delle chiamate ma spesso il 30-40% del valore aggiunto.

Questa architettura a cascata ottimizza contemporaneamente costi, latenza, qualità e privacy. È il pattern più efficace che abbiamo visto funzionare nel 2026 per aziende dai 20 ai 500 dipendenti.

Cosa serve davvero per partire

Implementare un SLM aziendale nel 2026 è molto meno complesso di quanto fosse diciotto mesi fa. Ma richiede tre cose che una PMI deve mettere in conto:

Un caso d'uso chiaro e misurabile. Non "integriamo l'AI", ma "automatizziamo la classificazione dei ticket di supporto". Casi specifici, metriche chiare, volumi noti.
Un minimo di dati di esempio — tipicamente da 200 a 2.000 esempi reali del compito che si vuole automatizzare. Senza questo, il fine-tuning è cieco.
Un partner con esperienza di fine-tuning e deployment. La parte di training e ottimizzazione non è rocket science, ma ci sono molte trappole: overfitting, scelta delle metriche, gestione dei dati, integrazione con i sistemi esistenti.

L'hardware, sorprendentemente, non è più un collo di bottiglia. Un server aziendale con una GPU professionale (RTX 6000, A6000) costa tra i 5.000 e i 12.000 euro e fa girare perfettamente modelli fino a 14 miliardi di parametri. Per molti casi d'uso, anche un Mac Studio con M3 Ultra è sufficiente. Il costo di ingresso è alla portata di qualsiasi PMI seria.

Un cambio di paradigma, non solo un trend

Il passaggio dagli LLM giganti agli SLM locali specializzati non è un'onda passeggera. È un riallineamento strutturale verso come l'AI verrà integrata nelle aziende nei prossimi dieci anni. Le PMI che lo capiscono oggi stanno costruendo vantaggi difficili da recuperare: costi operativi più bassi, maggiore controllo sui dati, flessibilità tecnica superiore, indipendenza dai fornitori cloud.

Chi continua invece a ragionare solo in termini di "ChatGPT aziendale" o "licenza Copilot" sta perdendo di vista una parte significativa del valore potenziale.

Vuoi capire se nella tua azienda c'è un caso d'uso ad alto volume che potrebbe essere gestito con uno SLM privato e specializzato, invece di pagare ogni mese le API di un provider americano? Fai l'AI Readiness Assessment o parliamone direttamente: analizziamo insieme i tuoi processi, i volumi e i dati, e ti mostriamo con numeri concreti quale strada è la più sensata per la tua realtà.