C’è una nuova intelligenza artificiale generativa e, questa volta, è “madrelingua” Italiana: si chiama Minerva - come la divinità romana della lealtà e della saggezza - ed è la prima famiglia di Large Language Model addestrati da zero su contenuti in lingua italiana. A creare Minerva è stato il gruppo di ricerca Sapienza NLP (Natural Language Processing), guidato da Roberto Navigli, professore ordinario presso il Dipartimento di Ingegneria Informatica, Automatica e Gestionale della Sapienza di Roma. Il gruppo opera nell’ambito di FAIR (Future Artificial Intelligence Research), il progetto triennale di ricerca guidato dal Consiglio Nazionale delle Ricerche che realizza la strategia nazionale sull’intelligenza artificiale grazie ai fondi PNRR. Altra cosa notevole, è Italiano anche il “motore” hardware che dà vita a Minerva, visto che grazie alla collaborazione con CINECA il nuovo LLM può contare sul supercomputer Leonardo.
Per il momento, i modelli Minerva sono stati resi disponibili in anteprima per la sola comunità scientifica del progetto FAIR, ma già nelle prossime settimane è previsto al rilascio pubblico nella loro versione più evoluta, che comprenderà la possibilità di conversare con l'IA in italiano. «La caratteristica distintiva dei modelli Minerva è il fatto di essere stati costruiti e addestrati da zero usando testi ad accesso aperto, al contrario dei modelli italiani esistenti ad oggi, che
sono basati su l'adattamento di modelli come LLaMA e Mistral, i cui dati di addestramento sono tuttora sconosciuti» spiega Roberto Navigli. Vincitore di due prestigiosi grant ERC e fellow dell’ACL, l’associazione internazionale di linguistica computazionale, il professore è stato più volte ospite dell’evento annuale ANSA dedicato l’IA (qui uno dei suoi interventi proprio sul tema LLM); per creare Minerva ha lavorato insieme a due giovani e brillanti ricercatori: Edoardo Barba e Simone Conia.
«Nello specifico, ogni modello Minerva è stato addestrato su un vasto insieme di fonti italiane e inglesi online e documentate - continua Navigli - per un totale di oltre 500 miliardi di parole, l'equivalente di oltre 5 milioni di romanzi. Non solo la trasparenza nell'addestramento dei modelli rafforza la fiducia degli utenti, della comunità scientifica, degli enti pubblici e dell'industria, ma stimola anche continui miglioramenti ed è un primo passo verso processi di verifica rigorosi per garantire la conformità a leggi e regolamenti».
Con una gamma di modelli che variano per dimensione e capacità computazionale e che possono contare su miliardi di parametri, il progetto Minerva vuole fornire fondamenta trasparenti per sistemi di intelligenza artificiale che siano applicabili in diversi campi, dalla comprensione del linguaggio naturale alla generazione di testo, dalla traduzione automatica all'assistenza clienti automatizzata. Questa flessibilità renderà i modelli Minerva una risorsa utile per ricercatori, aziende e sviluppatori interessati a sfruttare le potenzialità dell'intelligenza artificiale per migliorare efficienza e interazione.
«Siamo molto soddisfatti di questo primo grande traguardo raggiunto all’interno della comunità scientifica che si riunisce intorno a FAIR - spiega Giuseppe De Pietro, Presidente della Fondazione FAIR - Crediamo molto nella linea di ricerca che porta verso la nascita di un large language model italiano e per questo stiamo investendo le risorse del PNRR su questo progetto, che rappresenta un primo passo strategico di grande rilevanza».
«Questo importante risultato, unico in Italia, conferma l’eccellenza scientifica del Dipartimento di Ingegneria Informatica, Automatica e Gestionale (DIAG) di Sapienza, in particolare nel settore dell’Intelligenza Artificiale, in cui possiamo vantare un nutrito gruppo di ricercatori e ricercatrici di assoluta eccellenza a livello nazionale e internazionale», a detto invece Tiziana Catarci, direttrice del DIAG.
Un ulteriore elemento di novità di questa iniziativa è l'impegno del gruppo Sapienza NLP nella creazione di nuovi benchmark di valutazione, strumenti sviluppati ad hoc per testare le capacità dei modelli linguistici su larga scala di rispettare e valorizzare anche le sfumature culturali e linguistiche della lingua italiana. Infine, merita di essere sottolineato il fatto che il progetto rilascerà una documentazione tecnica completa per condividere il processo ingegneristico e le scoperte scientifiche e poter replicare l’implementazione e l’addestramento dei modelli.
*Giornalista, esperto di innovazione e curatore dell’Osservatorio Intelligenza Artificiale ANSA.it
Riproduzione riservata © Copyright ANSA