Translated, specializzata nello sviluppo di soluzioni linguistiche basate sull’intelligenza artificiale, e Cineca, uno dei più grandi centri di calcolo al mondo, annunciato l’avvio del progetto di ricerca per creare un’intelligenza artificiale in grado di tradurre come i migliori traduttori professionisti.
Il progetto rappresenta un passo avanti nell’evoluzione delle tecnologie di traduzione e nell’accessibilità globale delle lingue e mira ad allenare il modello linguistico più avanzato sviluppato da Translated su un dataset di traduzione unico al mondo, utilizzando Leonardo, il settimo supercomputer più potente al mondo, il terzo in Europa, gestito da Cineca presso il Tecnopolo di Bologna (nella foto). Il risultato sarà il modello linguistico più avanzato al mondo, che nella combinazione linguistica italiano-inglese e inglese-italiano verrà rilasciato open-source e open weights, segnando così un passo significativo ulteriore verso la realizzazione di un traduttore universale.
Cineca sosterrà l’addestramento del modello linguistico di Translated con 10 milioni di ore di training su GPU. Questa enorme capacità di calcolo consentirà un’accelerazione significativa nell’addestramento del modello, garantendo un rapido avanzamento. Il set di dati fornito da Translated è il risultato di 15 anni di meticolosa raccolta, e si distingue nettamente dai dataset comunemente utilizzati perché include documenti interi con ampio contesto, ovvero traduzioni errate, revisioni e ragionamenti di traduttori e revisori in caso di disaccordo. È proprio questo patrimonio di dati ricchi e sofisticati che oggi consente a Translated, con l’aiuto di Cineca, di addestrare un modello di intelligenza artificiale capace di una comprensione profonda delle lingue.
“Il linguaggio ha guidato l’evoluzione umana, permettendo di capirci, collaborare per un futuro migliore e svilupparci più velocemente di qualsiasi altra specie – afferma in una nota Marco Trombetti, CEO di Translated – Unendo la nostra esperienza di 25 anni di ricerca sull’intelligenza artificiale con la capacità computazionale gestita da Cineca, creeremo un’IA che avrà un impatto molto forte sulla vita di milioni di persone e che un giorno consentirà a chiunque di comprendere e farsi comprendere nella propria lingua. Insieme, stiamo compiendo un passo decisivo verso la prossima fase dell’evoluzione umana”.
“Siamo entusiasti di essere impegnati in un progetto che compie un passo così significativo nella ricerca sull’intelligenza artificiale applicata al linguaggio, a beneficio della comunità nazionale e globale – dice Francesco Ubertini, presidente di Cineca – Questa collaborazione è un esempio di come il supercalcolo possa guidare l’innovazione e avere un grande impatto sociale e portare benefici alle persone a livello globale”.
Il progetto di ricerca, presentato durante un evento intitolato The Power of Languages – Toward the Universal Translator, si inserisce nella scia di collaborazioni pubblico-private con università e centri di ricerca sostenute da grant dell’Unione Europea a cui Translated ha partecipato sin dai primi anni duemila e che hanno permesso di sviluppare ogni volta tecnologie sempre più avanzate a supporto della traduzione, e di metterle a disposizione della società.
Il modello linguistico che verrà allenato dal supercomputer Leonardo è stato sviluppato da Translated utilizzando un’innovativa tecnica di chain-of-thought e già testato con un ristretto gruppo di aziende in contesti di produzione reali nel corso del 2024, ha dimostrato la capacità di tradurre dati conversazionali con un tasso di errori, meno di tre su mille parole, inferiore a quelli commessi dai traduttori professionisti sullo stesso contenuto, e quattro volte inferiore rispetto ai sistemi di traduzione automatica più avanzati. Grazie alla potenza di calcolo di Leonardo, Translated e Cineca prevedono di ridurre il margine di errore fino a un errore ogni mille parole, raggiungendo un’accuratezza comparabile al primo percentile dei migliori traduttori professionisti.
Dopo il rilascio iniziale per le combinazioni italiano-inglese e inglese-italiano, Translated ha pianificato estendere il nuovo modello a tutte le 200 lingue supportate dalla sua attuale IA, ampliando ulteriormente l’impatto globale dello sviluppo tecnologico.
© RIPRODUZIONE RISERVATA