Intelligenza artificiale, l’era dei foundation model

Indice degli argomenti

Generative pre-trained transformer, in breve GPT, sigla che è divenuta nota ai tanti nelle ultime settimane con l’avvento di strumenti di intelligenza artificiale realizzati da OpenAI che li ha resi gratuitamente disponibili per un po’. GPT-3 è un cosiddetto ‘foundation model’ ed è quello applicato da ChatGPT appunto, insieme a lui ci sono altri foundation model come Bert o Dall-E che genera automaticamente immagini sulla base di un testo descrittivo, insomma stiamo assistendo a un momento evolutivo importante dell’intelligenza artificiale Del tema ne parliamo in questo articolo insieme a Maurizio de Gregorio che è ingegnere e innovatore oltre che direttore generale di Mamacrowd e con il quale avevamo già realizzato una intervista per presentare il Covindex, l’indice che egli aveva sviluppato per tenere sotto controllo l’andamento della diffusione dei contagi covid-19 . I foundation model sono sostanzialmente computer molto potenti che insieme a grandissime masse di dati lavorano per fare training dell’intelligenza artificiale, e per grandissime masse di dati si intende l’intero web più l’intera biblioteca di libri che sono liberi da diritti, utilizzando reti neurali, il progetto GPT esiste da 3, 4 anni e per essere sviluppato richiede risorse economiche ingenti, pertanto i principali progetti sono in mano alle big tech che utilizzano infrastrutture che non sono di dominio pubblico e solo OpenAI che è nata nel 2015 (la quale inizialmente avrebbe dovuto essere no-profit ma poi la strategia è cambiata) è quella che consente a tutti noi di potere accedere alle potenzialità di questa evoluzione tecnologica.

GPT e i foundation model

La cosa fondamentale da tenere presente è che questa tecnologia si sta dimostrando molto più efficace e potente delle previsioni, inizialmente è stata trattata come un esperimento, quasi come un gioco, ma ora che ha iniziato a dimostrare le sue effettive potenzialità l’approccio è cambiato soprattutto è cambiato il modo in cui si sta iniziando a pensare di utilizzare tali sistemi. Il GPT-3 è addestrato su 175 miliardi di parametri a livello di training generico ma è per esempio pensabile di fare del training specifico e quindi addestrare il sistema su ambiti specifici sui quali può sviluppare un ulteriore livello di potenzialità e di precisione, si pensi a contesti come quello legale dove per esempio si potrà disporre di una sorta di avvocato personale capace di analizzare e generare contratti per le nostre diverse attività, quello della salute dove si potrà avere accesso a un medico di base personale che conosce nel dettaglio la nostra storia sanitaria personale e che ha accesso a informazioni riguardanti milioni di pazienti e tutte le specializzazioni, se poi si associa a dispositivi indossabili per il controllo dei parametri l’analisi medica può essere ancora più completa e in tempo reale, quello dell’education dove sarà possibile realizzare e adattare il percorso formativo alle specifiche capacità cognitive di ogni individuo rendendo la formazione altamente personalizzata e sempre più aderente alle effettive capacità. Inoltre va tenuto presente che è in arrivo GPT-4 della quale già si anticipa che appare essere ben oltre le aspettative con un incremento tra le 500 e le 1000 volte in termini di parametri rispetto a GPT-3. Se GPT-3 è un primo assaggio, un primo sguardo su un nuovo mondo, GPT-4 è ciò che porterà il vero cambiamento e sarà solo un altro passo di un percorso continuo perché poi sarà la volta di GPT-5 e generazioni successive che giungeranno con ritmi sempre più serrati visto che, sappiamo, il processo di evoluzione è esponenziale e non lineare.

L’AI generativa

L’elemento dirimente è la capacità da parte dell’AI di generare dei contenuti . Qui va fatta una rapida riflessione sulla differenza tra capacità generativa e creatività: non è possibile definire l’AI creativa in quanto il modello con cui opera è ancora diverso da quello con cui opera la mente umana che conserva quindi la sua unicità in relazione alla capacità creativa, l’AI generativa attuale non ha la capacità di comprendere il significato profondo dei contenuti che sta generando o di avere intenzioni creative. La creatività umana, al contrario, implica l’utilizzo della fantasia e dell’immaginazione per creare qualcosa di nuovo e originale. La creatività umana può essere influenzata da esperienze, emozioni e pensieri personali, cose che un’ AI generativa non può avere. Va però sottolineato che i founding model consentono di sviluppare degli strumenti di AI che sono capaci di generare risposte articolate e di produrre risultati che non sono sofisticati solo dal punto di vista del contenuto ma anche da quello del processo di causa-effetto. 

Le questioni etiche 

Tutto ciò ci porta anche a dover inserire nell’equazione un ulteriore elemento, quello legato alle questioni etiche. Esse si dipanano su più piani: c’è il tema del fatto che la gran parte di queste ricerche sia in mano a i privati per esempio, come abbiamo visto servono ingenti capitali e al momento solo alcune organizzazioni private come appunto le big tech dispongono di tali risorse; c’è poi il tema della sostituzione, delle macchine che prendono il posto degli umani per svolgere un crescente numero di compiti, c’è il tema della messa a terra delle capacità generative, per esempio GPT-4 è in grado di generare nuove molecole e quindi nuove medicine potenzialmente; c’è il rischio dei bias in fase di addestramento, della mancanza di correttivi che fanno sì che non sia politically correct, del pensiero unico che omogenizza le posizioni e la cultura. Per tutti questi motivi sarebbe opportuno che si stabiliscano delle policy di trasparenza su eventuali algoritmi correttivi che vengono usati, o quali limitazioni al sapere vengono applicate. Va stabilita la tipologia di governance che deve essere applicata per definire chi è abilitato e chi no alle risposte complete.

Le opportunità

E poi ci sono le opportunità, comprese quelle di business. Per esempio le aziende non potranno fare a meno di considerare l’adozione di queste tecnologie in misura sempre più diffusa e profonda e per farlo avranno bisogno di esperti e di chi sia in grado di procedere all’addestramento, in questo caso verticale sulle esigenze delle singole imprese, e questa è certamente una grande opportunità che si svilupperà sia nella direzione dell’addestramento dell’AI stessa ma anche nella ottimizzazione del patrimonio informativo, dei dati dell’azienda a ogni livello che divengono ancora più importanti. E poi serve lavorare sui talenti, le Università devono accelerare il processo di sviluppo di competenze in questo senso e infine c’è il ruolo dell’Europa che fino a ora appare essere marginale ma che deve diventare chiave, serve che l’Europa sviluppi i suoi foundation model che faccia leva sulle sue risorse tecnologiche, finanziarie, informative, come per esempio la rete di supercomputer , e che dia così piena concretezza  al cosiddetto EU Artificial Intelligence Act . (L’immagine a corredo di questo articolo è stata generata da Dall-E)

© RIPRODUZIONE RISERVATA

    Iscriviti alla newsletter