Nel progetto First Proof nessuna IA riesce a risolvere tutti i dieci problemi inediti. Il miglior risultato arriva dal modello sviluppato dall'Eth di Zurigo
Tutti gli articoli di Italia Mondo
PHOTO
L'intelligenza artificiale deve ancora inseguire i matematici in carne e ossa quando si tratta di affrontare i problemi più complessi. Lo dimostra il risultato del più rigoroso test di matematica finora sottoposto ai principali modelli di IA: nessuno dei quattro sistemi esaminati è riuscito a risolvere correttamente tutti e dieci i quesiti proposti.
A riportare i risultati è la rivista scientifica Nature, che evidenzia come la migliore prestazione sia stata ottenuta dal modello sviluppato dal Politecnico federale di Zurigo (Eth), capace di risolvere sei problemi su dieci. Al secondo posto si è classificato il sistema dell'Università della California di Los Angeles (Ucla), seguito da ChatGpt 5.5 Pro di OpenAI. Ultimo il modello sviluppato dall'Università di Princeton, basato sulla tecnologia Gemini di Google.
L'esame rientra nell'ambito di First Proof, progetto indipendente nato per monitorare l'evoluzione delle capacità dell'intelligenza artificiale nella ricerca matematica. Per garantire la validità della prova, gli organizzatori hanno utilizzato quesiti mai pubblicati in precedenza né nella letteratura scientifica né sul web, riducendo così il rischio che i modelli potessero limitarsi a riprodurre informazioni apprese durante l'addestramento. Le soluzioni sono state successivamente verificate da un gruppo composto da trenta matematici.
Tra le condizioni previste dal test vi era anche quella che i sistemi partecipanti fossero accessibili al pubblico. Questo requisito ha fatto sì che OpenAI fosse l'unica grande azienda tecnologica presente direttamente nella competizione. Due degli altri tre modelli in gara, tuttavia, utilizzavano comunque ChatGpt come base, affiancandolo a sistemi automatici di verifica e miglioramento delle risposte attraverso una serie di interazioni tra chatbot.
Secondo un'analisi preliminare condotta dai ricercatori dell'Eth, le difficoltà incontrate dalle intelligenze artificiali sarebbero riconducibili, in alcuni casi, alla mancanza di un'intuizione decisiva necessaria per arrivare alla soluzione finale. In altri, invece, i modelli avevano individuato l'approccio corretto ma non sono riusciti a cogliere tutti i dettagli richiesti per completare correttamente la dimostrazione matematica.

