Intelligenza artificiale ko nel test di matematica: nessun modello supera tutte le prove

Nel progetto First Proof nessuna IA riesce a risolvere tutti i dieci problemi inediti. Il miglior risultato arriva dal modello sviluppato dall'Eth di Zurigo

Italia Mondo

RedazioneGiornalista

Tag

intelligenza artificiale

Tutti gli articoli di Italia Mondo

PHOTO

L'intelligenza artificiale deve ancora inseguire i matematici in carne e ossa quando si tratta di affrontare i problemi più complessi. Lo dimostra il risultato del più rigoroso test di matematica finora sottoposto ai principali modelli di IA: nessuno dei quattro sistemi esaminati è riuscito a risolvere correttamente tutti e dieci i quesiti proposti.

A riportare i risultati è la rivista scientifica Nature, che evidenzia come la migliore prestazione sia stata ottenuta dal modello sviluppato dal Politecnico federale di Zurigo (Eth), capace di risolvere sei problemi su dieci. Al secondo posto si è classificato il sistema dell'Università della California di Los Angeles (Ucla), seguito da ChatGpt 5.5 Pro di OpenAI. Ultimo il modello sviluppato dall'Università di Princeton, basato sulla tecnologia Gemini di Google.

L'esame rientra nell'ambito di First Proof, progetto indipendente nato per monitorare l'evoluzione delle capacità dell'intelligenza artificiale nella ricerca matematica. Per garantire la validità della prova, gli organizzatori hanno utilizzato quesiti mai pubblicati in precedenza né nella letteratura scientifica né sul web, riducendo così il rischio che i modelli potessero limitarsi a riprodurre informazioni apprese durante l'addestramento. Le soluzioni sono state successivamente verificate da un gruppo composto da trenta matematici.

Tra le condizioni previste dal test vi era anche quella che i sistemi partecipanti fossero accessibili al pubblico. Questo requisito ha fatto sì che OpenAI fosse l'unica grande azienda tecnologica presente direttamente nella competizione. Due degli altri tre modelli in gara, tuttavia, utilizzavano comunque ChatGpt come base, affiancandolo a sistemi automatici di verifica e miglioramento delle risposte attraverso una serie di interazioni tra chatbot.

Secondo un'analisi preliminare condotta dai ricercatori dell'Eth, le difficoltà incontrate dalle intelligenze artificiali sarebbero riconducibili, in alcuni casi, alla mancanza di un'intuizione decisiva necessaria per arrivare alla soluzione finale. In altri, invece, i modelli avevano individuato l'approccio corretto ma non sono riusciti a cogliere tutti i dettagli richiesti per completare correttamente la dimostrazione matematica.

Intelligenza artificiale ko nel test di matematica: nessun modello supera tutte le prove

Giovane 23enne in pericolo di vita trasportata da Lamezia a Bologna con un volo militare

La banca fantasma del narcotraffico che riciclava per la ’ndrangheta: un sistema clandestino da 100 milioni l'anno

Perde il controllo della moto e finisce contro un muro: muore un 24enne a Reggio Calabria

Bambina dimenticata in autogrill sull’A2 e soccorsa dalla Polstrada: la famiglia era diretta in Calabria

San Giovanni in Fiore, Ambrogio cancella le dimissioni: «Nessuna mozione di sfiducia, Barile ora faccia il sindaco»