I colossi tecnologici Alphabet, tramite Google DeepMind, e OpenAI hanno annunciato un risultato storico: i loro modelli di intelligenza artificiale hanno conquistato la medaglia d’oro alle Olimpiadi Internazionali di Matematica (Imo), la prestigiosa competizione mondiale per studenti delle scuole superiori. Si tratta di un punto di svolta nelle capacità matematiche dell’intelligenza artificiale, un passo cruciale verso sistemi in grado di rivaleggiare con l’intelligenza umana.
Per la prima volta, l’intelligenza artificiale ha superato la soglia necessaria per l’oro alle Olimpiadi, risolvendo cinque dei sei problemi proposti. Entrambi i modelli, sviluppati da Google e OpenAI, hanno utilizzato un approccio innovativo basato su sistemi di ragionamento generale che elaborano concetti matematici in linguaggio naturale, al contrario dei metodi tradizionali basati su linguaggi formali. Google DeepMind ha collaborato direttamente con l’Imo, sottoponendo i propri modelli alla valutazione ufficiale del comitato organizzatore. OpenAI, invece, non ha partecipato formalmente, ma sabato ha reso noto che il suo modello sperimentale ha ottenuto un punteggio da medaglia d’oro, certificato da tre medagliati Imo indipendenti.
Junehyuk Jung, docente di matematica alla Brown University e ricercatore ospite presso Google DeepMind, ha dichiarato a Reuters: «Quando riusciremo a risolvere complessi problemi di ragionamento in linguaggio naturale, si apriranno prospettive di collaborazione senza precedenti tra intelligenza artificiale e matematici». Secondo Jung, entro un anno l’intelligenza artificiale potrebbe già supportare i matematici nella risoluzione di problemi di ricerca complessi.
Il risultato di OpenAI si basa su un modello sperimentale che sfrutta un potenziamento del “tempo di calcolo in fase di test”, che consente al sistema di riflettere più a lungo ed eseguire simultaneamente molteplici linee di ragionamento grazie a un’enorme capacità computazionale. Noam Brown, ricercatore di OpenAI, ha descritto il processo come «estremamente costoso», senza rivelare i dettagli economici. I ricercatori ritengono che questa dimostrazione confermi la capacità dell’intelligenza artificiale di eccellere nel ragionamento avanzato, con possibili applicazioni anche in fisica. Un entusiasmo condiviso anche dai ricercatori di Google, che vedono in questi modelli un potenziale per affrontare questioni scientifiche complesse, come ha ricordato Jung, vincitore dell’Imo nel 2003.
Alla 66ª edizione delle Olimpiadi Internazionali di Matematica, tenutasi sulla Sunshine Coast, in Queensland (Australia), hanno gareggiato 630 studenti e circa l’11% ha conquistato la medaglia d’oro. L’anno scorso, Google DeepMind aveva ottenuto un punteggio da argento con modelli specializzati in matematica. Quest’anno, invece, ha utilizzato Gemini Deep Think, un modello di ragionamento generale presentato a maggio alla conferenza sviluppatori di Google. A differenza dei metodi precedenti, che richiedevano linguaggi formali e calcoli prolungati, questo modello ha risolto i problemi in linguaggio naturale entro il limite di 4,5 ore previsto dalla competizione.
Anche OpenAI ha sviluppato un modello sperimentale per l’Imo, come annunciato dal ricercatore Alexander Wei su X. Tuttavia, l’azienda non prevede di rilasciare a breve un sistema con queste capacità matematiche. Quest’anno, per la prima volta, l’Imo ha collaborato ufficialmente con alcuni sviluppatori di intelligenza artificiale, che da anni testano i loro modelli in competizioni di alto livello. I giudici hanno certificato i risultati delle aziende partecipanti, tra cui Google, autorizzandone la pubblicazione il 28 luglio. «Abbiamo rispettato la richiesta del comitato Imo di condividere i risultati solo dopo la verifica da parte di esperti indipendenti, per garantire che gli studenti ricevessero il giusto riconoscimento», ha affermato Demis Hassabis, amministratore delegato di Google DeepMind, su X lunedì. OpenAI ha anticipato la pubblicazione sabato, dichiarando di aver ricevuto il permesso da un membro del comitato Imo dopo la cerimonia di chiusura. Gregor Dolinar, presidente del comitato, ha confermato a Reuters che lunedì le aziende sono state autorizzate a rendere noti i risultati.