Onlangs maakte Google DeepMind bekend dat zijn kunstmatige intelligentie (AI) modellen AlphaProof en AlphaGeometry 2 indrukwekkende resultaten hebben behaald bij het oplossen van geavanceerde wiskundige problemen. Beide modellen verschillen in hoe ze zijn ingericht. Zo is AlphaProof 2 een neuro-symbolisch systeem en is Alphaproof getraind door middel van reinforcement learning. Ondanks de verschillen behalen beide successen.
Tijdens de International Mathematical Olympiad (IMO) 2024 wisten de systemen vier van de zes problemen op te lossen, een prestatie die gelijkstaat aan een zilveren medaille. Het resultaat is een primeur voor AI systemen, aangezien de IMO een van de meest prestigieuze jaarlijkse competities is voor jonge wiskundigen. De competitie bevatte moeilijke vragen in onder andere algebra, meetkunde en getaltheorie.
Oplossingen
De AI systemen kregen wel wat hulp. De problemen moesten namelijk handmatig vertaald worden naar formele wiskundige taal, zodat Alpha AlphaProof en AlphaGeometry ze konden begrijpen. AlphaProof loste twee algebraïsche problemen en een getaltheorie probleem op, inclusief het moeilijkste probleem van de competitie. AlphaGeometry 2 slaagde erin een meetkundig probleem binnen 19 seconden op te lossen. De oplossingen werden vervolgens geëvalueerd door prominente wiskundigen zoals Prof Sir Timothy Gowers en Dr Joseph Myers.
Verbeteringen
De ontwikkelaars van de twee AI systemen blijven verschillende benaderingen verkennen om het wiskundig vermogen verder te verbeteren. Experimenten met natuurlijke taal redeneringssystemen tonen tot nu toe veelbelovende resultaten zonder de noodzaak van formele taalvertaling.
Google verbetert robotnavigatie met Gemini 1.5 Pro
Het DeepMind team van Google experimenteert er ook op los met het laatste Large Language Model (LLM) van hetxq bedrijf, Gemini 1.5 Pro. Zo heeft het model aanzienlijke vooruitgang geboekt in robotnavigatie. Het AI model maakt natuurlijke communicatie met robots mogelijk, wat de interactie en taakuitvoering aanzienlijk verbetert.
Onderzoekers laten robots wennen aan nieuwe omgevingen door video’s van huizen of kantoren te bekijken, waarna de robots opdrachten kunnen uitvoeren op basis van deze waarnemingen. Bij tests leidde dit tot een slagingspercentage van 90% bij meer dan 50 verschillende gebruikersinstructies.