Но тъй като не всеки може да събере известни учени, а олимпиадите са веднъж на година, математиците и AI компаниите насочиха вниманието си към 1 100-те задачи, измислени от Пал Ердьош, повечето от които остават нерешени. Първите съобщения за успех се оказаха подвеждащи, защото бяха свързани с откриването на съществуващи решения, но през тази година се появиха и оригинални правилни отговори. Един от най-известните математици Терънс Тао систематизира приноса на AI за решаването на задачите на Ердьош (https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems), но в в подкаста на Дуоркеш Пател (https://www.dwarkesh.com/p/terence-tao) той заяви, че моделите са решили по-лесните задачи и след това е настъпил застой.
Подобно усещане се появи и след първото издание на First Proof (https://1stproof.org/), конкурс с десет нови задачи, за решаването на които трябва да се използва ИИ. Организаторите публикуваха отговорите,получени с AI, от които само два са били правилни и са напомняли за математика от 19 век, явно резултат от материалите, които са използвани за обучение на моделите.
Както обаче често става в последно време, в момента, когато започва да се обсъжда дали ИИ е достигнал предела си в някаква област, се появи новина, оборваща това – за първи път AI реши оригинала задача на Epoch AI (https://epochai.substack.com/p/first-ai-solution-on-frontiermath), макар и в най-незначителната категория.
Бъдещото използване на ИИ в математиката няма да мине без българска следа – проектът на INSAIT и ETH Math Arena (https://matharena.ai/) проверява независимо моделите като последният тест Broken Arhiv дава правдобно звучащи, но грешни, определения за проверка на алгоритмите. Засега резултатите не са впечатляващи (GPT-5.4 (xhigh) води с 39%), но предстои да видим какво ще покажат следващите версии на моделите.