Matematyk za grosze: jak AI udowadnia twierdzenia, których ludzie nie potrafili

22 maja, 2026

Możliwość komentowania została wyłączona

Wyobraź sobie, że za kilkaset dolarów można rozwiązać problem matematyczny, nad którym przez lata głowili się najtężsi umysły. Brzmi jak science fiction? Zespół naukowców udowodnił, że to możliwe - ich agent oparty na dużych modelach językowych samodzielnie rozprawił się z dziewięcioma otwartymi problemami z kolekcji Erdősa i czterdziestoma czterema hipotezami z OEIS.

Czym są problemy Erdősa i OEIS?

Paul Erdős, węgierski matematyk, za rozwiązanie swoich problemów oferował symboliczne nagrody - od 25 dolarów za łatwiejsze po kilka tysięcy za najtrudniejsze. Jego lista 353 nierozwiązanych zadań z kombinatoryki, teorii liczb i innych dziedzin od dekad pozostaje otwarta. Każdy z tych problemów to konkretne pytanie, na które nikt dotąd nie znalazł odpowiedzi.

OEIS, czyli On-Line Encyclopedia of Integer Sequences, to internetowa baza ciągów liczb całkowitych. Zawiera tysiące ciągów i przypuszczeń na ich temat - hipotez, które ktoś sformułował, ale nigdy nie udowodnił. Większość wpisów to nierozstrzygnięte pytania matematyczne.

Formalny dowód - matematyka bez cienia wątpliwości

Zwykły dowód matematyczny może zawierać luki - recenzenci je wyłapują, ale ryzyko ludzkiego błędu zawsze istnieje. Formalny dowód jest zapisany w języku, który rozumie komputer, i każdy krok jest mechanicznie sprawdzany. To jak kod programu - kompilator albo go przyjmuje, albo wskazuje błędy.

Lean to właśnie taki system. To funkcjonalny język programowania i asystent dowodów stworzony przez Microsoft Research. Zapisujesz twierdzenie jako cel, budujesz dowód krok po kroku, a system na bieżąco potwierdza poprawność. Jeśli dowód przejdzie - twierdzenie jest udowodnione.

Nasz najbardziej zaawansowany agent samodzielnie rozwiązał 9 z 353 otwartych problemów Erdősa przy koszcie rzędu kilkuset dolarów na problem, udowodnił 44 z 492 hipotez OEIS i jest obecnie wdrażany w badaniach z kombinatoryki, optymalizacji, teorii grafów, geometrii algebraicznej i optyki kwantowej.

Tsoukalas i in.

Streszczenie artykułu

Agent AI w akcji: generowanie i weryfikacja

Naukowcy połączyli duży model językowy (LLM) z Leanem. Agent dostaje problem sformułowany w języku Lean, a LLM generuje kandydata dowodu - tak, jakby pisał kod. Lean natychmiast sprawdza poprawność. Jeśli dowód jest błędny, system analizuje błędy i daje LLM-owi wskazówki do poprawy. Proces powtarza się aż do sukcesu lub wyczerpania budżetu obliczeniowego.

Przetestowano dwa typy agentów. Prostszy - który naprzemiennie prosi LLM o dowód i weryfikuje go Leanem - oraz bardziej wyrafinowany, opisany w szczegółach w artykule. Oba rozwiązały te same problemy Erdősa, ale przy najtrudniejszych zadaniach prostszy agent był droższy. Projekt agenta wpływa więc na koszty, gdy rośnie trudność zadań.

Wyniki: 9/353 i 44/492 - liczby, które zmieniają zasady gry

Agent rozwiązał 9 z 353 otwartych problemów Erdősa - to nowe twierdzenia, których wcześniej nikt nie udowodnił. Koszt na problem wyniósł kilkaset dolarów. W przypadku OEIS skuteczność była wyższa proporcjonalnie: 44 z 492 hipotez zostało udowodnionych.

Sukcesy dotyczą kombinatoryki, optymalizacji, teorii grafów, geometrii algebraicznej i optyki kwantowej. Zespół już wdraża tę metodę w badaniach w tych obszarach.

Co to oznacza dla matematyki i biznesu?

Dla matematyków to narzędzie, które odciąża od żmudnego sprawdzania szczegółów i może podpowiadać nieoczywiste kierunki rozumowania. Dzięki niskiemu kosztowi nawet mniejsze zespoły mogą testować hipotezy, na które wcześniej nie było budżetu.

W przemyśle formalne dowodzenie może zmienić weryfikację oprogramowania krytycznego - systemów bankowych, sterowników samochodów autonomicznych czy protokołów kryptograficznych. Zamiast polegać na testach, można matematycznie udowodnić, że program działa poprawnie w każdych warunkach. Przy koszcie kilkuset dolarów za dowód upowszechnienie takich metod staje się realne.

9 z 353 otwartych problemów Erdősa rozwiązanych autonomicznie przez agenta AI.
Koszt na problem rzędu kilkuset dolarów - o rzędy wielkości taniej niż tradycyjne badania.
44 z 492 hipotez OEIS udowodnionych formalnie w systemie Lean.
Prosty agent naprzemienny osiągnął te same sukcesy, ale był droższy przy trudniejszych zadaniach.
Metoda wdrażana w kombinatoryce, optymalizacji, teorii grafów, geometrii algebraicznej i optyce kwantowej.

Praktyczne zastosowania

Aby lepiej zrozumieć opisywaną innowację, przygotowaliśmy cztery przykłady praktycznego zastosowania tej technologii w różnych branżach:

AI jako cyfrowy asystent w projektowaniu leków opartych na dowodach

Wczesne etapy odkrywania leków toną w kosztach i fałszywych tropach. Zanim cząsteczka trafi do badań

Nie do zhakowania: formalne dowody jako fundament bezpieczeństwa nowej generacji

W 2023 roku luka w implementacji protokołu TLS pozwoliła na przechwycenie danych z serwerów kilku ba

Optymalizacja bez kompromisów: jak agent AI udowadnia doskonałość łańcucha dostaw

W globalnej logistyce codziennie planuje się trasy dla tysięcy pojazdów. Używane algorytmy heurystyc

Koniec z bugami: matematyczna gwarancja poprawności kodu w systemach 'life-critical'

Wypadek autonomicznego auta, awaria rozrusznika serca czy błędne odczyty z systemu kontroli lotu. Ka

Podsumowanie

Opisana metoda udowadnia, że AI może samodzielnie rozwiązywać nierozwiązane problemy matematyczne za ułamek kosztów tradycyjnych badań. Już teraz znajduje zastosowanie w kombinatoryce, optymalizacji, teorii grafów, geometrii algebraicznej i optyce kwantowej. Dla biznesu oznacza to realną ścieżkę do taniej, matematycznie gwarantowanej poprawności oprogramowania krytycznego - od systemów bankowych po autonomiczne pojazdy.

Metryka artykułu źródłowego

Tytuł oryginalny: Advancing Mathematics Research with AI-Driven Formal Proof Search

Autorzy: George Tsoukalas, Anton Kovsharov, Sergey Shirobokov, Anja Surina, Moritz Firsching, Gergely B'erczi, Francisco J. R. Ruiz, Arun Suggala, Adam Zsolt Wagner, Eric Wieser, Lei Yu, Aja Huang, Mikl'os Z. Horv'ath, Andrew Ferrauiolo, Henryk Michalewski, Codrut Grosu, Thomas Hubert, Matej Balog, Pushmeet Kohli, Swarat Chaudhuri

Data publikacji: 22 maja 2026

arXiv: arxiv.org/abs/2605.22763

PDF: https://arxiv.org/pdf/2605.22763.pdf

Napisanie tego artykułu zostało wspomagane przez sztuczną inteligencję. Treść opiera się na oryginalnym artykule naukowym, a jej dokładność została zweryfikowana automatycznie.