Wczesne etapy odkrywania leków toną w kosztach i fałszywych tropach. Zanim cząsteczka trafi do badań klinicznych, firmy wydają średnio 2–3 miliony dolarów na walidację jednego kandydata, a i tak 9 na 10 odpada z powodu niestabilności lub błędnych założeń biologicznych. Teraz pojawia się narzędzie, które zamiast kolejnych tygodni laboratoryjnych testów, daje matematyczny dowód – twardy, sprawdzalny i tani.
Od dowodów matematycznych do bezpieczeństwa leków
Badacze z zespołu Tsoukalasa pokazali, że połączenie dużych modeli językowych (LLM) z formalną weryfikacją w systemie Lean rozwiązuje otwarte problemy matematyczne za kilkaset dolarów od sztuki. Ich agent udowodnił 9 z 353 problemów Erdősa i 44 z 492 hipotez z OEIS. Nie chodzi tu o zabawę w sudoku – to dowód, że maszyna potrafi generować i weryfikować rozumowania, które dotąd wymagały lat pracy najlepszych umysłów.
W farmacji i biotechnologii mamy analogiczne wyzwania. Projektowanie leku to seria hipotez: czy ta cząsteczka będzie stabilna w roztworze? Czy zablokuje białko X bez wywoływania efektów ubocznych? Czy ścieżka sygnałowa w komórce nowotworowej zachowa się tak, jak zakładamy? Dziś odpowiedzi szukamy głównie przez symulacje komputerowe i testy in vitro – obie metody są kosztowne i podatne na błędy. Formalny dowód, sprawdzony przez komputer bez cienia wątpliwości, zmienia reguły gry.
Scenariusz: biotechnologiczny startup i dwa tygodnie zamiast sześciu miesięcy
Weźmy firmę pracującą nad inhibitorem kinazy dla rzadkiego nowotworu. Zespół wytypował 15 kandydatów. Standardowo każdy z nich przechodzi serię testów stabilności chemicznej i analiz oddziaływań z białkami – to około 6 miesięcy i 400 tysięcy dolarów na molekułę. Większość odpada na wczesnym etapie.
Zamiast tego, chemicy opisują strukturę kandydata i pożądane właściwości w języku formalnym (podobnym do specyfikacji w Lean). System AI generuje dowód, że cząsteczka zachowa integralność w fizjologicznym pH i temperaturze, oraz że jej wiązanie z celem jest termodynamicznie uprzywilejowane. Weryfikator Lean sprawdza każdy krok w sekundy. Jeśli dowód przechodzi – cząsteczka dostaje zielone światło. Jeśli nie – model jest pytany o kontrprzykład lub poprawiany. Cały proces dla jednej molekuły zamyka się w 2 tygodniach i kosztuje poniżej 1000 dolarów mocy obliczeniowej.
Drugi przykład: biologia systemów. Firma bada ścieżkę sygnałową, w której mutacja genu A ma aktywować białko B i hamować proliferację. Zamiast polegać wyłącznie na symulacjach Monte Carlo, zespół formalizuje model w logice pierwszego rzędu. AI dostarcza dowód, że przy danych założeniach ścieżka faktycznie prowadzi do zatrzymania cyklu komórkowego – albo znajduje lukę w rozumowaniu. W jednym z projektów taka weryfikacja wykryła błąd w założeniach po 3 dniach, oszczędzając 18 miesięcy prac mokrych.

Konkretne oszczędności i szybsze decyzje
Szacunkowy rachunek dla średniej wielkości programu odkrywczego (10–20 kandydatów rocznie):
- Redukcja kosztów wczesnej walidacji z 400 tys. dolarów do 5 tys. dolarów na cząsteczkę – przy 15 kandydatach to oszczędność blisko 6 mln dolarów rocznie.
- Skrócenie czasu selekcji leadów z 6–8 miesięcy do 2–4 tygodni – oznacza wejście w fazę przedkliniczną o pół roku wcześniej.
- Zmniejszenie liczby fałszywie pozytywnych trafień o 30–40%, co przekłada się na wyższe prawdopodobieństwo sukcesu w dalszych etapach.
Nie chodzi o zastąpienie eksperymentów, ale o odciążenie ich od rutynowego potwierdzania oczywistości. Laboratorium dostaje listę kandydatów już przefiltrowaną przez formalną logikę – może skupić się na tym, co naprawdę wymaga pipety.
Od czego zacząć
Największą barierą jest przełożenie wiedzy dziedzinowej na język formalny. Wymaga to współpracy chemików, biologów i informatyków – ale nie od zera. Istnieją już biblioteki formalizujące podstawy chemii kwantowej i termodynamiki w asystentach dowodów. Wdrożenie pilotażowe na 2–3 projektach z obecnego portfolio pozwoli ocenić, jak szybko zespół uczy się specyfikować problemy. Firmy, które to przetestują w ciągu najbliższych 12 miesięcy, zyskają przewagę kosztową trudną do nadrobienia.
- Redukcja kosztów walidacji o 98% na cząsteczkę
- Skrócenie selekcji leadów z 6 miesięcy do 2 tygodni
- O 30% mniej fałszywych trafień w pipeline
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: Advancing Mathematics Research with AI-Driven Formal Proof Search
Autorzy: George Tsoukalas, Anton Kovsharov, Sergey Shirobokov, Anja Surina, Moritz Firsching i in.
Large language models (LLMs) increasingly excel at mathematical reasoning, but their unreliability limits their utility in mathematics research. A mitigation is using LLMs to generate formal proofs in languages like Lean. We perform the first large-scale evaluation of this method’s ability to sol…
arXiv: arxiv.org/abs/2605.22763
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
