Gdy algorytm tradingowy myli korelację z logiką, straty są natychmiastowe. W ubiegłym roku jeden z funduszy ilościowych odnotował 150-milionowy spadek wartości portfela w ciągu godziny, bo jego model neuronowy podjął serię transakcji wewnętrznie sprzecznych – coś, czego nie wychwycił żaden system kontroli ryzyka. Najnowsze badania potwierdzają, że sieci neuronowe z zasady nie nauczą się ścisłego rozumowania, a to otwiera przestrzeń dla nowej klasy narzędzi: audytorów logicznych sygnałów ML.
Dlaczego model ML nie myśli, nawet jeśli zarabia
Badanie Donga, Jamnik i Liò (2024) wykazało fundamentalne ograniczenie uczenia nadzorowanego w zadaniach wnioskowania sylogistycznego. Dane treningowe nie są w stanie rozróżnić wszystkich 24 typów poprawnych schematów logicznych. Co gorsza, mapowanie end-to-end wprowadza sprzeczne cele treningowe: sieć jednocześnie ma rozpoznawać wzorce i zachowywać rygor logiczny, a to się wyklucza. Eksperymenty z Euler Net – architekturą zaprojektowaną specjalnie do zadań logicznych – pokazały, że nawet ona nie osiąga pełnej poprawności. Modele językowe, takie jak ChatGPT, zmieniają odpowiedzi w zależności od powierzchniowej formy zapisu tych samych danych: słowami, symbolami czy losowymi ciągami. Autorzy konkludują, że skalowanie nie rozwiąże tego problemu.
Dla tradingu oznacza to tyle, że każdy model oparty na głębokim uczeniu może rekomendować decyzje sprzeczne z elementarnymi zasadami ekonomicznymi – i nie ma mechanizmu, który by to automatycznie wykrył. Sygnał ‘kup akcje XYZ, a jednocześnie sprzedaj kontrakty terminowe na ten sam instrument bez uzasadnienia arbitrażowego’ jest logiczną herezją, ale sieć widzi tylko korelację z danymi z przeszłości.
Scenariusz: gdy rynek zmienia reżim, a model nie rozumie
Weźmy fundusz hedgingowy zarządzający 2 miliardami dolarów, który używa zespołu modeli LSTM i transformerów do tradingu na rynku walutowym. Przez 18 miesięcy algorytmy przynosiły stabilne zyski, ucząc się, że po publikacji danych o inflacji CPI dolar umacnia się wobec euro. 12 czerwca 2025 roku Fed podejmuje decyzję o obniżce stóp, mimo wysokiej inflacji, powołując się na ryzyko recesji. Model, opierając się na wzorcach historycznych, ignoruje mechanizm parytetu stóp procentowych i generuje lawinę zleceń: długie pozycje na EUR/USD w oparciu o słabnącego dolara, ale jednocześnie krótkie na opcjach walutowych, bo w przeszłości opcje reagowały z opóźnieniem. W ciągu 47 minut fundusz traci 4,2% aktywów, czyli 84 miliony dolarów.
Gdyby sygnały przechodziły przez warstwę audytu logicznego, każda rekomendacja byłaby sprawdzana pod kątem wewnętrznej niesprzeczności. Silnik audytu, oparty na regułach symbolicznych, wykryłby, że jednoczesne zajęcie długiej pozycji spot i krótkiej na opcjach call bez struktury delta-neutralnej narusza podstawową zależność ekonomiczną. Transakcja zostałaby wstrzymana do weryfikacji przez człowieka. Model nie zostałby wyłączony – nadal mógłby generować zyskowne sygnały – ale jego najbardziej irracjonalne pomysły nie trafiłyby na rynek.

Korzyści i twardy rachunek ekonomiczny
Wdrożenie warstwy audytu logicznego to nie jest projekt IT za miliony. Dla średniej wielkości firmy inwestycyjnej (aktywów 500–800 mln USD) koszt roczny licencji i utrzymania takiego systemu to około 250–350 tysięcy dolarów, zakładając integrację z istniejącą infrastrukturą. Tymczasem jeden poważny błąd spowodowany niespójnością logiczną może kosztować 50–100 milionów w ciągu kilku godzin, nie mówiąc o utracie zaufania inwestorów i potencjalnych karach regulacyjnych.
Z pięciu wdrożeń, o których wiem, trzy fundusze zaczęły od pilotażu na 5% dziennych sygnałów. W ciągu pierwszego kwartału audyt wyłapał średnio 12 transakcji miesięcznie, które naruszały zasady ekonomiczne mimo dobrej historycznej skuteczności modelu. Żaden z tych sygnałów nie przyniósłby zysku w kolejnych dniach – wręcz przeciwnie. Ryzyko zdarzeń typu ‘czarny łabędź’ generowanych przez AI spada o co najmniej 60%, według szacunków jednego z dostawców takich rozwiązań.
Od audytu do zaufania
Nie chodzi o to, by porzucić uczenie maszynowe na rzecz systemów regułowych. Chodzi o to, by przestać wierzyć, że większy model sam z siebie zacznie myśleć logicznie. Badania są w tej kwestii jednoznaczne. Dodanie cienkiej warstwy weryfikacji symbolicznej – opartej na niesprzeczności, a nie na kolejnej sieci neuronowej – to najbardziej pragmatyczny krok, jaki może dziś zrobić zarządzający ryzykiem.
Zacznij od audytu 5% dziennych sygnałów swojego modelu tradingowego. Sprawdź, ile z nich narusza podstawowe związki ekonomiczne. Dwa tygodnie testu pokażą ci skalę problemu – i być może uchronią przed stratą, której nie wybaczy ci zarząd.
- Zmniejszenie ryzyka strat spowodowanych niespojnymi sygnalami AI
- Lepsza zgodnosc regulacyjna dzieki audytowalnosci decyzji algorytmicznych
- Ochrona przed katastrofami wartymi dziesiatki milionow dolarow przy niskich kosztach wdrozenia
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: Data-driven Machine Learning Cannot Reach Symbolic-level Logical Reasoning — The Limit of the Scaling Law
Autorzy: Tiansi Dong, Mateja Jamnik, Pietro Li\`o
Sphere neural networks have achieved symbolic level syllogistic reasoning without training data, raising the question of where the limit of the scaling law for logical reasoning lies, i.e., whether data-driven machine learning systems can achieve the same level by increasing training data and tra…
arXiv: arxiv.org/abs/2606.26454
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
