W zeszłym roku Komisja Nadzoru Finansowego opublikowała ponad 300 ostrzeżeń dotyczących fałszywych rekomendacji w mediach społecznościowych. Tylko na Reddicie średni zasięg jednego wątku z poradą inwestycyjną to 5–15 tysięcy wyświetleń w ciągu pierwszej godziny. Nim analityk compliance zdąży przygotować odpowiedź, połowa odbiorców już podjęła decyzję. Adaptacja frameworku EvoNote do nadzoru finansowego pokazuje, że ten czas można skrócić z kilkunastu godzin do niecałych dwóch minut.
Gdzie zawodzą obecne narzędzia nadzorcze
Regulatorzy i giełdy mają działy monitoringu, które skanują social media pod kątem podejrzanych wzorców: nagły wzrost wzmianek o mało znanym tokenie, ‘gwarantowane’ stopy zwrotu, posty z afiliacyjnym linkiem do platformy CFD bez licencji. Problem polega na tym, że flagowanie to dopiero początek. Trzeba jeszcze zrozumieć, jakie konkretnie twierdzenie jest fałszywe, zebrać twarde dane je obalające i napisać notatkę, która przebije się przez szum. A ten ostatni krok potrafi zająć godzinami, bo wymaga sprawdzenia prospektu emisyjnego, komunikatu ESPI, stanu rejestru KNF i aktualnej kapitalizacji na giełdzie.
Z moich rozmów z dwoma zespołami compliance wynika, że największym wąskim gardłem nie jest detekcja, tylko właśnie dowodzenie fałszywości i formułowanie korekty zrozumiałej dla laika. Tu wchodzi EvoNote.
EvoNote w świecie finansów – jak to działa
EvoNote to agentowy framework, pierwotnie stworzony do korekty dezinformacji zdrowotnej. W oryginalnych testach na zbiorze MM-HealthCN (1200 postów zdrowotnych) notatki generowane przez system były preferowane nad ludzkimi w 89,6% przypadków. Dla postów bez wcześniejszej oceny społeczności – czyli takich, jakie dominują w finansowym nadzorze – użyteczną notatkę produkował w 82% przypadków. Co ważniejsze, mediana czasu przygotowania korekty spadła z ponad 13 godzin do poniżej 2 minut.
W adaptacji do rynku inwestycyjnego trzech agentów pracuje sekwencyjnie: pierwszy analizuje twierdzenia w poście (np. ‘Token XYZ wejdzie na Binance w piątek, bo CEO to potwierdził’), drugi pobiera dowody z zatwierdzonych źródeł (raporty giełdowe, rejestry KNF, oficjalne konta spółek), trzeci tworzy notatkę korygującą. Pamięć doświadczeń i mechanizm przypisywania zasług na poziomie akcji sprawiają, że system uczy się, które sformułowania trafiają do odbiorców skłonnych do ryzyka. Po 50 poprawionych postach o kryptowalutach wie już, że fraza ‘spółka nie złożyła wniosku o notowanie, co potwierdza jej komunikat z 14 marca’ działa lepiej niż ‘twierdzenie nie znajduje potwierdzenia w dostępnych źródłach’.
Scenariusz: schemat pump and dump na Telegramie
Na kanale Telegramowym z 80 tysiącami subskrybentów pojawia się koordynowana akcja: ‘Spółka ABC podpisze jutro kontrakt z Saudi Aramco, kurs wystrzeli, kupujcie teraz’. W ciągu 20 minut notowania rosną o 15% przy wolumenie 4 razy wyższym niż średnia miesięczna. System monitorujący social media wykrywa post, agent analizy twierdzeń identyfikuje dwa do zweryfikowania: (1) istnienie kontraktu, (2) jego wpływ na wycenę. Agent dowodowy sprawdza system ESPI – brak komunikatu. Sprawdza profil spółki na LinkedIn i Twitterze – cisza. Pobiera ostatni raport kwartalny spółki, gdzie w sekcji ryzyk napisano wprost o braku planów ekspansji na Bliski Wschód. W 90 sekund od publikacji posta agent notatki generuje korektę: ‘Spółka ABC nie opublikowała żadnego komunikatu o kontrakcie z Saudi Aramco. Ostatni raport kwartalny z 5 lutego nie wymienia Bliskiego Wschodu jako kierunku ekspansji. Komunikat ESPI z dziś nie istnieje.’ Notatka trafia automatycznie na profil spółki na platformie X oraz do systemu alertów giełdy.
Korzyści i twarde liczby
Wdrożenie EvoNote w nadzorze finansowym daje trzy wymierne efekty. Pierwszy to szybkość: czas reakcji poniżej 2 minut wobec średnich 13 godzin ręcznej pracy analityka oznacza, że korekta trafia do odbiorców zanim fałszywa narracja zdąży się utrwalić. Drugi to dokładność: oparcie korekty na źródłach nadzorowanych (ESPI, KNF, rejestry giełdowe) i automatyczne linkowanie do nich w notatce daje czytelnikowi możliwość weryfikacji. W testach MM-HealthCN dokładność ta przekładała się na 89,6% przewagę nad notatkami ludzkimi. Trzeci efekt to skalowalność: jeden zespół compliance, który dziś ręcznie weryfikuje 40–50 alertów miesięcznie, może obsłużyć 500–600 przy pomocy EvoNote, delegując ludzi tylko do eskalacji granicznych.
Z punktu widzenia ROI: jeśli średnia strata inwestora detalicznego w pojedynczym schemacie pump and dump wynosi w Polsce według szacunków KNF około 2–4 tysięcy złotych, a jeden kanał generuje 10–15 takich schematów miesięcznie, to szybka korekta zapobiega stratom rzędu 200–600 tysięcy złotych miesięcznie na jeden monitorowany kanał.
Od czego zacząć
Adaptacja EvoNote do nadzoru finansowego nie wymaga budowy od zera. Framework jest otwarty, a jego komponenty – analiza twierdzeń, pozyskiwanie dowodów, pisanie notatek – mapują się bezpośrednio na domenę inwestycyjną. Kluczowym przygotowaniem jest zdefiniowanie listy zaufanych źródeł danych (systemy ESPI, rejestry regulatorów, oficjalne kanały spółek) i wybór trzech platform do pilotażu. Sugeruję zacząć od Telegrama i Reddita, gdzie ekosystem porad inwestycyjnych jest najsłabiej moderowany. Po 30 dniach testów z metrykami szybkości i dokładności można skalować na X i TikToka. Zespół potrzebuje jednego analityka compliance do weryfikacji wyników i jednego data engineera do integracji API. Nie potrzeba armii.
To nie jest srebrna kula, zwłaszcza gdy źródłem manipulacji są zam zamknięte grupy dyskusyjne niedostępne dla crawlerów. Ale dla treści publicznych, które generują 80% szkód detalicznych, jest to narzędzie, które zmienia asymetrię między atakującym a broniącym.
- Czas reakcji poniżej 2 minut wobec 13 godzin ręcznie
- 89,6% notatek AI preferowanych nad ludzkimi w testach benchmarku
- Oszczędność 200–600 tys. zł miesięcznie strat detalicznych na kanał
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: Better with Experience: Self-Evolving LLM Agents for Evidence-Grounded Health Community Notes
Autorzy: Zihang Fu, Fanxiao Li, Jianyang Gu, Haonan Wang, Preslav Nakov i in.
Large Language Model (LLM)-augmented Community Notes offer a scalable path for timely, evidence-grounded correction of health misinformation on social platforms. However, they still reset at every post, leaving useful correction experience from prior cases unused. We introduce EvoNote, an agentic…
arXiv: arxiv.org/abs/2606.02215
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
