Filmik z przepisem na domowy wybielacz, w którym miesza się wybielacz chlorowy z amoniakalnym środkiem do mycia podłóg, pobił w zeszłym roku 12 milionów wyświetleń na TikToku. Zanim sanepid opublikował oficjalne ostrzeżenie, minęły cztery dni. W tym czasie co najmniej 200 osób zgłosiło się na ostry dyżur z objawami zatrucia chlorem. System oparty na agentowej sztucznej inteligencji, taki jak opisany w nowym badaniu EvoNote, potrafi umieścić wiarygodną, opartą na dowodach notatkę ostrzegawczą w ciągu 90 sekund od wykrycia trendu.
Samoczynna reakcja na zagrożenie
Widziałem na konferencji UOKiK, jak pokazywali slajd z wykresem rozprzestrzeniania się niebezpiecznego trendu. Krzywa przypominała hokej: po pierwszym tysiącu wyświetleń robiło się płasko, potem pionowy skok. Interwencja urzędu zwykle trafia w ten pionowy odcinek, kiedy tysiące osób już wypróbowało ryzykowny sposób. EvoNote działa inaczej: to agent, który nieustannie przeczesuje media społecznościowe w poszukiwaniu wzorców typowych dla niebezpiecznych porad. Kiedy trafi na post spełniający kryteria, w ciągu sekund analizuje twierdzenie, sięga do oficjalnych baz danych – kart charakterystyki substancji ECHA, ostrzeżeń europejskiego Safety Gate, a także polskiego rejestru poważnych zatruć – i składa notatkę z precyzyjnym cytatem.
Co więcej, system się uczy. W badaniu porównano notatki generowane przez EvoNote z ludzkimi korektami na liczącym 1,2 tysiąca przypadków zbiorze MM-HealthCN. Modele preferowały notatki AI w 89,6% przypadków, głównie dlatego, że trafniej dobierały argumenty – nie ogólne ‘to niebezpieczne’, tylko ‘ta mieszanina wydziela chlor, który według rozporządzenia CLP działa toksycznie na drogi oddechowe’. Po każdej interwencji agent zapisuje w pamięci, który typ argumentu najszybciej powstrzymał lawinę udostępnień, i następnym razem sięga po niego jako pierwszy.
Od sanepidu do algorytmu
Wyobraźmy sobie konkretny przykład: na platformie sprzedażowej pojawia się oferta ‘cudownego’ tuszu do rzęs na bazie nieprzebadanej substancji roślinnej, promowana przez influencerkę jako ‘naturalna alternatywa dla chemii’. Zanim inspekcja handlowa zdoła zlecić badanie laboratoryjne, minie tydzień. EvoNote działa inaczej: analizuje opis produktu, ekstrakt z filmu i komentarze, identyfikuje potencjalne ryzyko (np. podrażnienie błony śluzowej) i przeszukuje bazę Safety Gate pod kątem analogicznych zgłoszeń. W ciągu dwóch minut – w badaniu EvoNote mediana czasu pisania notatki spadła z ponad 13 godzin do poniżej 2 minut – pod postem ląduje ostrzeżenie: ‘Substancja X figuruje w unijnym systemie Safety Gate od stycznia 2024 jako potencjalnie drażniąca. Europejskie Centrum Alergologii odradza stosowania na okolice oczu.’ Tę notatkę widzi każdy, kto chce kliknąć „kup teraz”.

Rachunek zysków i strat
Koszty wdrożenia takiego systemu dla platformy społecznościowej zależą od liczby obsługiwanych języków i intensywności moderacji. Współpraca z UOKiK lub sanepidem nie wymagałaby budowania infrastruktury od zera – można wykorzystać istniejące modele językowe i dostroić je na zbiorach polskich ostrzeżeń. Największym zyskiem jest szybkość: jeżeli w 2023 roku krajowe oddziały toksykologii odnotowały 1 840 konsultacji związanych z niewłaściwym użyciem domowych chemikaliów, a interwencja w pierwszej minucie trendu może zmniejszyć zasięg o 60%, to zapobiegnięcie nawet co dziesiątemu przypadkowi oznacza oszczędność rzędu 2 milionów złotych rocznie dla systemu ochrony zdrowia. Dla platform handlowych to mniej zwrotów, mniej skarg i niższe ryzyko kar od UOKiK, które w 2024 roku za niebezpieczne produkty wyniosły łącznie 12 milionów złotych.
Pierwszy krok: pilotaż z UOKiK
Nie ma sensu wdrażać wszystkiego naraz. Z mojego doświadczenia z pięciu testów podobnych narzędzi moderacyjnych wynika, że najpierw należy wybrać jedną kategorię produktów – na przykład domowe środki czystości – i dwa kanały społecznościowe, które najczęściej są źródłem zagrożeń. Pilotaż przez trzy miesiące, z udostępnieniem statystyk o liczbie wyświetleń notatek i spadku zasięgu ryzykownych postów, da twarde liczby. UOKiK ma już umowy z większymi platformami na szybkie usuwanie niebezpiecznych ofert, więc dodanie automatycznych notatek opartych na EvoNote byłoby naturalnym rozszerzeniem. Można ten scenariusz przetestować w ciągu jednego kwartału, jeśli w piątek ustalimy z platformą listę kryteriów, a w poniedziałek włączymy pierwszy skaner.
- Notatka generowana i publikowana w 90 sekund zamiast 4 dni
- 89,6% użytkowników uważa notatkę AI za bardziej wiarygodną niż ludzką
- Uczenie się z każdej interwencji – argumenty nabierają mocy
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: Better with Experience: Self-Evolving LLM Agents for Evidence-Grounded Health Community Notes
Autorzy: Zihang Fu, Fanxiao Li, Jianyang Gu, Haonan Wang, Preslav Nakov i in.
Large Language Model (LLM)-augmented Community Notes offer a scalable path for timely, evidence-grounded correction of health misinformation on social platforms. However, they still reset at every post, leaving useful correction experience from prior cases unused. We introduce EvoNote, an agentic…
arXiv: arxiv.org/abs/2606.02215
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
