W trakcie pandemii COVID-19 fałszywe informacje o szczepionkach rozprzestrzeniały się szybciej niż oficjalne sprostowania. Pojedynczy post mógł dotrzeć do milionów ludzi, zanim zespół fact-checkerów zdążył przygotować rzetelną korektę. Średni czas reakcji wynosił ponad 13 godzin. Nowy framework o nazwie EvoNote redukuje ten czas do poniżej 2 minut, a przy okazji uczy się na własnych działaniach, by za każdym razem pisać lepsze notatki niż człowiek.
Technologia, która pamięta swoje błędy
EvoNote to system agentowy, który działa trochę jak fact-checker z fotograficzną pamięcią. Analizuje treść podejrzanego posta, wyszukuje dowody naukowe w bazach takich jak PubMed czy wytyczne WHO, a potem generuje notatkę korygującą. Nie jest to jednak zwykły generator tekstu. Framework przechowuje pamięć wcześniejszych korekt i na podstawie reakcji społeczności (polubienia, zgłoszenia, oceny pomocności) precyzyjnie ocenia, które elementy notatki zadziałały, a które nie. Dzięki temu z każdą kolejną interwencją staje się skuteczniejszy. W testach na zbiorze 1,2 tys. przypadków dezinformacji zdrowotnej notatki EvoNote były preferowane nad ludzkimi w 89,6% przypadków. Co więcej, dla postów, które nie miały jeszcze żadnych ocen społeczności, system tworzył pomocne notatki w 82,0% sytuacji. To nie są liczby z laboratorium – benchmark MM-HealthCN opiera się na realnych postach z platform społecznościowych.
Scenariusz: ministerstwo zdrowia kontra fala dezinformacji
Wyobraźmy sobie sytuację: na Twitterze pojawia się wpis błędnie łączący nową szczepionkę z powikłaniami neurologicznymi. W ciągu godziny post ma 50 tysięcy wyświetleń. Tradycyjny zespół fact-checkerów musi najpierw go znaleźć, potem przeanalizować, zebrać literaturę, napisać sprostowanie i opublikować. To trwa. EvoNote zintegrowany z systemem monitoringu mediów społecznościowych wykrywa post automatycznie, w ciągu kilkudziesięciu sekund analizuje twierdzenie, pobiera odpowiednie badania i generuje notatkę opatrzoną cytatami. Całość od wykrycia do publikacji – poniżej 2 minut. Co istotne, system śledzi późniejsze reakcje. Jeśli użytkownicy uznają notatkę za pomocną, wzmacnia strategię; jeśli nie, dostosowuje styl lub źródła. Po kilku miesiącach działania na konkretnym typie dezinformacji (np. antyszczepionkowej) agent ma już wypracowane schematy, które regularnie wygrywają z notatkami pisanymi przez ludzi.

Korzyści i zwrot z inwestycji
Najbardziej wymierną korzyścią jest czas. Tam, gdzie wcześniej potrzebny był zespół kilkunastu osób pracujących na zmiany, jeden system może obsłużyć wielokrotnie większy wolumen. Przyjmijmy, że przeciętny fact-checker jest w stanie przygotować 5-8 solidnych korekt dziennie. EvoNote nie męczy się i może generować setki notatek w tym samym czasie. Koszt? Zamiast etatów – infrastruktura chmurowa i dostęp do API modeli językowych. Dla agencji zdrowia publicznego oznacza to możliwość pokrycia wielu platform i języków bez mnożenia personelu. Jest też aspekt zdrowotny: szybsza korekta fałszywych informacji o terapiach czy szczepieniach bezpośrednio przekłada się na mniejszą liczbę osób podejmujących błędne decyzje medyczne. Z mojego doświadczenia z wdrożeniami AI w sektorze publicznym wynika, że pierwszy pilotaż warto oprzeć na jednym, dobrze zdefiniowanym obszarze dezinformacji – na przykład mitach dotyczących antybiotyków. Pozwoli to w 2-3 miesiące zebrać dane i oszacować realny wpływ na zaufanie do oficjalnych komunikatów.
Podsumowanie: od pilotażu do standardu
EvoNote nie zastąpi całkowicie ludzi – ktoś musi nadzorować system, aktualizować bazy wiedzy i interweniować w skrajnie niejednoznacznych przypadkach. Ale liczby z badań są jednoznaczne: 89,6% preferencji nad notatkami ludzkimi i skrócenie czasu reakcji z 13 godzin do 2 minut to argumenty, których nie można zignorować. Ministerstwa zdrowia i agendy takie jak WHO czy ECDC powinny rozważyć pilotaż na ograniczonym zbiorze tematów, wykorzystując otwartoźródłowy framework. Technologia jest gotowa. Pytanie tylko, jak szybko instytucje po nią sięgną.
- Skrócenie czasu reakcji z 13 godzin do poniżej 2 minut
- Samodoskonalenie na podstawie reakcji społeczności
- Lepsze wykorzystanie dowodów naukowych niż w notatkach pisanych przez ludzi
- Możliwość skalowania na wiele platform i języków
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: Better with Experience: Self-Evolving LLM Agents for Evidence-Grounded Health Community Notes
Autorzy: Zihang Fu, Fanxiao Li, Jianyang Gu, Haonan Wang, Preslav Nakov i in.
Large Language Model (LLM)-augmented Community Notes offer a scalable path for timely, evidence-grounded correction of health misinformation on social platforms. However, they still reset at every post, leaving useful correction experience from prior cases unused. We introduce EvoNote, an agentic…
arXiv: arxiv.org/abs/2606.02215
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
