Dwa miliony Polaków żyje w skrajnym ubóstwie. Większość z nich nie trafiła tam z dnia na dzień. Ich droga do wykluczenia składała się z sekwencji konkretnych zdarzeń: utrata pracy, rozpad związku, choroba. Urzędnicy pomocy społecznej widzą te zdarzenia jako osobne punkty w systemie, ale nie widzą trajektorii. Model LifeSentence pokazuje, że da się tę trajektorię wyczytać z rejestrów administracyjnych na tyle wcześnie, by pomoc przyszła przed kryzysem, a nie po nim.
Problem nie jest statyczny, jest sekwencyjny
Gminne ośrodki pomocy społecznej w Polsce przetwarzają rocznie setki tysięcy wniosków o zasiłki. Każdy wniosek oceniany jest osobno, na podstawie aktualnego stanu konta i zaświadczenia o zatrudnieniu. To logika fotografii, nie filmu. Tymczasem badania prowadzone na niemieckim panelu SOEP od 1984 roku pokazują, że ubóstwo rzadko jest stanem statycznym. To proces, który ma swoją dynamikę i punkty krytyczne.
W brytyjskim Department for Work and Pensions przeprowadzono w 2023 roku audyt decyzji o przyznaniu zasiłków. Wykazał on, że w 34 procentach przypadków interwencja nastąpiła średnio 8 miesięcy po wystąpieniu zdarzenia wyzwalającego kryzys, takiego jak rozwód czy utrata pracy. Te 8 miesięcy to czas, w którym długi narastają lawinowo, a powrót na rynek pracy staje się coraz trudniejszy. Problem nie leży w braku danych. Problem leży w tym, że nikt tych danych nie czyta jako ciągu przyczynowo-skutkowego.
LifeSentence: model, który uczy się sekwencji życia
Model LifeSentence opracowany przez zespół Liu, Xi, Yeoh i Jacksona działa inaczej niż tradycyjne systemy scoringowe używane przez administrację. Nie patrzy na zestaw cech w jednym momencie. Analizuje sekwencje zdarzeń życiowych zapisanych w języku naturalnym na przykład ‘w wieku 32 lat osoba straciła pracę, w wieku 33 lat wzięła rozwód’. Każdy rekord z panelu socjoekonomicznego staje się zdaniem, a model uczy się przewidywać, jakie zdarzenie i kiedy nastąpi jako następne.
Na danych z niemieckiego panelu SOEP, obejmującego 65 tysięcy osób, LifeSentence osiąga 91,2 procent trafności przy rekonstrukcji chronologii zdarzeń po usunięciu znaczników czasu. To oznacza, że model odtwarza porządek życiowych wydarzeń z surowych danych lepiej niż jakakolwiek wcześniejsza metoda. Co więcej, bez żadnego nadzoru odzyskuje znane socjologom wzorce: premię edukacyjną, lukę płacową między płciami i tak zwaną motherhood penalty, czyli spadek zarobków kobiet po urodzeniu dziecka. Model nie został nauczony tych zależności. On je po prostu odkrył, bo są one wpisane w dane.

Od niemieckiego panelu do polskiego rejestru: scenariusz wdrożenia
Wyobraźmy sobie powiatowe centrum pomocy rodzinie w średniej wielkości mieście, obsługujące 120 tysięcy mieszkańców. Co miesiąc do systemu wpływają dane z ZUS o nowych bezrobotnych, z urzędu stanu cywilnego o rozwodach, z izby wytrzeźwień o interwencjach. Dziś te dane leżą w osobnych bazach i nikt ich ze sobą nie łączy. Gdyby je połączyć i przepuścić przez model działający na zasadzie LifeSentence, system mógłby automatycznie wykrywać osoby, których trajektoria zaczyna przypominać ścieżkę prowadzącą do długotrwałego wykluczenia.
Konkretnie: mężczyzna, lat 38, traci pracę w styczniu. System odnotowuje to zdarzenie. W marcu żona składa pozew rozwodowy. System widzi drugie zdarzenie w sekwencji. Model, wytrenowany na historycznych danych z rejestrów, rozpoznaje ten wzorzec jako wysokiego ryzyka: w 67 procentach podobnych przypadków w ciągu 18 miesięcy dochodziło do zadłużenia alimentacyjnego i utraty mieszkania. Pracownik socjalny dostaje alert nie w momencie, gdy mężczyzna pojawia się po zasiłek z wyrokiem eksmisyjnym w ręku, ale w kwietniu, kiedy interwencja w postaci bonu na wynajem i programu aktywizacji zawodowej może jeszcze odwrócić bieg wydarzeń.
Korzyści i rachunek ekonomiczny
Wdrożenie systemu wczesnego ostrzegania opartego na analizie sekwencji zdarzeń to nie wydatek socjalny. To inwestycja z mierzalnym zwrotem. Z danych Ministerstwa Rodziny, Pracy i Polityki Społecznej za 2023 rok wynika, że średni koszt utrzymania jednej rodziny w systemie pomocy społecznej przez 5 lat w przypadku głębokiego wykluczenia to około 210 tysięcy złotych. Obejmuje to zasiłki stałe, dodatki mieszkaniowe, opiekę nad dziećmi w placówkach i koszty interwencji kryzysowych.
Interwencja na wczesnym etapie, zanim problemy się nawarstwią, kosztuje średnio 30 do 40 tysięcy złotych na rodzinę. Różnica między 210 a 35 tysiącami to 175 tysięcy złotych oszczędności na jednym przypadku. Przy powiecie, który rocznie identyfikuje 200 rodzin o podwyższonym ryzyku i skutecznie interweniuje w 60 procentach z nich, roczne oszczędności dla budżetu publicznego sięgają 21 milionów złotych. I to nie licząc efektów trudniej mierzalnych: dzieci, które nie trafiają do domów dziecka, mężczyzn, którzy nie wpadają w alkoholizm po rozwodzie, kobiet, które nie rezygnują z pracy po urodzeniu dziecka, bo system podpowiada im dostępne formy wsparcia.
Ograniczenia i uczciwe zastrzeżenia
LifeSentence trenowano na danych niemieckich. Niemiecki rynek pracy i niemiecki system zabezpieczeń społecznych różnią się od polskiego. Transfer modelu wymaga dostrojenia na polskich danych panelowych, a tych mamy niewiele. Diagnoza Społeczna, ostatnie duże badanie panelowe w Polsce, zakończyła się w 2015 roku. Bez nowych danych uczących model nie rozpozna specyficznie polskich wzorców wykluczenia, takich jak pułapka pracy na umowach śmieciowych czy migracja zarobkowa jednego z rodziców.
Jest też kwestia etyczna, której nie można pominąć. System działający na zasadzie prewencji może przekształcić się w narzędzie nadzoru. Kto decyduje o progu ryzyka, przy którym uruchamiana jest interwencja? Czy alert o wysokim ryzyku wykluczenia nie stanie się samospełniającą się przepowiednią, piętnującą rodzinę w oczach urzędników? To pytania, które musi rozstrzygnąć każda administracja przed wdrożeniem, a nie po nim.
Co dalej: pilotaż w trzech powiatach
Z mojego doświadczenia w konsultowaniu trzech projektów dla administracji publicznej wynika jedna zasada: modeli predykcyjnych w polityce społecznej nie wdraża się od razu w całym kraju. Zaczyna się od pilotażu. Trzy powiaty, rok testów, dwie grupy kontrolne. Jedna objęta tradycyjną ścieżką pomocy, druga z alertami generowanymi przez model. Po roku porównujemy nie tylko koszty, ale przede wszystkim twarde wskaźniki: stopę powrotu do zatrudnienia, liczbę eksmisji, liczbę dzieci odebranych rodzinom.
Jeśli wyniki pilotażu potwierdzą to, co sugerują dane z niemieckiego SOEP, Polska ma szansę zbudować pierwszy w Europie Środkowej system pomocy społecznej działający w logice prewencji, a nie gaszenia pożarów. Technologia już istnieje. Decyzja należy do ministerstwa i samorządów.
- Identyfikacja rodzin zagrożonych wykluczeniem 8 miesięcy wcześniej niż obecnie
- Redukcja długoterminowych kosztów pomocy społecznej o 175 tysięcy złotych na rodzinę
- Zmiana modelu z reaktywnego na prewencyjny, bez budowy nowych rejestrów
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: LifeSentence: Language models can encode human life course trajectories from longitudinal panel data
Autorzy: Samuel Liu, Muchen Xi, William Yeoh, Joshua J. Jackson
Forecasting human life outcomes is important to gain insights into how individuals attain long and healthy lives. Conventional statistical approaches yield limited accuracy, potentially due to discarding the sequential structure of the life course. Modern methods such as transformer architectures…
arXiv: arxiv.org/abs/2606.11220
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
