Wypalenie zawodowe kosztuje polskie firmy miliardy złotych rocznie. Nadal wykrywamy je za pomocą ankiet, które dają późny sygnał i często pomijają osoby maskujące spadek formy. Nowa metoda czerpie z pasywnych danych z telefonu, ale bez naruszania prywatności – menedżerowie widzą tylko krótkie streszczenie behawioralne i poziom ryzyka, nie surowe logi lokalizacji czy aplikacji.
Dlaczego ankiety i klasyczny monitoring nie wystarczają
Kwestionariusze typu PHQ-4 to standard w programach wellbeingowych. Przeprowadza się je raz na kwartał, a ich wyniki odzwierciedlają stan sprzed kilku tygodni. Pracownik, który unika tematu, może wypełnić ankietę z wynikami w normie, mimo że od miesiąca śpi po 5 godzin, przestał się ruszać i scrolluje telefon do drugiej w nocy. Dział HR dostaje sygnał, gdy sytuacja jest już zaawansowana – a koszt jednego poważnego przypadku wypalenia (absencja, spadek produktywności, rotacja) przekracza w Polsce 100 tys. zł.
Z drugiej strony rośnie dostępność danych pasywnych z telefonów służbowych i prywatnych – wzorce snu, liczba kroków, czas przed ekranem. Za granicą firmy ubezpieczeniowe i platformy wellbeingowe testują monitoring behawioralny, ale obawa przed ‘szpiegowaniem’ pracowników blokuje projekty. Wąskie gardło semantyczne znane z badań nad TimeSRL rozwiązuje ten konflikt.
Streszczenie zamiast surowych danych – co widzi menedżer
Model TimeSRL, opracowany przez zespół Fan et al., działa dwutorowo. Przez 14 dni zbiera z telefonu wskaźniki: długość snu, czas wybudzeń, liczbę kroków, użycie ekranu i aplikacji. Z tych danych generuje tekstowy opis – np. ‘Aktywność fizyczna spadła o 30%, średni sen skrócił się do 5,5 godziny, a wieczorne korzystanie z urządzenia wzrosło dwukrotnie. Wzorzec przypomina wcześniejsze epizody obniżonego samopoczucia.’ Następnie, wyłącznie na podstawie tego streszczenia, model przewiduje wynik skali lęku i depresji (PHQ-4, skala 0-6).
Najważniejsza cecha: surowe dane – lista odwiedzonych miejsc, treść wiadomości, nazwy aplikacji – nigdy nie opuszczają bezpiecznego środowiska przetwarzania. Do menedżera trafia jedynie kilkuzdaniowe podsumowanie i poziom ryzyka. Mechanizm ten, nazywany przez autorów semantycznym wąskim gardłem, został wytrenowany za pomocą uczenia ze wzmocnieniem bez ręcznych adnotacji. Model sam odkrywa, które opisy najlepiej korelują z nastrojem – unika selektywnego wyolbrzymiania negatywnych zdarzeń i tworzy zrównoważone narracje. Dzięki temu streszczenia są wierne trajektorii zachowań, a nie tylko wyciągają to, co niepokojące.
W testach na zbiorze GLOBEM TimeSRL obniżył średni błąd predykcji lęku o 3,1–10,1% wobec najlepszych klasycznych modeli i o 9,5–44,1% wobec bezpośredniego użycia dużych modeli językowych. Dla depresji redukcja błędu wyniosła 3,2–9,6% i 27,4–57,6%. Co więcej, nauczone abstrakcje semantyczne przenoszą się między flotami urządzeń – model wyszkolony na danych z iPhone’ów radzi sobie podobnie na Androidach, co eliminuje konieczność ujednolicania parku sprzętowego.

Wdrożenie w praktyce – scenariusz dla 200 pracowników biurowych
Wyobraźmy sobie spółkę Acme, 200 pracowników w trybie hybrydowym, program wellbeingowy oparty na kwartalnych ankietach i okazjonalnym dostępie do psychologa. Firma decyduje się na pilotaż z TimeSRL. Pracownicy wyrażają zgodę (opt-in) na tygodniowe przetwarzanie danych sensorycznych z telefonu służbowego. System działa w chmurze, integrując się z platformą MS Teams – co poniedziałek generuje dla każdego użytkownika streszczenie i wynik ryzyka.
Menedżer widzi pulpit z zagregowanym poziomem ryzyka w zespole (anonimowo), a w przypadku pracowników, których wynik przekracza 3, otrzymuje automatyczne powiadomienie. HR dostaje tylko informację ‘podwyższone ryzyko’ i streszczenie opisowe – bez danych źródłowych. To wystarcza, aby zaproponować dodatkową sesję z psychologiem, dostosować obciążenie pracą lub dać jeden dzień na regenerację. Po 3 miesiącach w pilotażu jeden przypadek poważnego wypalenia zostaje wygaszony na wczesnym etapie – koszt alternatywny szacowany na 65 tys. zł (zwolnienie, rekrutacja, utrata produktywności) zostaje uniknięty.
Korzyści i zwrot z inwestycji
W skali 200-osobowej firmy wdrożenie kosztuje około 45 tys. zł rocznie (licencja i integracja). Przeciętna absencja chorobowa w Polsce to 12 dni na pracownika rocznie, z czego część ma podłoże psychiczne. Nawet 10% redukcja oznacza 240 dni mniej nieobecności – przy dziennym koszcie 500 zł daje to 120 tys. zł oszczędności. Do tego dochodzi obniżenie rotacji: jeden przypadek rezygnacji mniej (zamiast 15 fluktuacji, 14) oszczędza dodatkowe 30 tys. zł (koszty zastępstwa). Łączny roczny zwrot to 150 tys. zł przy inwestycji 45 tys. zł, czyli ROI 233%.
Dział HR zyskuje też mierzalny wskaźnik ryzyka dla raportowania do zarządu i może precyzyjniej planować interwencje. Program wellbeingowy zaczyna być postrzegany nie jako koszt, ale jako polisa na wczesne sygnały – podobnie jak systemy przeciwpożarowe, które płacą za siebie przy pierwszym incydencie.
Od kwestionariusza do ciągłego, etycznego monitoringu
TimeSRL zmienia logikę dbania o dobrostan: zamiast czekać na ankietę, firma ma co tydzień aktualny obraz ryzyka. Metoda jest skalowalna, nie wymaga nowych sensorów i działa na istniejących służbowych telefonach. Ponieważ wąskie gardło semantyczne odcina dostęp do surowych danych, łatwiej uzyskać zgodę związków zawodowych i pracowników – streszczenie to nie podglądanie, tylko opis wzorca.
Wdrożenie warto rozpocząć od 4-tygodniowego pilotażu na 30–50 pracownikach, porównującego alerty systemu z wynikami anonimowych ankiet PHQ-4. Mierząc redukcję absencji i ocenę satysfakcji, można szybko policzyć twardy ROI i skalować rozwiązanie na całą organizację.
- Poufność – menedżer widzi streszczenie i wynik, nigdy surowe logi lokalizacji czy aplikacji
- Wczesna detekcja – sygnały spadku formy nawet 2 tygodnie przed ankietą
- Niskie koszty – przetwarzanie w chmurze bez instalacji nowych sensorów
- Niezależność od sprzętu – streszczenia uniezależniają predykcję od konkretnego modelu telefonu
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: TimeSRL: Generalizable Time-Series Behavioral Modeling via Semantic RL-Tuned LLMs — A Case Study in Mental Health
Autorzy: Yuang Fan, Lilin Xu, Millie Wu, Jingping Nie, Qingyu Chen i in.
Longitudinal passive sensing enables continuous health prediction, yet models often fail under cross-dataset distribution shifts. Traditional ML overfits cohort-specific artifacts, while Large Language Models (LLMs) struggle to reason reliably over long, heterogeneous time-series. We introduce Ti…
arXiv: arxiv.org/abs/2605.21295
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
