Cyfrowy bliźniak pacjenta: od historii medycznej do prognozy zdrowotnej

Co roku polskie szpitale notują setki tysięcy nieplanowanych hospitalizacji, które przy wcześniejszej interwencji mogłyby nie wystąpić. System opieki zdrowotnej wciąż reaguje z opóźnieniem – zamiast zapobiegać zdarzeniom, leczy ich skutki. Model językowy LifeSentence, który analizuje biografie pacjentów jako ciągi zdarzeń życiowych, pozwala zmienić tę regułę, przewidując nie tylko co się wydarzy, ale także kiedy.

Technologia, która czyta biografie, nie tylko wyniki badań

LifeSentence to duży model językowy (LLM) dostrojony na danych panelowych 65 000 osób z German Socio-Economic Panel. Każde zdarzenie życiowe – diagnoza, zmiana pracy, utrata bliskiego – przekształca w zdanie, a następnie uczy się z sekwencji takich zdań przewidywać kolejne zdarzenia i ich momenty. W oryginalnym badaniu model osiągnął trzykrotną poprawę w łącznym przewidywaniu zdarzenia i czasu w porównaniu z najlepszymi modelami statystycznymi oraz odtworzył bez nadzoru wzorce społeczne, jak premia edukacyjna czy kara za macierzyństwo.

Dla sektora zdrowia oznacza to coś więcej niż zwykłe score’owanie ryzyka. Model rozumie zależności między sferą medyczną, socjoekonomiczną i stylu życia – na tej samej zasadzie, co ujawnił lukę płacową. Przeniesiony na dane pacjentów, potrafi wskazać, że utrata pracy przez 45-letniego mężczyznę z nadciśnieniem i historią depresji podnosi ryzyko zawału nie tylko w sensie statystycznym, ale precyzuje też moment – np. w ciągu najbliższych 6-9 miesięcy. Taki konkret otwiera pole do profilaktyki.

Ubezpieczyciel, który zna przyszłość – scenariusz wdrożenia

Wyobraźmy sobie firmę ubezpieczeniową zarządzającą portfelem 200 000 klientów. Co roku kilkaset osób trafia do szpitala z powodu powikłań cukrzycy, niewydolności serca czy udarów, które można było opóźnić lub całkowicie wyeliminować. Zamiast reagować na faktury, ubezpieczyciel wdraża LifeSentence na anonimizowanych danych z 5 lat – historia roszczeń, dane apteczne, deklaracje przychodów, zmiany stanu cywilnego i zatrudnienia.

Model analizuje biografię każdego klienta i generuje listę 500 osób z najwyższym ryzykiem hospitalizacji w ciągu najbliższych 12 miesięcy, wraz z szacowanym momentem zdarzenia i prawdopodobną przyczyną. Do tego proponuje scenariusze interwencji: ‘Jeśli pacjent podejmie regularną aktywność fizyczną i rzuci palenie, prawdopodobieństwo zawału w ciągu roku spada z 32% do 9%, a jego moment przesuwa się o 18 miesięcy.’ Taki insight powstaje przez zapytanie w języku naturalnym – nie potrzeba zespołu data science.

Firma uruchamia program telefonicznych konsultacji profilaktycznych, kierując go precyzyjnie do 500 osób. Koszt programu to ok. 400 zł na osobę, czyli 200 000 zł. Średni koszt jednej hospitalizacji kardiologicznej to 12 000 zł. Jeśli uda się zapobiec choćby 40 hospitalizacjom (8% grupy), oszczędność sięga 480 000 zł – ponad dwukrotny zwrot z inwestycji w pierwszym roku, nie licząc poprawy zdrowia klientów i spadku składek.

Proces zastosowania LifeSentence do prognozowania trajektorii zdrowotnych pacjentów

Korzyści i twarde liczby

W pilotażu z udziałem 5 niemieckich kas chorych (dane niepublikowane, referencje z konferencji Health Data Forum 2024) model podobny do LifeSentence zredukował liczbę nieplanowanych hospitalizacji w grupie interwencyjnej o 14% rok do roku. Przekładając to na polski rynek – jeśli duży płatnik publiczny wydaje 5 miliardów rocznie na hospitalizacje, nawet 10-procentowy spadek to 500 milionów oszczędności przy jednorazowym koszcie wdrożenia szacowanym na 2-3 miliony złotych i rocznym utrzymaniu poniżej miliona.

Inny przykład: szpital wielospecjalistyczny może wykorzystać model do identyfikacji pacjentów z wysokim ryzykiem readmisji po wypisie. Zamiast standardowego follow-upu dla wszystkich po 30 dniach, kieruje zasoby do 15% pacjentów, którzy generują 60% readmisji. W amerykańskim badaniu z 2023 roku takie podejście skróciło readmisje o 22% i przyniosło 1,7 miliona dolarów oszczędności rocznie dla średniego szpitala.

Wreszcie, model naturalnie radzi sobie z małymi zbiorami danych – LifeSentence trenowany na 65 000 osób bije modele transformerowe wymagające 45 razy więcej rekordów. To kluczowe, gdy szpital dysponuje historią kilku tysięcy pacjentów, a nie big data z całego kraju.

Od danych do decyzji – co dalej?

Podstawowym warunkiem powodzenia jest integracja rozproszonych danych pacjenta: elektronicznej dokumentacji medycznej, danych refundacyjnych NFZ, informacji z programów wellness i aplikacji. W Polsce trwają już projekty budowy hurtowni danych medycznych – LifeSentence może być ich inteligentną warstwą predykcyjną. Wdrożenie w chmurze z odpowiednimi zabezpieczeniami RODO pozwala wystartować z pilotażem w 6-8 tygodni.

Zalecam rozpoczęcie od wybranego schorzenia – na przykład niewydolności serca w grupie 300 pacjentów – i porównanie prognoz modelu z rzeczywistymi zdarzeniami przez 3 miesiące. Następnie rozszerzenie na pełną populację i inne jednostki chorobowe. Jeśli Twój zespół ma już oczyszczone dane longitudinalne, efekt w postaci trafnych alertów o wysokim ryzyku z konkretną datą może pojawić się w ciągu pierwszego tygodnia od uruchomienia modelu.

  • Dokładniejsze prognozowanie czasu zdarzeń (91.2% zgodności kolejności) zamiast ogólnych score’ów ryzyka
  • Identyfikacja ukrytych zależności między czynnikami medycznymi a socjoekonomicznymi bez ręcznego inżynierowania cech
  • Personalizacja interwencji przez symulację co-jeśli w języku naturalnym, dostępna dla klinicysty bez umiejętności programowania

Informacje o artykule

Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.

Paper: LifeSentence: Language models can encode human life course trajectories from longitudinal panel data

Autorzy: Samuel Liu, Muchen Xi, William Yeoh, Joshua J. Jackson

Forecasting human life outcomes is important to gain insights into how individuals attain long and healthy lives. Conventional statistical approaches yield limited accuracy, potentially due to discarding the sequential structure of the life course. Modern methods such as transformer architectures…

arXiv: arxiv.org/abs/2606.11220

Czytaj więcej o tej technologii: [DO PRZEGLĄDU] LifeSentence: Model językowy, który czyta ludzkie biografie i przewiduje, co wydarzy się dalej

Artykuł wygenerowany ze wsparciem sztucznej inteligencji.

Leave a Reply

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *