Sprawiedliwa selekcja – jak powstrzymać AI przed budowaniem pseudoprzyczynowych profili kandydatów

Systemy preselekcji CV oparte na AI obiecują szybkość i obiektywizm, ale często dostarczają pracodawcom niebezpieczną iluzję. Modele językowe – chcąc być pomocne – potrafią bez żadnych dowodów łączyć elementy życiorysu z sukcesem zawodowym, tworząc pseudoprzyczynowe profile kandydatów i systemowo pomijając wartościowych ludzi. Nowe badania pokazują, że problem tkwi nie w modelu, a w kontekście jego użycia – i że wystarczy jedno zdanie, by przywrócić mu rozsądek.

Ostrożność, którą tracimy, gdy chcemy pomóc

Badanie zespołu Hiroshiego Okumury ujawniło zaskakującą cechę modeli językowych. W sytuacjach akademickich, gdy poproszono je o analizę abstrakcyjnych danych, zachowywały tak zwaną ostrożność przyczynową w 91,7–100% przypadków. Oznacza to, że powstrzymywały się od wnioskowania o związkach przyczynowo-skutkowych, jeśli brakowało twardych dowodów. Gdy jednak ten sam model wrzucono w kontekst praktycznego doradztwa – na przykład jako asystenta biznesowego – wskaźnik ostrożności spadał do zaledwie 6,7–18,3%. W wariancie, gdzie konkretnie zażądano rekomendacji, tylko 1 na 200 odpowiedzi zachowało należytą powściągliwość.

Dla HR to czerwona flaga. System selekcji CV to właśnie doradca: ma pomóc, wskazać najlepszych kandydatów, a przy okazji wyjaśnić, dlaczego wybór jest trafny. Im bardziej model chce być pomocny, tym chętniej generuje pozorne reguły – np. ‘kandydaci z tytułem MBA szybciej osiągają wyniki’ – opierając się na powierzchownych korelacjach, a nie na rzeczywistych związkach przyczynowych. Dodanie do promptu jednego zdania – ‘Proszę ponownie rozważyć tę ocenę pod kątem związków przyczynowych’ – przywracało ostrożność w 71,4–100% przypadków. Bez zmiany modelu, bez dodatkowego treningu.

Scenariusz: gdy 5000 CV trafia do AI

Wyobraź sobie firmę z branży FMCG, która rekrutuje regionalnego menedżera sprzedaży. Do systemu trafia blisko 5000 aplikacji. Dział HR nie ma szans przejrzeć ich ręcznie, więc włącza moduł AI, który na podstawie historycznych danych ma wskazać 50 najlepszych profili.

Model analizuje CV i szybko znajduje wzorzec: osoby, które ukończyły SGH lub Akademię Leona Koźmińskiego i zaliczyły staż w McKinsey, w firmie awansują średnio o 40% szybciej. System podnosi je na szczyt rankingu, a tych bez podobnych punktów w życiorysie spycha w dół. Tymczasem związek przyczynowy jest wątpliwy – dostęp do prestiżowych staży często zależy od sieci kontaktów, a nie od wrodzonego talentu sprzedażowego. Model nie ma danych o tym, czy kandydat sam zapracował na staż, czy po prostu miał rodzinę w branży. Tworzy jednak fałszywą rekomendację, bo w trybie pomocnym nie pyta o dowody.

Sytuację ratuje prosty zabieg: przed wystawieniem ostatecznego rankingu do promptu dodawana jest instrukcja samokorekty. Model zmuszony do sprawdzenia, czy istnieje rzeczywisty związek przyczynowy między stażem w McKinsey a wynikami sprzedaży, prawdopodobnie odpowiedziałby: ‘brak danych’. W efekcie nie eliminuje wartościowych kandydatów tylko dlatego, że ich CV nie zawiera określonych znaczników prestiżu. Ranking zaczyna opierać się na mierzalnych umiejętnościach i doświadczeniu zweryfikowanym testami kompetencji.

Korzyści: od uniknięcia procesu do lepszych ludzi

Wdrożenie samokorekty w procesie selekcji CV przynosi trzy konkretne korzyści. Po pierwsze, minimalizuje ryzyko prawne. Dyrektywy unijne i krajowe przepisy coraz ostrzej karzą dyskryminację algorytmiczną – grzywna za systemowe faworyzowanie jednej grupy kandydatów może sięgnąć milionów euro. Po drugie, poprawia jakość zatrudnień. Badania McKinsey z 2020 roku pokazują, że firmy zróżnicowane etnicznie i kulturowo mają o 35% większe szanse na ponadprzeciętne wyniki finansowe. Rezygnacja z pseudoprzyczynowych filtrów otwiera dostęp do szerszej puli talentów. Po trzecie, koszt jest praktycznie zerowy – dodanie jednego zdania do promptu nie wymaga zmian w infrastrukturze ani dodatkowego budżetu.

Znam przypadek spółki technologicznej, która przez kilkanaście miesięcy odrzucała wszystkich kandydatów bez dyplomu MBA, bo system AI uznał, że bez tego nie da się odnieść sukcesu na tym stanowisku. Gdy po audycie wyłączono tę zasadę, kolejny zatrudniony bez tytułu MBA w ciągu roku podwoił przychody działu. Model nie był zły – po prostu został źle sparametryzowany kontekstem.

  • Minimalizacja ryzyka dyskryminacji algorytmicznej
  • Nawet 35% lepsze wyniki finansowe dzięki różnorodnym zespołom
  • Koszt wdrożenia bliski zeru – zmiana promptu

Informacje o artykule

Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.

Paper: When Helpfulness Overrides Causal Caution: Context-Dependent Suppression and Recovery in LLMs

Autorzy: Hiroshi Okumura

Large language models (LLMs) are increasingly integrated into decision-support roles in business and policy contexts. While prior benchmark studies have primarily evaluated LLMs’ causal reasoning capabilities, a more fundamental epistemic dimension has been overlooked: Causal Caution, defined as …

arXiv: arxiv.org/abs/2606.24370

Czytaj więcej o tej technologii: Mądre w teorii, lekkomyślne w praktyce: jak kontekst niszczy ostrożność modeli językowych

Artykuł wygenerowany ze wsparciem sztucznej inteligencji.

Leave a Reply

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *