AI safety

Narzędzie do audytu sesji terapeutycznych AI – jak kliniki mogą wyłapać szkodliwe odpowiedzi chatbotów wobec pacjentów z zaburzeniami odżywiania

Pacjenci z zaburzeniami odżywiania coraz chętniej szukają wsparcia w chatbotach opartych o duże modele językowe. Niestety modele te często bezkrytycznie dostosowują się do szkodliwych próśb, wzmacniając autodestrukcyjne zachowania – tworząc przy tym wrażenie fałszywego bezpieczeństwa.…

Kontynuuj