Zapomnij o retrenowaniu: jak natychmiast usunąć dane z AI zgodnie z RODO

Każdy inspektor ochrony danych zna ten problem: użytkownik zgłasza żądanie ‘bycia zapomnianym’, a model językowy, na którym opierasz chatbota, wciąż pamięta szczegóły jego spraw. RODO mówi jasno: trzeba usunąć wszystkie dane osobowe, ale dla modeli AI ‘usunięcie’ oznacza zwykle kosztowne i czasochłonne przetrenowanie od zera. Nowa architektura NULLs zmienia tę grę: pozwala usunąć wpływ konkretnego źródła danych na model jednym wywołaniem API, bez dotykania reszty systemu.

Sinks i backbone, czyli separacja wiedzy źródłowej

W tradycyjnym LLM wszystkie informacje mieszają się w jednym ‘cieście’ parametrów. Żeby zapomnieć jeden dokument, trzeba upiec ciasto od nowa. NULLs rozdziela tę mieszankę: wspólny backbone przechowuje ogólną wiedzę językową, natomiast setki małych, rzadko aktywowanych modułów (sinks) są przypisane do konkretnych źródeł danych. Podczas treningu wiedza specyficzna dla danego źródła grawituje do jego sinka, a ogólna pozostaje w backbone. Gdy zachodzi potrzeba usunięcia źródła, wyłącza się tylko ten jeden sink. Badacze z Carnegie Mellon przetestowali tę architekturę na 6 milionach artykułów Wikipedii. Wyłączenie jednego artykułu skutecznie usuwało zawartą w nim wiedzę, nie naruszając ogólnej zdolności modelu do rozumienia języka. ‘Unlearning a single article removes knowledge specific to it while preserving facts shared with semantically related articles’ – tak podsumowują autorzy. Dla działów compliance to oznacza precyzyjny mechanizm usuwania danych bez efektów ubocznych.

Asystent prawny w kancelarii: realny scenariusz

Wyobraźmy sobie kancelarię, która trenowała wewnętrznego asystenta AI na dokumentach swoich klientów. Asystent pomaga prawnikom szybko znajdować precedensy i analizować umowy. Jeden z klientów wypowiada współpracę i składa wniosek o usunięcie danych na podstawie art. 17 RODO. Dział IT musi zagwarantować, że model ‘zapomniał’ o wszystkich jego sprawach – nie odpowie na pytanie o jego strategię procesową ani nie ujawni danych osobowych. W standardowej architekturze to oznacza odtworzenie zbioru trenującego bez danych tego klienta i ponowne kilkutygodniowe trenowanie modelu, o ile w ogóle zachowano oryginalne dane (często już usunięte). Z NULLs identyfikujemy sink przypisany do folderu klienta, dezaktywujemy go jednym zapytaniem API i sprawa załatwiona. Testy potwierdzają, że nawet wyrafinowane ataki ekstrakcyjne (adversarial extraction) nie wydobędą z modelu usuniętych informacji. Podczas niedawnej rozmowy z CCO jednego z banków usłyszałem, że właśnie obawa przed kosztami i złożonością realizacji art. 17 blokuje u nich wdrożenie AI w analizie dokumentów. NULLs ten argument unieważnia.

Proces usuwania danych z modelu NULLs na żądanie użytkownika

Koszty i kary: gra o miliony

Maksymalna kara za naruszenie RODO to 20 mln EUR albo 4% rocznego obrotu globalnego – w zależności która kwota jest wyższa. Dla średniego europejskiego przedsiębiorstwa z 100 mln EUR przychodu to 4 mln EUR ryzyka. Tymczasem koszty retrenowania modelu językowego są znaczące. Dla modelu klasy 13 mld parametrów, według cennika AWS, wynajem odpowiednich instancji GPU na czas potrzebny do pełnego przetrenowania to 50-100 tys. USD. Do tego dochodzi koszt logistyczny odtworzenia i czyszczenia danych treningowych – o ile są jeszcze dostępne. W przypadkach, gdzie dane osobowe zostały już usunięte zgodnie z zasadą minimalizacji, tradycyjny unlearning jest po prostu niemożliwy. NULLs całkowicie eliminuje te koszty: dezaktywacja sinka jest operacją zerowego kosztu, nie potrzebuje oryginalnych danych i wykonuje się w milisekundach. Dla firm planujących wprowadzenie asystentów AI opartych o dane klientów, wbudowanie tej architektury od początku jest racjonalnym zabezpieczeniem przed sankcjami.

Co dalej: od prototypu do wymogu

NULLs nie jest jeszcze dostępny jako gotowe narzędzie ‘z półki’, ale jego zasada jest na tyle prosta, że można ją dziś uwzględnić przy projektowaniu nowych systemów. Jeśli Twój zespół planuje wdrożenie LLM do przetwarzania danych osobowych, warto już teraz wymagać od dostawców, by architektura umożliwiała usuwanie wiedzy na poziomie źródła. Zamiast czekać na pierwszą karę, można zbudować system od razu zgodny z RODO w najtrudniejszym punkcie: realizacji prawa do bycia zapomnianym. To nie futurystyka – to architektura, która przeskalowała się do Wikipedii, i która może stać się standardem w ciągu najbliższych dwóch lat. Zacznij rozmowy ze swoim zespołem AI i dostawcami już dziś.

  • Natychmiastowa zgodność z RODO – dezaktywacja sinka zamiast wielotygodniowego retrenowania.
  • Koszty bliskie zeru – brak dostępu do oryginalnych danych, brak opłat za GPU.
  • Odporność na wycieki – testy adversarial extraction dowodzą, że usunięte informacje są nie do odzyskania.

Informacje o artykule

Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.

Paper: Natively Unlearnable Large Language Models

Autorzy: Gaurav R. Ghosal, Pratyush Maini, Aditi Raghunathan

Unlearning aims to remove the influence of specific training data sources, but this has proved challenging because the contributions of different sources are entangled within the model. Isolating source contributions to disjoint parameters makes removal easier, though it obstructs joint learning …

arXiv: arxiv.org/abs/2606.13873

Czytaj więcej o tej technologii: Sztuczna inteligencja, która potrafi zapomnieć na rozkaz. NULLs izoluje wiedzę, by ją usuwać bez szkody dla reszty

Artykuł wygenerowany ze wsparciem sztucznej inteligencji.

Leave a Reply

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *