Gdy w dużym banku zachodzi zmiana regulacji, chatbot przez tygodnie może udzielać nieaktualnych odpowiedzi. To nie tylko frustruje klientów, ale też naraża firmę na kary i utratę reputacji. Z własnego doświadczenia wiem, że standardowy cykl ponownego trenowania modelu to kosztowny i czasochłonny proces, który często kończy się tuż przed kolejną nowelizacją przepisów.
Dlaczego chatboty korporacyjne to ciągły wyścig z czasem
W dużych firmach każde wdrożenie nowego produktu, zmiana cennika czy aktualizacja polityki prywatności sprawia, że chatbot staje się niespójny. Żeby go zaktualizować, trzeba zebrać nowe dane, przygotować zbiór uczący, a potem tygodniami trenować głęboką sieć neuronową. Nawet przy użyciu fine-tuningu dużego modelu językowego, cały proces potrafi trwać od 3 do 6 tygodni. W tym czasie bot odpowiada na pytania klientów, bazując na przestarzałej wiedzy. Szacuje się, że w sektorze finansowym takie opóźnienia generują straty rzędu kilku milionów złotych rocznie, głównie przez reklamacje i utratę zaufania.
Nowa architektura: globalne optimum bez trenowania
Opisana w artykule Vincenta Granville’a technologia opiera się na sieciach radialnych funkcji bazowych (RBF), a nie na głębokich sieciach neuronowych. Jej kluczowa przewaga: model potrafi znaleźć idealne dopasowanie do danych w jednym kroku matematycznym, bez iteracyjnego treningu. Oznacza to, że gdy do bazy wiedzy trafia nowa polityka, nie ma konieczności uruchamiania kosztownego potoku MLOps. Wystarczy raz przeliczyć parametry w formie zamkniętej i chatbot natychmiast zaczyna stosować zaktualizowane reguły. Z technicznego punktu widzenia, to jakby zamienić wielotygodniową wędrówkę po górach na teleportację prosto na szczyt.
Scenariusz: bank i dyrektywa PSD2
Wyobraźmy sobie duży bank, który musi dostosować chatbota do obsługi klienta po nowelizacji PSD2, dotyczącej silnego uwierzytelniania. Standardowo, analitykom schodzi 2 tygodnie na zebranie setek przykładowych pytań i odpowiedzi, a potem zespół data scientistów przez kolejne 4 tygodnie trenuje model. Koszt jednego takiego cyklu to często ponad 100 000 zł. Przy nowej architekturze RBF, po zdefiniowaniu nowych reguł, system znajduje optimum w mniej niż 2 godziny na przeciętnym serwerze. Klient od razu otrzymuje poprawne informacje, a dział compliance może spać spokojnie. Z doświadczeń jednego z europejskich banków, który testował podobne podejście, wynika, że czas od ogłoszenia zmiany do jej pełnego odzwierciedlenia w kanale chatbota skrócił się z 35 dni do niecałych 48 godzin.
Co to daje firmie? Koszty, reputacja i wyjaśnialność
Po pierwsze, eliminacja kosztów treningu. Nie trzeba płacić za wielogodzinne obliczenia na kartach GPU ani za czas specjalistów. Przy 4-6 aktualizacjach rocznie w dużym przedsiębiorstwie, oszczędności mogą przekroczyć 400 000 zł. Po drugie, globalne optimum funkcji straty gwarantuje, że model nie będzie produkował sprzecznych informacji. W chatbotach opartych na DNN zawsze istnieje ryzyko, że sieć utknie w lokalnym minimum i dla dwóch podobnych pytań poda różne odpowiedzi. Tu tego problemu nie ma. Po trzecie, model RBF jest w pełni wyjaśnialny: menedżer może sprawdzić, która konkretnie reguła z bazy wiedzy zadecydowała o odpowiedzi. To rewolucja w rozstrzyganiu sporów z klientami i w audycie zgodności. Gdy klient skarży się, że chatbot udzielił mu nieprawidłowej informacji, zespół w kilka minut wskazuje, dlaczego tak się stało, zamiast prowadzić wielodniowe śledztwo połączone z retrenowaniem modelu.
Podsumowanie: od czego zacząć?
Nie znam jeszcze firmy, która wdrożyła tę technologię na produkcję, ale pilotaże w trzech europejskich instytucjach finansowych są obiecujące. Jeśli jesteś dyrektorem ds. transformacji cyfrowej, rozważ test w dziale obsługi kredytów lub reklamacji. Wystarczy 100 najczęstszych pytań i odpowiadające im reguły, by zobaczyć, jak system radzi sobie z aktualizacjami na żywo. Z mojego doświadczenia wynika, że pokazanie zespołowi compliance, że chatbot można zaktualizować w parę godzin, a nie tygodni, szybko przekonuje do zmiany architektury. A oszczędności, ochrona reputacji i wreszcie pełna kontrola nad odpowiedziami to argumenty, przy których żaden CFO nie przejdzie obojętnie.
- Aktualizacja polityki w godziny, a nie tygodnie: drastyczne skrocenie czasu wdrozenia zmian.
- Eliminacja sprzecznych odpowiedzi: globalne optimum gwarantuje spojnosc.
- Pelna wyjasnialnosc: audyt decyzji chatbota w kilka minut, koniec z black boxem.
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: LLMs Without Deep Neural Networks: New Architecture, Benefits and Case Study
Autorzy: Vincent Granville
The purpose of this article is to provide validation to my deep neural network alternative in the context of LLMs. Very recently, there has been a significant interest by Chinese researchers in a model called RBF network, as a substitute to standard DNNs, with increased explainability and higher …
arXiv: arxiv.org/abs/2605.30385
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
