DITTO: Jak słowna krytyka uczy AI lepszych manier
Dziecko uczy się, że nie wolno krzyczeć, bo rodzic mówi: 'to niegrzeczne'. DITTO – nowy model AI – działa podobnie. Zamiast suchych liczb, dostaje słowną krytykę i na jej podstawie poprawia swoje zachowanie w symulacjach.…
