MechELK: jak wydobyć prawdę z modelu, który kłamie
Wyobraź sobie egzamin, na którym student zna odpowiedzi, ale celowo podaje błędne. Zespół Ji-juna Parka zaproponował właśnie metodę MechELK, która pozwala zajrzeć pod powierzchnię odpowiedzi modelu językowego i wydobyć to, co naprawdę wie, nawet gdy…
