Kiedy maszyna ocenia wypracowanie: LLM-y kontra egzaminatorzy GCSE
Egzaminatorzy GCSE spierają się o oceny. Dwie osoby patrzą na ten sam arkusz, a punkty potrafią się różnić. Tymczasem model językowy wrzucony w ich rolę zgadza się z konsensusem częściej niż oni sami między sobą.…
