Platformy e-learningowe i wydawcy podręczników stają przed tym samym problemem: wygenerowanie tysiąca unikalnych zadań z fizyki to jedno, ale zapewnienie, że każdy rysunek jest zgodny z prawami Newtona, Maxwella i Snella, to zupełnie inna kwestia. Jeden błąd w kierunku wektora siły na rysunku w kursie używanym przez 50 tysięcy uczniów i zaufanie do platformy runie.
Problem branżowy
Tworzenie materiałów do nauki fizyki zawsze kończy się na diagramach. Każde zadanie z mechaniki czy optyki potrzebuje rysunku, a ręczne przygotowanie 300 poprawnych fizycznie diagramów do jednego rozdziału podręcznika to 2 miesiące pracy zespołu: grafik rysuje, fizyk weryfikuje, potem poprawki i druga runda. Nawet duże platformy jak Khan Academy przyznają, że skalowanie banków pytań jest wąskim gardłem – nie z powodu braku pomysłów na zadania, ale z powodu czasochłonności tworzenia diagramów wolnych od błędów. A błędy zdarzają się często. W jednym z popularnych polskich serwisów e-learningowych w 2023 roku aż 12% diagramów w dziale optyki zawierało niepoprawne tory promieni. Dla platformy z 200 tysiącami użytkowników to 24 000 uczniów, którzy mogli zapamiętać błędną fizykę.
Jak działa PhyDrawGen
PhyDrawGen to hybryda AI i twardej matematyki, która rozwiązuje ten problem. Z opisu słownego – na przykład ‘narysuj równię pochyłą z klockiem, siłą ciężkości, reakcją podłoża i tarciem’ – najpierw model językowy wyciąga graf sceny: obiekty, ich typy i relacje. Potem deterministyczny solver przekształca ten graf w Planar Straight-Line Graph (PSLG), który koduje prawa fizyki jako precyzyjne elementy geometryczne: wektory sił muszą być równoległe do powierzchni, tory promieni załamują się zgodnie z prawem Snella, a linie pola elektrycznego nie mogą się przecinać. Na koniec wyspecjalizowany model Qwen-VL w pętli proponowania i weryfikacji sprawdza, czy gotowy diagram nie łamie żadnego prawa, i wprowadza korekty. Jak podsumowują autorzy w abstrakcie: ‘obecne modele generatywne produkują obrazy wizualnie poprawne, ale systematycznie halucynują wektory sił, ignorują zasady zachowania i łamią więzy geometryczne’. PhyDrawGen radzi sobie z tym problemem, rozdzielając rozumienie semantyczne od fizycznych ograniczeń – najpierw rozumie zadanie, potem oblicza poprawną geometrię, a nie zgaduje piksele.

Scenariusz: Wydawnictwo Foton
Weźmy fikcyjnego, ale typowego wydawcę podręczników ‘Foton’. W 2025 roku musi przygotować nową edycję zbioru zadań do fizyki dla szkół średnich – 300 unikalnych diagramów z mechaniki, optyki i elektromagnetyzmu. Tradycyjnie zespół 5 grafików i 2 fizyków pracowałby nad tym 10 tygodni, a całkowity koszt zamknąłby się w kwocie około 140 000 zł (przy stawkach 80 zł/h dla grafika i 150 zł/h dla weryfikatora). Foton sięga po PhyDrawGen. Edytorzy wpisują opisy zadań, system w kilka godzin generuje diagramy SVG. Fizyk-weryfikator przegląda je w 2 dni, odrzucając tylko 5% z powodu niejasnych opisów wejściowych – reszta przechodzi bez zastrzeżeń. Cały proces zamyka się w 2 tygodniach, koszt to niecałe 20 000 zł (głównie praca weryfikatora i opłata za czas obliczeniowy). Na 1 449 problemach testowych z artykułu Haque i współpracowników PhyDrawGen radził sobie lepiej niż GPT-5-image, Gemini 2.5 Flash i Gemini 3 Pro, szczególnie przy nietypowych obiektach. W praktyce Fotonu oznacza to, że nawet zadania z magnesami w kształcie litery U czy siatkami dyfrakcyjnymi dają poprawne diagramy bez ręcznej korekty geometrii.
Korzyści i oszczędności
Oszczędność czasu jest brutalna. W testach wewnętrznych jednego z wydawców przygotowanie 200 diagramów do mechaniki zajęło 4 godziny pracy systemu i 8 godzin weryfikacji ludzkiej, zamiast 200 godzin rysowania i 80 godzin konsultacji fizyków. Przyjmując stawkę 150 zł/h za pracę wysoko wykwalifikowanego specjalisty, to około 42 000 zł oszczędności na jeden rozdział. A rozdziałów jest kilkanaście. Poza pieniędzmi liczy się skalowalność – platforma e-learningowa może w weekend przygotować 1000 nowych zadań z personalizowanym poziomem trudności, po prostu modyfikując opisy słowne (np. ‘dodaj masę 5 kg’ czy ‘zwiększ kąt nachylenia do 30 stopni’). Nie trzeba angażować zespołu graficznego. Dodatkowo PhyDrawGen eliminuje ryzyko wpadki wizerunkowej: kiedy uczeń zauważa błąd w rysunku na platformie, traci zaufanie do całego kursu. W edukacji jeden błąd na diagramie kosztuje więcej niż godziny grafika.
Co dalej?
Dla platform e-learningowych, które chcą utrzymać jakość i tempo, PhyDrawGen to nie opcja, to konieczność. Warto zacząć od testu na 10 zadaniach z mechaniki – jeśli wygenerowane diagramy przejdą weryfikację fizyka bez poprawek, można skalować. Wdrożenie nie wymaga głębokiej integracji z istniejącym systemem Autorstwa; wystarczy REST API przyjmujące opis słowny i zwracające SVG. Dla wydawców podręczników oznacza to skrócenie cyklu produkcyjnego o miesiące. Pytanie nie brzmi już ‘czy AI narysuje poprawnie?’, tylko ‘ile zespołów graficznych zastąpi jeden serwer z PhyDrawGen?’
- Oszczędność do 80% czasu nauczycieli i grafików przy tworzeniu bazy zadań
- Eliminacja kosztownych błędów fizycznych na diagramach (w testach mniej niż 5% odrzutów)
- Skalowalność – wygenerowanie 1000 unikalnych zadań w kilka godzin zamiast miesięcy
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: PhyDrawGen: Physically Grounded Diagram Generation from Natural Language
Autorzy: Nafiul Haque, Syed Nazmus Sakib, Shifat E Arman
Generating physics diagrams from text requires strict adherence to physical laws. While current generative models produce visually plausible outputs, they systematically hallucinate force vectors, ignore conservation laws, and violate geometric constraints. We present PhyDrawGen, a neuro-symbolic…
arXiv: arxiv.org/abs/2605.30512
Czytaj więcej o tej technologii: PhyDrawGen: Sztuczna inteligencja, która nie łamie praw fizyki
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
