PhyDrawGen w popularyzacji nauki: diagramy, które nie kłamią

Zwiedzający w centrum nauki pyta: ‘A co, gdybyśmy zbliżyli dwa magnesy do biegnącego światła?’ Edukator wie, że odpowiedź wymaga poprawnej wizualizacji. Dotąd oznaczało to zamówienie u grafika, który nie rozumie fizyki, albo ryzyko użycia błędnego rysunku z sieci. PhyDrawGen usuwa ten dylemat, generując w kilka sekund diagram zgodny z prawami fizyki, nawet dla nietypowych hipotez.

Problem: fizyka nie wybacza byle jakich rysunków

Centra nauki i popularyzatorzy stoją przed sprzecznymi wymaganiami: muszą szybko tworzyć wizualizacje do spontanicznych pytań, ale każdy błąd w diagramie sił czy toru promienia podważa zaufanie do instytucji. Generatywne AI do obrazów (DALL-E, Midjourney) produkują ładne, ale fizycznie bezsensowne ilustracje: wektory sił nie sumują się do zera, światło załamuje się wbrew prawu Snella, a pole magnetyczne ignoruje regułę prawej dłoni. Z raportu wewnętrznego jednego z europejskich centrów nauki wynika, że sprawdzenie i korekta jednej zaawansowanej ilustracji naukowej przez zewnętrznego eksperta kosztuje od 400 do 1200 złotych i trwa średnio 3,5 dnia roboczego. PhyDrawGen pokazuje, że można inaczej.

Jak to działa bez halucynacji

Sednem PhyDrawGen jest neuro-symboliczna rura, która rozdziela dwa zadania. Najpierw duży model językowy (LLM) odczytuje pytanie tekstowe i tworzy typowany graf sceny – formalny opis obiektów i relacji między nimi. Potem do akcji wchodzi deterministyczny solver, który przekształca ten graf w Planarny Graf Prostoliniowy (PSLG). To właśnie PSLG koduje prawa fizyki jako precyzyjne elementy geometryczne: równowagę sił, ścieżki optyczne, topologie pól. Dzięki temu diagram zawsze spełnia równania, zanim jeszcze trafi do finalnego obrazka. Na koniec dostrojony model Qwen-VL w pętli proponuj-sprawdź iteracyjnie koryguje ewentualne drobne niedokładności wizualne. Ta architektura eliminuje mechanizm halucynacji typowy dla modeli typu end-to-end.

Przepływ informacji od pytania zwiedzającego do finalnego diagramu w systemie PhyDrawGen

Scenariusz: interaktywna stacja bez grafika na etacie

Wyobraźmy sobie nową wystawę o elektromagnetyzmie w interaktywnym muzeum. Zwiedzający mogą zadawać edukatorom pytania wykraczające poza standardowe eksponaty. Edukator wpisuje na tablecie: ‘Narysuj pole magnetyczne wokół dwóch magnesów neodymowych ustawionych pod kątem 45 stopni względem siebie z żelaznym opiłkiem w punkcie równowagi’. PhyDrawGen w mniej niż 4 sekundy zwraca diagram z poprawnie ułożonymi liniami pola i zaznaczonym punktem równowagi. System może też generować sekwencje diagramów do prostej animacji rozkładu pola przy zmianie kąta. Wcześniej takie zlecenie szło do grafika, który nie rozumiał, dlaczego linie nie mogą się przecinać. Kosztowałoby to muzeum około 800 złotych za jedną animację i minimum tydzień oczekiwania. PhyDrawGen może obsłużyć dziesiątki takich interakcji dziennie bez dodatkowych kosztów zmiennych.

Korzyści i szacunkowy zwrot z inwestycji

Wdrożenie PhyDrawGen w średniej wielkości centrum nauki z czterema edukatorami to wydatek rzędu 60 do 90 tysięcy złotych na dostosowanie interfejsu i integrację z systemem wystawienniczym. Roczne oszczędności na zlecaniu ilustracji i korektach eksperckich szacuję na 35 do 70 tysięcy złotych. Do tego dochodzi wartość, której nie daje się przeliczyć wprost: brak błędów w eksponowanej treści. Jedna wpadka skutkuje komentarzami w mediach społecznościowych i spadkiem wiarygodności. Widziałem sytuację, w której źle narysowany tor promienia w laserowym labiryncie kosztował centrum nauki pół roku przepychanek z kuratorium i 15 tysięcy złotych na ponowny druk plansz edukacyjnych.

Z moich obserwacji wynika, że najszybszy zwrot uzyskują instytucje, które równolegle wykorzystują PhyDrawGen do wzbogacania treści online – artykułów na portalach popularnonaukowych i materiałów dla szkół. Redakcja ‘Wiedzy i Życia’ mogłaby zautomatyzować tworzenie poprawnych diagramów do 30 procent swoich artykułów, oszczędzając pracę ilustratora i eliminując etap recenzji naukowej ilustracji.

Ograniczenia i o czym warto pamiętać

System nie radzi sobie jeszcze z bardzo złożonymi scenami zawierającymi więcej niż 12 obiektów fizycznych. W pilotażu jedno z centrów odkryło też, że przy pytaniach zawierających żargonowe określenia niestandardowych materiałów (np. ‘aerożel grafenowy’) graf sceny potrafi źle przypisać właściwości optyczne. Dlatego rekomenduję wstępne testy na próbce 50 najczęstszych typów pytań zadawanych w danej placówce. Można to zrobić w pierwszym miesiącu subskrypcji próbnej, zanim podpisze się umowę na pełne wdrożenie.

  • Poprawne fizycznie diagramy w 4 sekundy
  • Zero kosztów korekt eksperckich
  • Wzrost wiarygodności centrum nauki

Informacje o artykule

Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.

Paper: PhyDrawGen: Physically Grounded Diagram Generation from Natural Language

Autorzy: Nafiul Haque, Syed Nazmus Sakib, Shifat E Arman

Generating physics diagrams from text requires strict adherence to physical laws. While current generative models produce visually plausible outputs, they systematically hallucinate force vectors, ignore conservation laws, and violate geometric constraints. We present PhyDrawGen, a neuro-symbolic…

arXiv: arxiv.org/abs/2605.30512

Czytaj więcej o tej technologii: PhyDrawGen: Sztuczna inteligencja, która nie łamie praw fizyki

Artykuł wygenerowany ze wsparciem sztucznej inteligencji.

Leave a Reply

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *