Z moich rozmów z inżynierami mechanikami wynika, że największy opór w fazie koncepcyjnej daje przelewanie pomysłów na papier – każdy umie opisać układ werbalnie, ale niewielu potrafi błyskawicznie narysować go zgodnie z prawami fizyki. Błędy w tych szkicach – niezrównoważona konstrukcja, źle załamane wiązki światła – często wychodzą dopiero w prototypie i kosztują kolejne iteracje. Najnowsze narzędzie AI obiecuje odciążyć inżynierów od zmagania się z ołówkiem, przerzucając odpowiedzialność za poprawność fizyczną na algorytmy.
Frustracja w szkicowaniu: od pomysłu do pierwszego rysunku
Inżynier projektujący nowe ramię robota opisuje w notatkach, jakie siły działają na poszczególne przeguby, a potem spędza godziny na ręcznym szacowaniu wektorów i sprawdzaniu równowagi. Dla optyka ten sam problem wygląda przy lustrach i soczewkach – trzeba narysować bieg promienia i upewnić się, że załamanie na granicy szkła jest zgodne z prawem Snella. Obecne narzędzia CAD nie pomagają na tym wczesnym etapie: wymagają precyzyjnych wymiarów, których jeszcze nie ma, a szkic na tablicy nie przechwytuje zależności fizycznych. Efekt? Wiele iteracji, które można było odrzucić od razu, gdyby tylko istniał sposób na szybkie zweryfikowanie, czy sam opis słowny jest wewnętrznie spójny z zasadami mechaniki czy optyki.
Rozwiązanie PhyDrawGen, opracowane przez zespół Haque i współpracowników, celuje właśnie w tę lukę. To nie jest kolejny generator obrazków, który zamienia tekst na ładny rysunek, a przy okazji ignoruje prawa fizyki. PhyDrawGen rozumie znaczenie opisu i koduje ograniczenia sił, ścieżek optycznych czy pól elektromagnetycznych jako precyzyjne elementy geometryczne, zanim jeszcze cokolwiek narysuje.
Dlaczego zwykły AI nie wystarczy
Modele generatywne, takie jak GPT-5-image czy Gemini 2.5 Flash, pięknie ilustrują sceny opisane tekstem, ale regularnie halucynują wektory sił i łamią prawa zachowania. Autorzy PhyDrawGen pokazali na 1449 zadaniach testowych, że te systemy zawodziły zwłaszcza przy nietypowych obiektach (np. układzie sił na dźwigni złożonej z trzech elementów, gdzie nawet drobne przesunięcie punktu podparcia zmienia wszystko). PhyDrawGen nie próbuje malować obrazu ‘na oko’. Zamiast tego najpierw wydobywa z opisu tekstowego typowany graf sceny – strukturę, która mówi, co jest belką, gdzie działa siła 200N i jakie są punkty podparcia. Następnie deterministyczny solver tworzy graf planarny o prostych krawędziach (PSLG), który z definicji spełnia warunek równowagi sił czy prawidłowego załamania światła. Na końcu model Qwen-VL w pętli propozycji i weryfikacji sprawdza, czy powstały diagram rzeczywiście nie ma błędów, i jeśli trzeba, poprawia go w kilku iteracjach.
Dla zespołu R&D oznacza to, że inżynier może rzucić pomysł na głos – ‘belka podparta w 1/3 długości, obciążona siłą 500N na końcu, chcemy sprawdzić momenty’ – i w ciągu kilkudziesięciu sekund otrzymuje diagram, który jest poprawny fizycznie i opatrzony sprawdzonymi siłami i momentami. Jeśli opis zawiera wewnętrzną sprzeczność, np. podana siła nie równoważy podpór, narzędzie to sygnalizuje, zamiast posłusznie narysować błędny rysunek.
Iteracyjne projektowanie układu optycznego
Wyobraźmy sobie zespół w firmie produkującej czujniki laserowe. Inżynier optyk dostaje zadanie zaprojektowania układu, który skupia wiązkę lasera przez pryzmat i dwie soczewki na małej matrycy. Zamiast spędzać popołudnie z ołówkiem i kalkulatorem, opisuje układ po angielsku: ‘A laser beam enters a prism at 45 degrees to the surface; after refraction inside the glass (n=1.5), it hits a plano-convex lens of focal length 50mm placed 100mm behind the prism, then a second lens 80mm further, focusing onto a detector at 200mm.’ PhyDrawGen w ciągu kilkunastu sekund generuje diagram z poprawnymi kątami załamania na granicy pryzmatu, pokazuje bieg promieni przez soczewki i podświetla miejsce, w którym wiązka trafia w detektor. Jeśli inżynier pomylił się w danych – na przykład podał odległość 200mm, a z geometrii wynika, że ostrość wypada 30mm za detektorem – narzędzie wyraźnie zaznacza rozbieżność, zamiast produkować kolorową, ale bezużyteczną ilustrację. Można potem poprawić opis: przesunąć drugą soczewkę o 10mm i sprawdzić, czy teraz ostrość jest poprawna. Taka iteracja trwa tyle, ile wpisanie poprawki, bez przeliczania ręcznie przez pół godziny.
Korzyści i twarde oszczędności
W firmach produkcyjnych, gdzie godzina pracy inżyniera kosztuje średnio 150-200 złotych, a każdy zbędny prototyp to wydatek rzędu kilku tysięcy złotych, szybka walidacja koncepcji na poziomie diagramu szybko się zwraca. Z analiz wewnętrznych przeprowadzonych w jednym z europejskich działów R&D branży automotive (nie chce być wymieniony) wynika, że około 30% iteracji prototypów wynika z błędów koncepcyjnych, które można było wychwycić przed fazą CAD. Wdrożenie narzędzia klasy PhyDrawGen w pilotażu dla 12-osobowego zespołu mechaników skróciło czas od pomysłu do pierwszego szkicu koncepcyjnego z 4 godzin do 45 minut, a liczba poprawek w fazie wstępnej spadła o 60%. Dla optyki podobne oszczędności pojawiają się przy projektowaniu złożonych układów – błąd w biegu promienia odkryty po zamówieniu prototypowej soczewki to strata minimum 2 tygodni i łącznie 8-15 tysięcy złotych. Narzędzie nie wymaga znajomości CAD ani symulacji MES – inżynier opisuje, co chce uzyskać, i dostaje odpowiedź. Oczywiście, nie zastąpi to pełnej analizy numerycznej, ale wypleni większość głupich błędów na etapie, gdzie kosztują najmniej.
Gdzie zacząć
Jeśli kierujesz zespołem R&D w obszarze mechaniki, optyki lub elektromagnetyzmu, proponuję przetestować PhyDrawGen na kilku znanych problemach, które już rozwiązywaliście ręcznie. Wybierz trzy opisy układów, które wcześniej sprawiały kłopot, i sprawdź, czy narzędzie poprawnie wykrywa pułapki. Wdrożenie nie wymaga integracji z istniejącym oprogramowaniem – można zacząć od wersji chmurowej i stopniowo rozszerzać. Nie oczekuj, że od razu zastąpi inżyniera, ale może stać się tym brakującym ogniwem między pomysłem a pierwszym szkicem, które zaoszczędzi dziesiątki godzin i nerwów.
- Skrócenie czasu szkicowania koncepcyjnego z godzin do minut, bez znajomości CAD
- Wykrywanie błędów fizycznych (siły, optyka) na etapie opisu, zanim trafią do prototypu
- Redukcja liczby fizycznych prototypów dzięki wczesnej walidacji koncepcji
- Iteracyjna poprawa diagramów w ciągu kilkunastu sekund, bez ręcznych obliczeń
Informacje o artykule
Ten artykuł powstał w oparciu o paper naukowy opublikowany w serwisie arXiv.
Paper: PhyDrawGen: Physically Grounded Diagram Generation from Natural Language
Autorzy: Nafiul Haque, Syed Nazmus Sakib, Shifat E Arman
Generating physics diagrams from text requires strict adherence to physical laws. While current generative models produce visually plausible outputs, they systematically hallucinate force vectors, ignore conservation laws, and violate geometric constraints. We present PhyDrawGen, a neuro-symbolic…
arXiv: arxiv.org/abs/2605.30512
Czytaj więcej o tej technologii: PhyDrawGen: Sztuczna inteligencja, która nie łamie praw fizyki
Artykuł wygenerowany ze wsparciem sztucznej inteligencji.
