A mélytanulásos modellek teljesítménye nagyban múlik azon, hogy milyen tanítóadattal etetjük őket. Az ipari környezetben azonban manuális adatgyűjtés és annotálás több száz munkaórát is felemészthet – és még így sem biztos, hogy minden eshetőséget lefed.

Az ACSG fejlesztési csapata ezért szintetikus adatgenerálás mellett döntött. Blender segítségével olyan mesterséges képeket hoztunk létre, amelyek a csatlakozóházak különféle típusait, orientációit, megvilágítási körülményeit és háttereit jelenítik meg – akár ezerféle variációban.

Miért hatékony ez? Mert a szintetikus képek:

gyorsan és tömegesen előállíthatók;

pontosan annotálhatók (hiszen az objektum pozíciója ismert a szimulációban);

kontrollálható módon lefedik a ritka, de kritikus eseteket is (pl. részleges takarás, szélsőséges fényviszony).

A hibrid megközelítés – manuális és szintetikus képek kombinálása – olyan adatkészletet eredményezett, amely kiváló alapot adott a YOLOv8 és egyéb detektáló hálók tanításához. A tanulság egyértelmű: ha gyorsan, pontosan és skálázhatóan akarunk tanítani, a szintetikus adatok kulcsszerepet játszanak.