Der Requisitenfund im Dunkeln und die Kunst, Punkte zu verstehen
Im Lagerraum hinter der Bühne ist das Licht aus. Meine Hand findet eine Requisite mit lauter kleinen Hubbeln. Ich taste kreuz und quer, ohne Plan. Ein paar Stellen fühlen sich so eindeutig an, dass sie mir das ganze Ding verraten. Merksatz: Viele ungeordnete Tastpunkte reichen, wenn die stärksten Hinweise bleiben.
Lange hat man solche Punktwolken gemieden, weil sie wie ein chaotischer Haufen wirken. Man hat die Punkte erst in klobige Kästchen gepresst oder in ein paar Bilder umgemalt. Das ist, als müsste ich die Requisite erst auf kariertes Papier übertragen. Dabei gehen feine Kanten leicht verloren.
PointNet nimmt die Punkte direkt. Jeder Punkt bekommt denselben kleinen Check, wie mein Finger bei jedem Hubbel. Daraus kommen kurze Hinweis-Signale. Dann kommt der Trick: Für jede Hinweis-Art zählt nur der stärkste Treffer aus allen Punkten, egal in welcher Reihenfolge die Punkte kommen. Mischen ändert nichts.
Dann rutscht mir die Requisite in der Hand und liegt verdreht. PointNet baut deshalb erst eine Art Ausricht-Hilfe ein, die versucht, das Objekt gerade zu drehen, bevor es entscheidet. Dabei wird es gebremst, damit es nicht aus Versehen quetscht oder streckt. Sonst würden verschiedene Formen zu ähnlich wirken.
Das Sammeln der stärksten Hinweise hat eine Nebenwirkung. Am Ende gewinnen nur wenige Punkte wirklich, weil nur sie irgendwo den höchsten Wert liefern. Das sind die entscheidenden Taststellen. Viele andere Punkte kann man weglassen, ohne dass sich das Gesamtbild groß ändert. Extra Störpunkte bringen auch wenig, wenn sie nie stärker sind.
Mit dem Gesamtbild kann PointNet zwei Dinge tun. Es kann sagen, was das Objekt ist, als würde ich endlich murmeln: Stuhl oder Lampe. Oder es kann Teile markieren. Dann wird das Gesamtbild zu jedem Punkt zurückgegeben, und jeder Punkt bekommt sein Teil-Etikett, wie Griff, Sitz oder Bein.
Als ich die Requisite zurück ins Regal lege, merke ich den Unterschied. Ich musste nichts ordentlich auslegen und nichts nachzeichnen. Ein paar klare Tasttreffer haben gereicht, obwohl vieles im Dunkeln blieb. Genau so kann man aus rohen 3D-Punkten brauchbare Antworten holen, auch wenn Scans lückenhaft oder schräg sind.