Die Sortierstraße, die Bildern das Sehen beibrachte

Das Förderband im Recyclinghof rattert, und alles liegt durcheinander: Flaschen, Dosen, Papier, Plastikfetzen. Wenn alles durch eine einzige große Sortiermaschine muss, staut sich der Kram. Die Schichtleitung sagt: Wir teilen auf mehrere Stationen auf, parallel, und führen am Ende wieder zusammen.

Genau so war es lange bei Programmen, die erkennen sollen, was auf einem Foto ist. Viele wurden einfach überall größer gemacht. Das kostet viel Speicher und Rechenarbeit, als würde man jedes Teil durchs gleiche Monstergerät pressen, auch wenn es nur einen kurzen Blick braucht.

Dann kam die Idee mit den Spuren nebeneinander. An derselben Stelle im Bild schauen mehrere „Stationen“ gleichzeitig: eine findet winzige Hinweise, eine mittlere, eine große Formen, und eine glättet nur kurz. Wie im Recycling: verschiedene Größen prüfen, dann die Ergebnisse zusammenkippen. Merksatz: Mehrere Größen auf einmal sehen mehr als eine Einheitsprüfung.

Aber viele Stationen können auch teuer werden. Darum schalten sie erst eine schnelle Vorsortierung davor, damit die langsamen Geräte weniger zu tun haben. Im Bild-Teil ist das ein winziger Check, der die Informationsflut zusammenfasst, bevor die schweren Prüfungen laufen. Und er gibt dem Ganzen noch eine kleine Extra-Entscheidung mit.

Mit vielen solcher Mehrspur-Stufen hintereinander blieb das System tief, ohne völlig aus dem Ruder zu laufen. Beim Üben hingen sie unterwegs kleine Nebenprüfer dran, wie kurze Qualitätskontrollen an der Linie. Die melden früh zurück, wenn vorn etwas schief läuft. Später nimmt man sie wieder ab, übrig bleibt der Hauptweg.

Bei einem großen Bilderkennen-Wettbewerb im Jahr 2014 landete dieses Design weit vorn und brauchte trotzdem weniger gespeicherte Zahlen als viele frühere Brocken. Der Denkfehler davor war: „Nur größer hilft.“ Am Förderband sieht man’s sofort: Besser ist, klug aufzuteilen, und erst schnell vorzusortieren, bevor die teuren Stationen anlaufen.