Как театр научил компьютеры узнавать картинки
За кулисами старого театра два осветителя сидят у разных пультов. Сцены мелькают так быстро, что ошибку зритель заметит сразу. Это похоже на то, как компьютер учат узнавать, что на фото, пульты как видеокарты, листы с подсказками как названия вещей. Смысл простой, точные сигналы рождаются из многих маленьких решений подряд.
Долгое время спасал толстый блокнот правил, куда записали, как реагировать на края, пятна и цвета. Ну и вот шоу разрослось, фото стало слишком много, и названий вещей тоже. Старые правила путались, если менялся свет, ракурс или фон.
Тогда вместо блокнота собрали длинную цепочку постов. Первые ловят простые линии и куски цвета, следующие складывают их в шерсть, колеса, лица, а дальше в целые предметы. Убери даже один пост, и дальше по цепи не на что опереться, сигналы сыпятся.
Потом уперлись в скорость. Старые кнопки будто вязли в середине, рука тянула время. Поставили четкий переключатель, либо молчит, либо срабатывает сразу, когда сигнал достаточно сильный. В программе это правило ReLU, оно резко ускорило обучение и позволило держать цепочку длинной.
А потом уперлись в размер. Один пульт не вмещал все провода и подсказки, и работу разделили на два пульта. Каждый ведет свою часть почти всегда сам, а сверяются они лишь в заранее выбранные моменты. Так система стала больше, но не стала медленнее на прогоне.
Оставалось не дать себе обмануться привычкой. На репетициях они смотрели на сцену с разных мест, иногда зеркалили картинку, чуть меняли яркость и цвет. В самых шумных узлах цепочки иногда выключали случайные каналы, чтобы никто не держался за друзей, и ровняли слишком громкие сигналы. Даже прожекторы двигали с перекрытием, чтобы не терять детали между кусками.
После долгих прогонов на двух пультах цепочка начала уверенно обгонять старые команды с блокнотами, а несколько таких цепочек вместе работали еще точнее. Никакой магии, просто рецепт, много слоев, быстрые переключатели, разделение работы и защита от заучивания. Теперь привычно, что техника сортирует и ищет фото куда надежнее, чем набор ручных правил.