O contra-regra que ensinou um robô a olhar
Sob luzes cruas, o novo contra-regra passa por uma gaveta entreaberta, uma caneca no chão marcado, uma toalha na cadeira e uma máscara à espera da caixa certa. Nunca fez aquele espetáculo, mas viu muitos vídeos ao nível dos olhos e, com poucos exemplos ao vivo, já sabe o que mexer e o que deixar quieto.
Com robôs, isso costuma falhar. Muitos aprendem cada tarefa quase do zero, ou olham fotos paradas de objetos e depois precisam agir num canto apertado e confuso. É como treinar um contra-regra com álbum de adereços e esperar uma troca de cena sem tropeços. Falta o fio da ação.
A virada foi treinar o olhar do robô com uma montanha de vídeos gravados por pessoas, em primeira pessoa, com notas curtas em palavras simples. Momentos vizinhos da mesma ação ficavam ligados. As notas puxavam a atenção para o que mudava de verdade, como máscara na gaveta, e não para a cor da parede.
Aí veio outra escolha esperta. Em vez de refazer esse olhar para cada novo trabalho, os criadores mantiveram esses olhos como estavam e ensinaram só os movimentos, com poucos exemplos e a noção do próprio corpo. Como um contra-regra que leva o mesmo olhar treinado para peças diferentes e só aprende a sequência da noite.
Quando tiravam as notas em palavras, o tombo era o maior. Pior do que perder o resumo curto ou mexer em detalhes da imagem. No palco, seria um contra-regra rápido, mas sem saber qual objeto carrega a cena. A mão vai na caneca errada e a gaveta certa fica aberta.
Isso também apareceu fora do treino em tela. Num ambiente de casa, cheio de coisas espalhadas, bastaram 20 exemplos guiados por tarefa para esse robô fechar gavetas, pôr objetos no lugar, empurrar uma caneca e dobrar uma toalha melhor do que um sistema mais antigo, sobretudo quando precisava achar o alvo certo no meio da bagunça.