O truque de reconhecer um objeto só pelo toque
No depósito escuro do teatro, eu peguei um adereço cheio de carocinhas. Não dava pra olhar. Passei os dedos por pontos soltos, sem ordem, e guardei só os toques que gritavam mais. O lance é que uma nuvem de pontos 3D é isso: muitos toques fora de ordem que ainda contam o formato.
Por muito tempo, muita gente achou essas nuvens um caos. Aí tentavam arrumar os pontos em caixas certinhas, ou fazer desenhos de alguns ângulos, como se eu tivesse que passar tudo pra papel quadriculado antes de adivinhar. Nesse caminho, detalhe se perde e dá mais trabalho.
PointNet foi direto no toque. Ele lê cada ponto do mesmo jeito, um por um, e tira pequenos sinais de forma. Depois junta tudo com uma regra simples: em cada tipo de sinal, fica só com o mais forte de todos. Igual eu anotando o toque mais “de quina”, o mais “de borda”, e pronto. A ordem dos pontos não muda nada.
Só que o adereço pode estar virado na mão. Então ele tenta “endireitar” a nuvem primeiro, como eu girando o objeto até ficar num jeito familiar. E tem um cuidado: esse giro é empurrado pra ser um giro limpo, sem amassar nem esticar, pra não confundir formas diferentes.
Essa regra do “fica com o mais forte” tem um efeito curioso. No fim, só alguns pontos conseguem ganhar e virar os campeões dos sinais. São eles que convencem. Se muitos outros pontos somem, muitas vezes nada muda. Se aparecerem pontos ruins que não superam os campeões, também não muda. Isso ajuda quando falta pedaço ou tem sujeira na leitura.
Com um retrato geral do objeto na mão, dá pra fazer duas coisas. Uma é dizer o que é, como eu decidindo “isso é uma cadeira” sem ver. Outra é marcar partes: juntar o retrato geral com o sinal local de cada ponto e dizer “aqui é perna, aqui é assento”. A mesma ideia vale pra cenas, como separar chão, parede e móveis.
No depósito, eu não precisei desenhar grade nenhuma, nem tocar numa sequência certinha. Bastaram poucos toques bem fortes pra fechar o formato. Essa é a virada: dá pra sair de pontos crus e bagunçados direto pra uma resposta útil, e isso aguenta melhor o mundo torto, incompleto e cheio de coisa no caminho.