Quatro microfones, uma voz só, e o truque que ninguém via
Na cabine da rádio comunitária, a locutora encosta na mesa. Quatro microfones pequenos ficam quase colados. Eu, no som, ouço tudo junto: a voz dela, um convidado ao lado, uma mota lá fora e a sala a devolver cada frase com um rasto de eco.
Ter vários microfones ajuda, mas só se eu usar as diferenças entre eles. No mesmo minuto eu quero três coisas: baixar o barulho, separar quem fala de quem interrompe e cortar o eco para as palavras não virarem uma papa. Pra limpar, antes preciso adivinhar o que cada microfone está a apanhar.
O jeito antigo é o do “operador com caderno de regras”. Eu olho os medidores e tento sacar de onde vem a voz e o que parece barulho igual em todos. Aí misturo os canais para apontar pra voz e apagar o resto. O lance é que esse palpite falha fácil num áudio real.
O jeito novo é o do “preset esperto”. Em vez de regras, ele aprende com muitos exemplos e já devolve um som mais limpo, ou pelo menos um mapa de quando cada pessoa está a falar. Funciona bem em confusão grande. Mas se a cabine muda, ele pode errar com toda a confiança.
A ideia que clareia tudo é pensar em dois blocos: um que estima o que está a acontecer, e outro que usa isso pra limpar. A diferença é onde a mistura dos microfones acontece. Nos híbridos, é como eu com um assistente: ele diz, a cada instante, qual microfone está mais “honesto”, e eu ajusto.
Quando o barulho é um chiado constante, um ajuste simples de botões já chega perto do melhor. Quando é risada, outra fala, coisas irregulares, aí não dá pra resumir num único truque fixo. No fim, eu olho a mesa e penso: bons palpites fazem metade do trabalho, e misturar bem faz a outra metade.