Redação do Site Inovação Tecnológica - 27/09/2023
Sistema acústico inteligente adaptativo
Algoritmos de inteligência artificial capazes de aprender a lidar com acústica conseguiram controlar um sistema de microfones para que ele silencie áreas escolhidas de uma sala ou separe conversas simultâneas, mesmo que duas pessoas com vozes semelhantes estejam sentadas lado a lado.
O sistema acústico inteligente adaptativo usa microfones para rastrear os sons e dividir a sala em zonas de sonoridade ou silêncio. Embora isto ainda não esteja totalmente implementado, a ideia é que as informações dos microfones sejam processadas e usadas para controlar um sistema de alto-falantes.
Lembrando uma pequena frota de aspiradores de pó robóticos, só que muito menores (2,5 cm de diâmetro cada um), os microfones se autoposicionam para fazer seu trabalho, retornando automaticamente para uma estação de carregamento quando ficam sem energia. Isso permite que o sistema seja movido entre ambientes e configurado automaticamente. Numa sala de conferências, por exemplo, o sistema pode ser implantado em substituição aos atuais sistemas de microfone central, permitindo um melhor controle do áudio na sala.
"Se eu fechar os olhos e houver 10 pessoas conversando em uma sala, não tenho ideia de quem está dizendo o que e onde exatamente elas estão na sala. Isso é extremamente difícil para o cérebro humano processar. Até agora, também tem sido difícil para a tecnologia," comentou o professor Malek Itani, da Universidade de Washington. "Pela primeira vez, usando o que chamamos de 'enxame acústico' robótico, fomos capazes de rastrear as posições de várias pessoas conversando em uma sala e separar suas falas."
Embora já existam camuflagens acústicas, para gerar áreas de silêncio absoluto, técnicas para gerar zonas de silêncio, absorvedores acústicos perfeitos e até garrafas acústicas, sistemas robóticos autoimplantáveis, versáteis o suficiente para funcionar em qualquer ambiente, exigiam o uso de câmeras suspensas, projetores ou superfícies especiais. Este novo sistema distribui com precisão o enxame de robôs usando apenas o próprio som.
Controle do som ambiente
O protótipo da equipe consiste em sete pequenos robôs que se espalham sobre mesas de qualquer tamanho. À medida que deixam sua garagem, junto ao carregador, cada robô emite um som de alta frequência, como um morcego em voo, e usa essa frequência e outros sensores para evitar obstáculos e se movimentar sem cair da mesa. A implantação automática permite que os robôs se posicionem com precisão máxima, permitindo maior controle de som do que se uma pessoa os configurasse.
Os robôs se dispersam o mais longe possível uns dos outros, já que distâncias maiores facilitam a diferenciação e a localização das pessoas quando falam. Para comparação, os alto-falantes inteligentes que você compra hoje, principalmente para funções de cancelamento de ruído, têm vários microfones, mas agrupados no mesmo dispositivo, de modo que eles ficam próximos demais para permitir as zonas "mudo" e "silêncio" ativas geradas por este sistema.
"Se eu tiver um microfone a 30 centímetros de distância de mim e outro microfone a 60 centímetros de distância, minha voz chegará primeiro ao microfone que está a 30 centímetros de distância. Se outra pessoa estiver mais perto do microfone que está a 60 centímetros de distância, a voz dela chegará lá primeiro," detalha Tuochao Chen, membro da equipe. "Desenvolvemos redes neurais que usam esses sinais retardados no tempo para separar o que cada pessoa está dizendo e rastrear suas posições em um espaço. Assim, você pode ter quatro pessoas tendo duas conversas e isolar qualquer uma das quatro vozes e localizar cada uma das vozes em uma sala."
A equipe testou os robôs em escritórios, salas de estar e cozinhas com grupos de três a cinco pessoas conversando. Em todos esses ambientes, o sistema conseguiu discernir vozes diferentes a até 50 centímetros uma da outra em 90% do tempo, sem informação prévia sobre o número de falantes. O sistema foi capaz de processar três segundos de áudio em 1,82 segundo em média - rápido o suficiente para transmissão ao vivo, embora um pouco lento para comunicações em tempo real, como chamadas de vídeo.
Cone do silêncio
À medida que a tecnologia avançar, dizem os pesquisadores, enxames acústicos poderão ser implantados em casas inteligentes para diferenciar melhor as pessoas que falam com alto-falantes inteligentes. Isso poderia permitir que apenas pessoas sentadas em um sofá, em uma "zona ativa", controlem vocalmente uma TV, por exemplo. Eles também pretendem que seu enxame de robôs se torne capaz de navegar autonomamente por salas, e não apenas por mesas.
Mas a meta final é chegar a um sistema no qual alto-falantes possam emitir sons para criar zonas ativas e zonas mudas no mundo real, para que pessoas em diferentes partes de uma sala possam ouvir áudios diferentes, algo como o "cone do silêncio" da série Agente 86.