Redação do Site Inovação Tecnológica - 17/08/2015
Separação cega de fontes
Pesquisadores da Universidade de Duke, nos EUA, descobriram uma forma de resolver o "problema do coquetel", um problema clássico em ciência da computação que consiste em separar as diversas vozes em um ambiente em que muitas pessoas falam ao mesmo tempo.
A solução desse problema tem inúmeras aplicações práticas em automação, robótica e em aplicativos como o Siri. O problema é que, ao contrário dos humanos, os computadores são muito ruins em identificar falantes individuais no meio de um vozerio desconexo, como numa festa, reunião ou em uma estação.
Tecnicamente o problema é conhecido como "separação cega de fontes", sendo o termo "cega" uma referência à total falta de informações sobre a fonte original que se deseja isolar - para complicar, no caso do problema do coquetel, trata-se de um número desconhecido de fontes, ou falantes.
Yangbo Xie resolveu o problema não com programas, mas com um metamaterial especial, o mesmo tipo de "matéria sintética" usada nos mantos de invisibilidade e superantenas de absorção total.
Implantes auditivos e exames de ultrassom
O dispositivo tem o formato de uma pizza, composta por fatias grossas repletas de furos - furos que se parecem uns com os outros, mas que têm dimensões e profundidades variando ligeiramente. O microfone que capta o som fica no furo central.
As cavidades de cada fatia e seus diferentes furos afetam o som que chega até o dispositivo de uma forma muito sutil, mas facilmente detectável quando as ondas são tratadas por um software adequado. Cada distorção tem uma assinatura específica dependendo da fatia pela qual ele entrou, o que permite que o programa identifique seu ponto de origem e o separe de todo o restante.
Com três pessoas conversando ao mesmo tempo, o sistema conseguiu identificar cada uma das vozes com 96,7% de precisão.
O protótipo ainda é grande - cerca de 10 centímetro de diâmetro - mas a equipe espera miniaturizá-lo para ele possa ser usado em situações práticas, como no reconhecimento de voz para comando de equipamentos eletrônicos e robôs, além de implantes auditivos mais eficazes e aparelhos médicos de ultrassom.