Logotipo do Site Inovação Tecnológica





Informática

Microsoft revela segredos da tecnologia do Kinect

Com informações da New Scientist - 28/03/2011

Microsoft revela segredos do Kinect
O Xbox roda o algoritmo 200 vezes por segundo, o que é cerca de 10 vezes mais rápido do que as técnicas anteriores de reconhecimento corporal.
[Imagem: Shotton et al.]

Com mais de 10 milhões de unidades vendidas em cinco meses desde o lançamento, o Kinect parece ter pago todos os investimentos em pesquisa e desenvolvimento.

Tanto que pesquisadores da Microsoft divulgaram o primeiro artigo técnico descrevendo as inovações que permitiram o lançamento do produto.

O artigo, assinado por oito pesquisadores da empresa, foi disponibilizado no site da Microsoft Research, datado de Junho de 2011 - quando ele será publicado em um periódico do IEEE.

"Floresta de decisões aleatórias"

Os pesquisadores descrevem como, a partir de uma única imagem, é possível reconhecer partes do corpo humano em tempo real.

O algoritmo associa cada pixel da imagem a uma parte do corpo humano, criando uma imagem um tanto borrada da pessoa.

Graças ao sensor infravermelho do Kinect, o programa consegue detectar também a distância de cada parte do corpo, atribuindo ao pixel o dado adicional de profundidade.

Cada pixel é inicialmente avaliado com relação a determinados parâmetros - por exemplo, se o pixel está na parte de cima ou na parte de baixo do corpo.

A pontuação de cada parâmetro é então combinada com uma busca através de uma "floresta de decisões aleatórias" - essencialmente uma coleção de decisões que avaliam se um pixel com um conjunto específico de características pode ser atribuído a uma parte específica do corpo.

Localização das juntas

Os pesquisadores treinaram o sistema usando uma biblioteca de imagens de captura de movimento.

Eles inicialmente coletaram 500.000 quadros, catalogando movimentos como dançando, chutando ou correndo. A seguir, eles resumiram o conjunto inicial a 100.000 quadros descartando aqueles que não apresentam uma distância em relação aos demais de mais do que cinco centímetros.

Uma vez que as partes do corpo são identificadas, o sistema calcula a provável localização das juntas para construir um esqueleto 3D.

O Xbox roda o algoritmo 200 vezes por segundo, o que é cerca de 10 vezes mais rápido do que as técnicas anteriores de reconhecimento corporal. Com isto, os jogadores podem ser rastreados com rapidez suficiente para que seus movimentos sejam incorporados nos jogos.

E a equipe de cientistas da Microsoft dá alguns indícios do que os fãs da dupla Xbox-Kinect podem esperar no futuro.

A equipe planeja agora estudar como melhorar a precisão do sistema calculando diretamente as posições das juntas, eventualmente descartando a detecção inicial das partes do corpo.

Isso permitirá que o algoritmo rode muito mais rapidamente, o que poderá ser revertido em ganhos de resolução - será que o Kinect 2 será capaz de detectar o movimento individual dos dedos, por exemplo?

Bibliografia:

Artigo: Real-Time Human Pose Recognition in Parts from a Single Depth Image
Autores: Jamie Shotton, Andrew Fitzgibbon, Mat Cook, Toby Sharp, Mark Finocchio, Richard Moore, Alex Kipman, Andrew Blake
Data: June 2011
Link: http://research.microsoft.com/apps/pubs/default.aspx?id=145347
Seguir Site Inovação Tecnológica no Google Notícias





Outras notícias sobre:
  • Imagens 3-D
  • Software e Programação
  • Equipamentos Eletrônicos
  • Telas e Monitores

Mais tópicos