Redação do Site Inovação Tecnológica - 31/05/2019
Máquina derrota humano - de novo
Pesquisadores da empresa DeepMind, que pertence ao Google, criaram jogadores virtuais, ou bots, que aprenderam sozinhos - sem qualquer instrução prévia - a jogar dois videogames multijogadores em 3D na primeira pessoa.
Esses agentes de software alcançaram habilidades semelhantes às humanas, não apenas jogando sozinhos, mas também cooperando para atingir um objetivo comum.
Este é um avanço significativo em relação aos feitos anteriores da empresa, que envolveram derrotar jogadores humanos de xadrez e Go.
Os agentes de inteligência artificial, que aprenderam com base em uma técnica de aprendizado de máquina conhecida como "aprendizagem por reforço", demonstram uma capacidade incomum de desenvolver e usar estratégias de alto nível, aprendidas por eles próprios de forma independente, para competir e cooperar no ambiente do jogo.
Aprendizagem por reforço
A aprendizagem por reforço, um método usado para treinar agentes artificialmente inteligentes, já havia mostrado seu potencial ao gerar jogadores virtuais inteligentes capazes de navegar em ambientes de jogador único cada vez mais complexos, como xadrez e Go.
No entanto, a capacidade de disputar com vários jogadores simultaneamente, particularmente jogos que envolvem trabalho em equipe e interação entre vários jogadores independentes, nunca havia sido demonstrada justamente por ser algo de um nível de complexidade muito superior.
Max Jaderberg e seus colegas demonstraram o potencial do seu bot de inteligência artificial em partidas em primeira pessoa nos jogos Quake III Arena e Capture a Bandeira.
Em contraste com demonstrações anteriores, nas quais os agentes de inteligência artificial recebiam um "conhecimento" prévio sobre o ambiente do jogo ou o status dos outros jogadores, esta nova abordagem assegurou que cada agente de software aprendesse independentemente por sua própria experiência, usando apenas o que o próprio programa poderia "ver" - os píxeis da tela e a pontuação do jogo.
Um sistema de software desse tipo que seja incorporado em um robô também seria alimentado de informações da mesma forma, já que as câmeras fornecem justamente píxeis.
Derrotando ou cooperando com humanos
Colocados uns contra os outros, uma população de agentes de inteligência artificial aprendeu a jogar envolvendo-se em milhares de partidas em ambientes gerados aleatoriamente. Segundo os pesquisadores, com o tempo os agentes desenvolveram de forma independente estratégias surpreendentemente de alto nível, similares àquelas usadas por jogadores humanos de grande habilidade nos dois jogos.
Além disso, em partidas contra jogadores humanos, os agentes superaram os adversários humanos, mesmo quando os tempos de reação dos agentes eram reduzidos a níveis humanos.
Mais do que isso, os agentes formaram equipes tanto com outros agentes, quanto com outros jogadores humanos, e cooperaram com ambos rumo ao objetivo de ganhar a partida.
Tecnologia para o bem e para o mal
O feito é notável e deve ser comemorado porque pode-se pensar em inúmeras possibilidades de uso dessa tecnologia para o bem da humanidade.
Contudo, tem havido também alertas sobre a necessidade de estabelecer limites para a inteligência artificial, para pelo menos tentar direcionar a tecnologia para uma inteligência artificial do bem.
Conforme os programas começam a se mostrar superiores em situações de competição e, potencialmente, da violência embutida nos jogos de videogames, talvez seja a hora para começar a considerar os avanços tecnológicos na área sob uma perspectiva mais ampla.
Entre os temores estão a criação de robôs assassinos e a perda do controle humano sobre a inteligência artificial, uma vez que logo os programas de computador vão se programar sozinhos.