Redação do Site Inovação Tecnológica - 20/04/2023
Gargalo do hardware para IA
O mundo todo está falando sobre os mais novos aplicativos de inteligência artificial, sobretudo sobre o poder das redes neurais e dos modelos de linguagem que permitem responder perguntas diretas.
O que poucos têm-se lembrado é que o software é sempre limitado pelo hardware no qual roda, e o hardware atual não tem seguido o ritmo do desenvolvimento dos algoritmos e das montanhas de dados que esses programas analisam, criando um gargalo que já está retardando o progresso da área.
Por exemplo, enquanto o tamanho das redes neurais necessárias para aplicações de IA e ciência de dados tem dobrado a cada 3,5 meses, a capacidade de hardware necessária para processá-las tem dobrado apenas a cada 3,5 anos.
Mas há gente trabalhando nisto, e a mais recente novidade acaba de ser anunciada por Mingyi Rao e colegas da Universidade do Sul da Califórnia: É o que a equipe chama de "um novo tipo de chip com a melhor memória em qualquer chip já feito até hoje".
Duas tecnologias para duas funções
A inovação envolve os memoristores, os componentes básicos da computação neuromórfica, assim como os transistores são os componentes básicos da computação eletrônica tradicional. A diferença com os transistores é que esses componentes, além de fazer o processamento, têm memória.
Na verdade, eles podem ter vários níveis de memória, rompendo as limitações da eletrônica digital e rumando para a eletrônica analógica, com estados continuamente variáveis. Isso na teoria, porque ainda não era possível tirar proveito desses vários níveis de memória na prática.
Foi isto que Mingyi Rao e seus colegas conseguiram: "Nós identificamos a física subjacente que anteriormente limitava o número de níveis de condutância que podem ser alcançados em memoristores e desenvolvemos protocolos de operação elétrica para evitar tais limitações," escreveu a equipe.
Mas eles fizeram mais do que isso, integrando os memoristores, tipicamente feitos de óxidos metálicos, com a eletrônica tradicional baseada em silício, uma combinação que garantiu elevado poder de processamento com baixo consumo de energia.
Isto permitiu construir um chip híbrido com a maior densidade de informação por dispositivo - 11 bits - entre todos os tipos de tecnologias de memória conhecidas até agora. Além disso, a tecnologia não se aplica apenas à memória, mas também ao processador. Ou seja, não é apenas uma questão de adensamento, mas também de eficiência energética, já que armazenamento e processamento ocorrem no mesmo chip.
Assim, milhões desses novos componentes juntos em um pequeno chip, trabalhando em paralelo para executar rapidamente suas tarefas de IA, podem rodar com a energia fornecida por uma pequena bateria. Isso viabiliza aplicações de computação na borda, mais especificamente aplicações de inteligência artificial rodando em aparelhos portáteis em tempo real.
Memória em átomos
As duas tecnologias unidas garantem as duas funções - memória e processamento - no mesmo dispositivo. Mas o fundamento básico da memória é radicalmente diferente nos memoristores. Neles, a técnica envolve usar as posições dos átomos para representar as informações - em vez do fluxo de elétrons, que é a técnica atual envolvida em cálculos nos chips. As posições dos átomos, que se rearranjam nas alterações de condutância, oferecem uma maneira compacta e estável de armazenar mais informações de forma analógica, em vez de digital.
Em termos simples, os elétrons manipulados nos chips tradicionais são "leves", o que significa que eles são propensos a se movimentar e serem mais voláteis. Armazenar a memória em átomos completos, por sua vez, torna tudo muito mais estável, com o adicional de que o dado não é perdido quando a energia é desligada - ou, dito de outro modo, manter o dado na memória não consome energia, viabilizando a computação em dispositivos pequenos.
Além disso, as informações podem ser processadas onde estão armazenadas, eliminando a necessidade do trânsito memória-processador, responsável pelo chamado "gargalo von Neumann" da arquitetura de computação atual. E, como não há mais estradas para trafegar, os chips ficam muito menores.
"Para contextualizar, hoje o ChatGPT está sendo executado na nuvem. Esta inovação, seguida de algum desenvolvimento adicional, pode colocar o poder de uma mini versão do ChatGPT no dispositivo pessoal de todos. Isso poderia tornar essa tecnologia de alta potência mais acessível e acessível para todos os tipos de aplicações," disse o professor Joshua Yang, coordenador da equipe.