Com informações da Science - 24/03/2022
Circuito elétrico que aprende
Um circuito elétrico que aprendeu a reconhecer flores com base no tamanho de suas pétalas pode parecer trivial quando lembramos dos sistemas de inteligência artificial (IA) que reconhecem rostos, transcrevem palavras faladas em texto e muito mais.
No entanto, o minúsculo circuito supera os sistemas convencionais de aprendizado de máquina de uma maneira importante: Ele se ensina sem a ajuda de um computador, lembrando um pouco a independência de um cérebro vivo.
É uma prova de conceito de que é possível evitar a enorme quantidade de computação normalmente necessária para ajustar um sistema de IA, um problema que pode se tornar mais um obstáculo à medida que esses programas se tornam cada vez mais complexos.
E, como foi montado na forma de um circuito com componentes elétricos e eletrônicos convencionais, tudo está passível de miniaturização, podendo ser feito na forma de um chip.
Treinamento da IA
A ferramenta padrão do aprendizado de máquina é a rede neural artificial. Já existem versões de redes neurais em hardware, mas tipicamente elas existem como uma matriz em um programa de computador, cujos nós podem assumir valores e pesos - cada aresta é ponderada dependendo de quão correlacionados ou anticorrelacionados são os dois nós.
Os nós são organizados em camadas, com a primeira camada recebendo as entradas e a última camada produzindo as saídas. Por exemplo, a primeira camada pode receber como entrada a cor dos píxeis de fotos em preto e branco, e a camada de saída pode consistir em um único nó que produz 0 se a imagem for de um gato e 1 se for de um cachorro.
Para ensinar o sistema a distinguir gatos de cachorros, o programa precisa ser exposto a um conjunto de imagens de treinamento, ajustando os pesos para obter a saída correta. É um caso de otimização gigantesco, que se torna dramaticamente mais complexo com o tamanho da rede, exigindo um processamento computacional substancial além da própria rede neural.
Para tornar tudo ainda mais difícil, todas as arestas em toda a rede precisam ser ajustadas simultaneamente, em vez de uma após a outra. Para contornar esse problema, várias equipes têm procurado sistemas físicos que possam se ajustar de forma eficiente sem a computação externa.
Foi um sistema físico assim que Sam Dillavou e seus colegas da Universidade da Pensilvânia, nos EUA, acabam de criar.
Rede neural com resistores
A pequena rede neural em hardware foi construída conectando aleatoriamente 16 componentes elétricos comuns, chamados resistores ajustáveis. Cada resistor funciona como uma borda na rede, e os nós são as junções onde os terminais dos resistores se encontram.
Para usar a rede, os pesquisadores definiram tensões para certos nós de entrada e leram as tensões dos nós de saída. Ao ajustar os resistores, a rede automatizada aprendeu a produzir as saídas desejadas para um determinado conjunto de entradas.
Para treinar o sistema com uma quantidade mínima de computação e memória, a equipe construiu duas redes idênticas, uma em cima da outra. A rede "presa" recebe as tensões de entrada, e seus resistores fixam a tensão de saída no valor desejado. Na rede "livre", apenas a tensão de entrada é fixada, deixando todas as outras tensões flutuarem para qualquer valor, o que geralmente dava a tensão errada na saída.
O sistema então ajustou as resistências nas duas redes de acordo com uma regra simples, que dependia se a diferença de tensão em um resistor na rede presa era maior ou menor do que a diferença de tensão no resistor correspondente na rede livre. Após várias iterações, esses ajustes compatibilizaram todas as tensões em todos os nós nas duas redes, efetivamente treinando ambas as redes para fornecer a saída correta para uma determinada entrada.
"Fundamentalmente, esse ajuste requer muito pouca computação. O sistema só precisa comparar a queda de tensão nos resistores correspondentes nas redes fixa e livre, usando um dispositivo elétrico relativamente simples, chamado comparador," contou Dillavou.
Rede descentralizada
A rede foi ajustada para executar uma variedade de tarefas simples de IA: Por exemplo, ela distinguiu, com precisão superior a 95%, entre três espécies de plantas íris, dependendo de quatro medidas físicas da flor: Os comprimentos e larguras de suas pétalas e de suas sépalas - as folhas logo abaixo da flor. "Esse é um teste de IA canônico, que usa um conjunto padrão de 150 imagens, 30 das quais foram usadas para treinar a rede," contou Dillavou.
Há várias vantagens nessa implementação de "aprendizado físico", além da dispensa da computação. Por exemplo, o sistema é muito robusto, funcionando mesmo com danos extremos (como defeitos de fabricação) devido ao seu aprendizado descentralizado. E essas redes distribuídas representam uma enorme vantagem: "Uma rede laboratorial de apenas 500 arestas já ultrapassará sua contraparte in silico," garante a equipe.