Redação do Site Inovação Tecnológica - 16/09/2009
O que são captchas?
O Google anunciou a aquisição do programa ReCAPTCHA, utilizado para oferecer mais segurança aos sites da Internet por meio de letras ou números que o usuário deve digitar quando interage com um site.
As letras, que aparecem como desenhos distorcidos, evitam a distribuição de spam e o uso de sites interativos por programas automatizados, já que o reconhecimento dos caracteres é possível para um ser humano, mas muito difícil para um programa de computador. CAPTCHA é um acrônimo para Completely Automatic Public Turing test to tell Computers and Humans Apart.
Captcha do bem
Existem inúmeros programas de Captcha disponíveis no mercado, a maioria gratuita. Mas o ReCAPTCHA é especial. Enquanto os outros programas apresentam caracteres aleatórios e simplesmente checam se esses caracteres foram digitados corretamente, o ReCAPTCHA mostra palavras extraídas de livros impressos que estão em processo de digitalização.
Assim, quando digitam as palavras, muitas vezes quase ilegíveis, os usuários dos sites que usam o ReCAPTCHA estão na verdade ajudando a digitalizar livros antigos, jornais e outros materiais impressos antes do advento dos computadores.
A possibilidade de ajudar uma causa nobre fez com que o ReCAPTCHA de proliferasse como erva-daninha pela Internet. Milhares de sites ao redor do mundo já o adotaram. Seu uso é gratuito. Durante seu primeiro ano de funcionamento, 1,2 bilhão de captchas foram resolvidos e mais de 440 milhões de palavras foram corretamente decifradas. Isso equivale à digitalização de 17.600 livros.
Corrigindo o OCR
Mas como o programa sabe que o usuário digitou a palavra correta? O sistema funciona assim: o software do ReCAPTCHA pega uma palavra conhecida e outra que não foi reconhecida pelo OCR (Optical Character Recognition), e apresenta ambas ao usuário. Se o usuário interpretou corretamente a primeira, o programa assume que a segunda também foi interpretada corretamente.
O mesmo conjunto é apresentado seguidamente a vários usuários, até que, estatisticamente, o programa tenha certeza de que a palavra foi mesmo reconhecida. O texto do livro é então atualizado e dado como corretamente digitalizado.
ReCAPTCHA
O ReCAPTCHA foi lançado em 2007 pelo pesquisador Luis von Ahn, da Universidade Carnegie Mellon, nos Estados Unidos, tendo logo se transformado em uma empresa, criada com o objetivo de divulgar e eventualmente comercializar o programa.
O Google não divulgou se pretende fazer alguma alteração nas diretrizes de uso do programa.