Redação do Site Inovação Tecnológica - 04/09/2012
Informações contextualizadas
Inspirados pelas ideias propostas por um bibliotecário indiano há quase um século, uma equipe europeia desenvolveu um novo sistema de buscas para a internet que leva em conta fatores como opinião, contexto, tempo e localização.
A nova tecnologia, que promete chegar ao mercado rapidamente, consegue mostrar tendências na opinião pública sobre um determinado assunto, companhia ou pessoa, e como essa tendência muda com o tempo.
A equipe do projeto LivingKnowledge (conhecimento vivo, em tradução livre) acredita que seus algoritmos permitirão até mesmo fazer previsões sobre o futuro.
"Faça uma busca pela palavra 'clima' no Google, ou em outro motor de busca qualquer, e o que você receberá de volta será basicamente uma lista de resultados que caracterizam a palavra: não há categorização, nenhuma ordem específica, nenhum contexto.
"Os motores de busca atuais não levam em conta as dimensões da diversidade: fatores como quando a informação foi publicada, se há uma tendência de favorecer uma ou outra opinião, quem publicou e quando," explica Fausto Giunchiglia, professor de ciência da computação na Universidade de Trento, na Itália.
Google da diversidade
Mas será que a tecnologia de buscas na internet poderá ser capaz de abarcar a diversidade? Poderá um mecanismo de buscas dizer-lhe, por exemplo, como a opinião pública sobre as mudanças climáticas mudaram na última década? Ou como a temperatura poderá estar daqui a um século, agregando estimativas atuais e do passado a partir de fontes diferentes?
Giunchiglia garante que não apenas é possível, como isso já pode ser feito a partir dos resultados do projeto.
Os pesquisadores foram buscar inspiração no sistema de classificação de livros criado por Sirkali Ramamrita Ranganathan nos anos 1930, que permite atribuir múltiplas características a um livro, revista ou artigo.
Em vez de uma posição taxonômica fixa, o sistema permite, por exemplo, que um texto sobre os efeitos das mudanças climáticas na agricultura escrito no Brasil em 2010 seja classificado como "Geografia; Clima; Mudança Climática; Agricultura; Pesquisa; Brasil; 2010".
O que os cientistas fizeram foi transformar o pseudo-algoritmo de Ranganathan em um algoritmo codificado em um programa para minerar dados na internet.
Isso permite extrair de cada texto um significado e um contexto, associando-lhe as chamadas "facetas" da classificação bibliográfica. "E usar essas facetas para estruturar a informação com base nas dimensões da diversidade," completa o professor Giunchiglia.
Conhecimento aberto
O programa básico será disponibilizado como software de código aberto, e vários parceiros do projeto LivingKnowledge afirmaram que pretendem implementar a tecnologia em produtos comerciais.
O professor Giunchiglia, por sua vez, anunciou que pretende criar uma fundação sem fins lucrativos para implementar os resultados do projeto, um de cada vez, conforme surjam demandas para isso.