O gigante Google está com um projeto ambicioso. A empresa quer digitalizar todos os livros já publicados na história da humanidade e fazer uma espécie de Biblioteca de Alexandria da era digital. O projeto deu início a muita polêmica envolvendo direitos autorais, mas a empresa parece ter conseguido criar um modelo que agrada a todos e já deu início ao processo de digitalização.
Para poder planejar e empreitada, o primeiro passo foi descobrir quantos livros, exatamente, já haviam sido publicados. A solução mais simples e direta seria contar os ISBN (código obrigatório na publicação de todos os livros) e usar o número como base. Porém, a empresa percebeu que nem todos os livros possuem o registro, principalmente os publicados no oriente.
Outras formas usadas por bibliotecas para contabilizar livros foram contempladas pela equipe do Google, mas nenhuma seria capaz de contabilizar todos os livros já publicados. Para resolver o problema, o Google fez o que a empresa faz de melhor: Eles coletaram uma quantidade absurda de dados de mais de 150 bibliotecas, livrarias etc e aplicaram o poder de processamento da empresa para cruzar os dados.
Depois de muito esforço e criação de algoritmos que eliminam informações dobradas, a empresa conseguiu gerar um número que seria razoavelmente confiável. Essa semana eles divulgaram esse número. São 129.864.880 volumes e eles pretendem colocar todos esses na rede.
Para poder planejar e empreitada, o primeiro passo foi descobrir quantos livros, exatamente, já haviam sido publicados. A solução mais simples e direta seria contar os ISBN (código obrigatório na publicação de todos os livros) e usar o número como base. Porém, a empresa percebeu que nem todos os livros possuem o registro, principalmente os publicados no oriente.
Outras formas usadas por bibliotecas para contabilizar livros foram contempladas pela equipe do Google, mas nenhuma seria capaz de contabilizar todos os livros já publicados. Para resolver o problema, o Google fez o que a empresa faz de melhor: Eles coletaram uma quantidade absurda de dados de mais de 150 bibliotecas, livrarias etc e aplicaram o poder de processamento da empresa para cruzar os dados.
Depois de muito esforço e criação de algoritmos que eliminam informações dobradas, a empresa conseguiu gerar um número que seria razoavelmente confiável. Essa semana eles divulgaram esse número. São 129.864.880 volumes e eles pretendem colocar todos esses na rede.
Só 129.864.880? Pensei que fosse um número muito maior; mas pronto, o que importa é o esforço Google! Thanks!
http://www.divirta-se.uai.com.br/html/sessao_7/2010/08/06/ficha_agitos/id_sessao=7&id_noticia=27033/ficha_agitos.shtml
0 Comentários:
Enviar um comentário