Internet Archive e a preservação de arquivos digitais no Brasil

Uma das promessas não cumpridas da internet é de que haveria uma “revolução” da memória. Os conteúdos digitais ficariam imunes às intempéries do mundo físico, permitindo preservar para sempre as criações humanas, traduzidas em simples bits e bytes. Não funcionou.

Tudo o que vai parar no mundo digital é efêmero. A tecnologia renova-se, e os formatos ficam obsoletos. Universos inteiros de dados desaparecem ou ficam inacessíveis o tempo todo. Foi o que ocorreu com o Geocities, precursor das redes sociais. Em 1999, era o terceiro site mais acessado do planeta. Em 2009, deixou de existir (há um pouco dele no Internet Archive, mas muito se perdeu).

No Brasil, Caetano Veloso queixou-se no jornal “O Globo” sobre o tema. Seu blog Obra e Progresso, criado no processo de gravação do álbum “Zii e Zie”, sumiu também. Para alívio da situação (e dos fãs), parcelas do site estão no Internet Archive.

Só que o Internet Archive não resolve toda a questão. Grande parte dos conteúdos na rede hoje está atrás de “muralhas” fechadas, como o Facebook e outras redes sociais. O Internet Archive não entra ali. Só arquiva o que está aberto na rede.

Outro problema são os direitos autorais. Pela lei brasileira, preservar qualquer conteúdo requer autorização do autor e titulares.

Pela lei americana, essa autorização não é necessária. O Internet Archive pode armazenar tudo, desde que retire conteúdos específicos em caso de reclamações.

Há no Ministério da Cultura uma proposta para reformar nossa lei, autorizando o arquivamento. Até a sua aprovação, a chance de surgir um arquivo abrangente da rede no Brasil é zero.

Isso traz mais preocupações. Por exemplo, o Orkut. Apesar de muita gente torcer o nariz para o site hoje, ele é o mais rico e detalhado documento do período de 2004 a 2011 no Brasil. Registrou fenômenos como a ascensão da classe C, transformações no uso do português, além de inúmeros dramas pessoais.

Há muitos temas dos últimos anos visíveis pelo Orkut, preservados em registro microscópico. Mas basta uma decisão do Google para tudo ficar inacessível.

A Biblioteca do Congresso dos EUA já preserva a memória digital. Nossa Biblioteca Nacional deveria fazer o mesmo, a começar pelo Orkut.

A conclusão é simples. Se há algo importante para você armazenado na rede, vá lá e faça um back-up no seu computador. E não deixe para amanhã.

Análise: Arquivos digitais esbarram em ‘muralhas’ e direitos autorais

Aproveitando o lançamento do TV News, a Folha fez uma matéria especial sobre o Internet Archive e o Ronaldo Lemos escreveu uma coluna sobre o assunto, que citei por completo acima porque não consegui escolher apenas um trecho.

Aqui no Brasil a questão é mesmo mais complexa do que nos Estados Unidos. Esbarramos nas dificuldades financeiras… mas (e digo isto também para os países de primeiro mundo) quem é que está realmente se preocupando com o futuro da informação na Internet? O interesse é pequeno porque não é algo que vai dar lucro a curto prazo, ao contrário da informação rápida do presente. Pensar na preservação da informação digital (e não apenas daquela gerada no suporte físico) é o papel cada vez mais importante das bibliotecas e centros de informação.

3 comentários em “Internet Archive e a preservação de arquivos digitais no Brasil”

  1. Gostei do texto!
    Isso acontece comigo quando busco por referências de um texto escrito a alguns anos, e essa referência é uma notícia. Os portais de notícias não costumam armazenar tudo… o que considero muito contraditório.

    Acredito que não seja só uma questão de efemeridade, como também de relevância, muito dessa “informação rápida” tem pouquíssima utilidade… Seria bom ter um algoritmo mais inteligente que o dos sites de busca (que priorizam o número de acessos) no momento de decidir o que vai ficar arquivado ou não…

    Deviamos mesmo era lotar um HD de ouro com todas as páginas do Yahoo Respostas e enviar pelo espaço, como uma mensagem, para as outras possíveis formas de vida inteligentes.

Os comentários estão encerrado.