Categorias
EntrevistaParceiroSobre um curso17/05/2025
As páginas web refletem o dia-a-dia da nossa vida em sociedade. Desde o debate de ideias políticas, o desporto, o entretenimento, todas as formas de arte, a economia e os serviços, tudo se espelha nos websites e nas redes sociais.
Arquivar páginas web é importante para manter alguma memória e informação do que é publicado na Internet e, cada vez mais, como salvaguarda em caso de ataques informáticos. Sabemos por experiência própria que os conteúdos publicados online desaparecem. Quem nunca recebeu a resposta “Página não encontrada”? Efetivamente, cerca de 80% das páginas web mudam de endereço ou desaparecem passado um ano. Por isso é que é tão importante ter o Arquivo.pt, onde se pode consultar o histórico dos websites.
A cibersegurança, por exemplo, é uma área em que Arquivo.pt é útil para recuperar informação que existia num website atacado. Em casos extremos de ataques, serve para aliviar a pressão sobre as equipas de IT, que podem usar o serviço Memorial do Arquivo.pt para manterem a última versão arquivada do website acessível.
As páginas web são recolhidas automaticamente através de um crawler, um robot de software que segue links e recolhe as páginas que encontra. Grava o código de que são feitas as páginas web e outros conteúdos tais como imagens, ficheiros PDF, entre outros. No entanto, para gravar sites mais complexos, onde o conteúdo é gerado dinamicamente e pressupõe interação com um utilizador humano, a gravação é feita usando um navegador (browser). Durante a gravação as páginas são lidas por um navegador, todos os botões são clicados, as galerias de imagens passam, a página rola verticalmente se for necessário, etc. No primeiro tipo de gravação, no Arquivo.pt, usa-se o Heritrix, ferramenta do Internet Archive. No segundo caso, usamos o Brozzler, também do Internet Archive, o Browsertrix-crawler e o ArchiveWeb.page do Webrecorder.net.
Qualquer página web é passível de ser arquivada pelo Arquivo.pt, desde que o seu conteúdo seja público e o acesso não seja bloqueado pelo dono do website. Não significa que sejamos sempre bem-sucedidos. Por vezes, os sites têm conteúdos escondidos atrás de formulários, alimentados por base de dados inacessíveis. Outras vezes, os conteúdos estão num formato fechado, como por exemplo, os vídeos embebidos do Youtube, páginas de Facebook, X (Twitter). Novas tecnologias usadas para fazer páginas web causam algumas dificuldades, por exemplo, quando não atribuem um endereço para cada conteúdo e não cumprem os standards básicos da Web.
Quanto ao âmbito da missão do Arquivo.pt, limitamo-nos a recolher a Web portuguesa: cerca de meio milhão de websites do domínio .PT, outros sites portugueses de outros domínios ou sites da União Europeia de interesse para o país - como por exemplo, os sites de projetos I&D financiados. Além destes, há alguns sites de todo o mundo, resultado de colaborações e das sugestões de utilizadores.
O Arquivo.pt recolhe informação pública e cumpre a sua missão de acordo com o Decreto Lei 55/2013: “Promover a preservação de conteúdos disponíveis na Internet nacional, garantindo a disponibilização deste à comunidade científica e ao público em geral”. A continuação dessa missão é o principal desafio.
As boas práticas começam logo no momento de criar o website. É necessário criar um site onde os conteúdos estão públicos tanto quanto possível e em formatos abertos. A própria tecnologia do website deve permitir a gravação em formato arquivo da Web. Cada conteúdo deve ter um link, cada publicação deve ter a indicação da data, autor, e as imagens devem ser legendadas ou descritas. Se há vídeos, convém apresentar um link para o ficheiro original, no caso de se querer preservar.
Depois de criado um site, a sua hiperligação deve ser enviada para arquivo.pt/sugerir para ser gravado pelo Arquivo.pt. Outra forma de arquivar páginas importantes em qualquer ocasião é usar o serviço de gravação na hora: arquivo.pt/archivepagenow.
Para os mais curiosos que querem compreender como gravar localmente, incluindo conteúdos da Intranet, o Arquivo.pt dispõe da formação “Arquivar a web: faça-você-mesmo!”.
Nas Jornadas FCCN 2025, realizadas em Coimbra, perante um auditório cheio, e para mostrar como o Arquivo.pt contribui para a memória histórica, foi apresentada a imagem mais antiga que se encontra na Web
Portuguesa, “Solar Eclipse”, reproduzida numa página da Universidade de Coimbra.
Esta foi a pesquisa: https://arquivo.pt/image/search?q=nautilus.fis.uc.pt&from=19910806&to=20250514
Todos os anos recebemos muitos pedidos de formação sobre o Arquivo.pt e os cursos na Plataforma NAU vão ajudar a responder a essa necessidade. Em 2024, a equipa do Arquivo.pt ofereceu 28 ações de formação. Os arquivos da Web suscitam curiosidade e interesse por parte de investigadores e de responsáveis pelos websites das instituições. Por isso, partimos do programa de formação que já desenvolvemos desde 2018 e desenvolvemos estes MOOCs.
Os objetivos deste programa de cursos passam pela maximização a produtividade dos utilizadores na exploração dos serviços disponibilizados pelo Arquivo.pt, bem como a sensibilização para a importância da preservação do património digital publicado online.
Nenhum requisito especial é necessário para fazer os cursos. Qualquer pessoa com acesso à Internet, num computador com um navegador, pode começar este programa de formação. Este programa de cursos destina-se a quem produz conteúdos para websites, mas também a quem os gere (em gabinetes de comunicação e imagem, por exemplo). Para professores é bom como ferramenta pedagógica. Os cursos destinam-se também para informáticos, desenvolvedores e investigadores. Há serviços e formas de usar o Arquivo.pt que vão surpreender mesmo os especialistas.
Sim, compreender como funciona um arquivo da Web não deixa ninguém indiferente. Além disso, este programa de cursos aborda diversos aspetos da preservação de páginas web. Arquivar conteúdos para o futuro não é tarefa apenas do Arquivo.pt. Exige uma certa reação e participação de todos para arquivar melhor, seja avisando o Arquivo.pt do que está em perigo de se perder, seja gravando pelas próprias mãos.
Para além do arquivo de conteúdos, existe também o fenómeno de reutilização. A perceção de que o Arquivo.pt é útil para usar no dia-a-dia é algo que é cada vez mais frequente. Já começa a ser comum ouvir a frase: “precisava de uma informação e encontrei-a no Arquivo.pt”. Na investigação também já existem dezenas de casos de uso deste serviço digital da FCT, alguns deles vencedores do Prémio Arquivo.pt.
Acreditamos que estas formações podem mostrar o quão privilegiados somos por termos em Portugal um arquivo da Web como o Arquivo.pt.
Websites? Não deixe para amanhã o que pode preservar hoje.
Quem produz conteúdos para a Web - como por exemplo, esta entrevista - está mais focado em publicar e divulgar do que em reter o conteúdo criado. O Arquivo.pt convida toda a gente a participar no esforço de preservação e arquivo da Web, sugerindo websites, gravando diretamente em arquivo.pt/archivepagenow e aprofundando os seus conhecimentos nesta temática.
O programa "A Web do passado: preservação e pesquisa" é constituído por quatro cursos no total, cada um deles com uma taxa de esforço estimada de 4 horas, ao ritmo do estudante. As formações são totalmente gratuitas e as inscrições estão abertas até abril de 2026.
A informação online desaparece rapidamente. Este Programa ensina como preservar e pesquisar a informação histórica publicada ao longo dos anos.
A NAU é cofinanciada pelo Plano de Recuperação e Resiliência (PRR).
Categorias
NotíciasParceiroCategorias
NotíciasParceiro