Saltar para o conteúdo
FCCN serviços digitais da FCT
NAU site
  • Ajuda
  • Cursos
  • Programas
  • Notícias
  • Parceiros
  • Espaço AP
  • Você está aqui:
  • Página de entrada
  • Notícias
  • «Não deixe para amanhã o que pode preservar hoje»: no Dia Mundial da Internet, conheça de perto a missão do Arquivo.pt na preservação de páginas Web

«Não deixe para amanhã o que pode preservar hoje»: no Dia Mundial da Internet, conheça de perto a missão do Arquivo.pt na preservação de páginas Web

Categorias

EntrevistaParceiroSobre um curso

17/05/2025

Partilhar no FacebookPartilhar no TwitterPartilhar no LinkedinPartilhar por e-mail
Em entrevista à equipa deste serviço digital da Fundação para a Ciência e a Tecnologia (FCT), desenvolvido pela FCCN, conheça também o seu mais recente programa de cursos na Plataforma NAU.

#1 Porque é importante arquivar páginas web? Existem riscos reais em não o fazer?

As páginas web refletem o dia-a-dia da nossa vida em sociedade. Desde o debate de ideias políticas, o desporto, o entretenimento, todas as formas de arte, a economia e os serviços, tudo se espelha nos websites e nas redes sociais.
Arquivar páginas web é importante para manter alguma memória e informação do que é publicado na Internet e, cada vez mais, como salvaguarda em caso de ataques informáticos. Sabemos por experiência própria que os conteúdos publicados online desaparecem. Quem nunca recebeu a resposta “Página não encontrada”? Efetivamente, cerca de 80% das páginas web mudam de endereço ou desaparecem passado um ano. Por isso é que é tão importante ter o Arquivo.pt, onde se pode consultar o histórico dos websites.

A cibersegurança, por exemplo, é uma área em que Arquivo.pt é útil para recuperar informação que existia num website atacado. Em casos extremos de ataques, serve para aliviar a pressão sobre as equipas de IT, que podem usar o serviço Memorial do Arquivo.pt para manterem a última versão arquivada do website acessível.

#2 Que ferramentas ou métodos são usados atualmente para arquivar páginas web de forma eficaz?

As páginas web são recolhidas automaticamente através de um crawler, um robot de software que segue links e recolhe as páginas que encontra. Grava o código de que são feitas as páginas web e outros conteúdos tais como imagens, ficheiros PDF, entre outros. No entanto, para gravar sites mais complexos, onde o conteúdo é gerado dinamicamente e pressupõe interação com um utilizador humano, a gravação é feita usando um navegador (browser). Durante a gravação as páginas são lidas por um navegador, todos os botões são clicados, as galerias de imagens passam, a página rola verticalmente se for necessário, etc. No primeiro tipo de gravação, no Arquivo.pt, usa-se o Heritrix, ferramenta do Internet Archive. No segundo caso, usamos o Brozzler, também do Internet Archive, o Browsertrix-crawler e o ArchiveWeb.page do Webrecorder.net.

#3 É possível arquivar todas as páginas Web? Quais são os principais desafios técnicos ou legais?

Qualquer página web é passível de ser arquivada pelo Arquivo.pt, desde que o seu conteúdo seja público e o acesso não seja bloqueado pelo dono do website. Não significa que sejamos sempre bem-sucedidos. Por vezes, os sites têm conteúdos escondidos atrás de formulários, alimentados por base de dados inacessíveis. Outras vezes, os conteúdos estão num formato fechado, como por exemplo, os vídeos embebidos do Youtube, páginas de Facebook, X (Twitter). Novas tecnologias usadas para fazer páginas web causam algumas dificuldades, por exemplo, quando não atribuem um endereço para cada conteúdo e não cumprem os standards básicos da Web.

Quanto ao âmbito da missão do Arquivo.pt, limitamo-nos a recolher a Web portuguesa: cerca de meio milhão de websites do domínio .PT, outros sites portugueses de outros domínios ou sites da União Europeia de interesse para o país - como por exemplo, os sites de projetos I&D financiados. Além destes, há alguns sites de todo o mundo, resultado de colaborações e das sugestões de utilizadores.

O Arquivo.pt recolhe informação pública e cumpre a sua missão de acordo com o Decreto Lei 55/2013: “Promover a preservação de conteúdos disponíveis na Internet nacional, garantindo a disponibilização deste à comunidade científica e ao público em geral”. A continuação dessa missão é o principal desafio.

#4 Existem boas práticas que qualquer pessoa pode seguir se quiser guardar conteúdos da web para o futuro?

As boas práticas começam logo no momento de criar o website. É necessário criar um site onde os conteúdos estão públicos tanto quanto possível e em formatos abertos. A própria tecnologia do website deve permitir a gravação em formato arquivo da Web. Cada conteúdo deve ter um link, cada publicação deve ter a indicação da data, autor, e as imagens devem ser legendadas ou descritas. Se há vídeos, convém apresentar um link para o ficheiro original, no caso de se querer preservar.

Depois de criado um site, a sua hiperligação deve ser enviada para arquivo.pt/sugerir para ser gravado pelo Arquivo.pt. Outra forma de arquivar páginas importantes em qualquer ocasião é usar o serviço de gravação na hora:  arquivo.pt/archivepagenow.

Para os mais curiosos que querem compreender como gravar localmente, incluindo conteúdos da Intranet, o Arquivo.pt dispõe da formação “Arquivar a web: faça-você-mesmo!”. 

#5 Conseguem dar algum exemplo curioso ou marcante de uma página arquivada através do Arquivo.pt e que, mais tarde, se tornou relevante para uma certa ocasião ou momento?

Nas Jornadas FCCN 2025, realizadas em Coimbra, perante um auditório cheio, e para mostrar como o Arquivo.pt contribui para a memória histórica, foi apresentada a imagem mais antiga que se encontra na Web
Portuguesa
,
“Solar Eclipse”, reproduzida numa página da Universidade de Coimbra.

Esta foi a pesquisa: https://arquivo.pt/image/search?q=nautilus.fis.uc.pt&from=19910806&to=20250514 

#6 O Arquivo.pt lançou recentemente na Plataforma NAU o programa de cursos “A Web do passado: preservação e pesquisa”. De onde surgiu a ideia e quais os objetivos destas formações?

Todos os anos recebemos muitos pedidos de formação sobre o Arquivo.pt e os cursos na Plataforma NAU vão ajudar a responder a essa necessidade. Em 2024, a equipa do Arquivo.pt ofereceu 28 ações de formação. Os arquivos da Web suscitam curiosidade e interesse por parte de investigadores e de responsáveis pelos websites das instituições. Por isso, partimos do programa de formação que já desenvolvemos desde 2018 e desenvolvemos estes MOOCs.

Os objetivos deste programa de cursos passam pela maximização a produtividade dos utilizadores na exploração dos serviços disponibilizados pelo Arquivo.pt, bem como a sensibilização para a importância da preservação do património digital publicado online.

#7 Estes cursos têm algum tipo de pré-requisito associado? E a quem se destinam?

Nenhum requisito especial é necessário para fazer os cursos. Qualquer pessoa com acesso à Internet, num computador com um navegador, pode começar este programa de formação. Este programa de cursos destina-se a quem produz conteúdos para websites, mas também a quem os gere (em gabinetes de comunicação e imagem, por exemplo). Para professores é bom como ferramenta pedagógica. Os cursos destinam-se também para informáticos, desenvolvedores e investigadores. Há serviços e formas de usar o Arquivo.pt que vão surpreender mesmo os especialistas. 

#8 Acreditam que este programa de formação irá moldar a perceção sobre a importância da preservação de páginas web?

Sim, compreender como funciona um arquivo da Web não deixa ninguém indiferente. Além disso, este programa de cursos aborda diversos aspetos da preservação de páginas web. Arquivar conteúdos para o futuro não é tarefa apenas do Arquivo.pt. Exige uma certa reação e participação de todos para arquivar melhor, seja avisando o Arquivo.pt do que está em perigo de se perder, seja gravando pelas próprias mãos.

Para além do arquivo de conteúdos, existe também o fenómeno de reutilização. A perceção de que o Arquivo.pt é útil para usar no dia-a-dia é algo que é cada vez mais frequente. Já começa a ser comum ouvir a frase: “precisava de uma informação e encontrei-a no Arquivo.pt”. Na investigação também já existem dezenas de casos de uso deste serviço digital da FCT, alguns deles vencedores do Prémio Arquivo.pt.

Acreditamos que estas formações podem mostrar o quão privilegiados somos por termos em Portugal um arquivo da Web como o Arquivo.pt.

#9 Neste Dia Mundial da Internet, que reflexão gostariam de deixar sobre a importância da preservação de conteúdos online?

Websites? Não deixe para amanhã o que pode preservar hoje. 

Quem produz conteúdos para a Web - como por exemplo, esta entrevista - está mais focado em publicar e divulgar do que em reter o conteúdo criado. O Arquivo.pt convida toda a gente a participar no esforço de preservação e arquivo da Web, sugerindo websites, gravando diretamente em arquivo.pt/archivepagenow e aprofundando os seus conhecimentos nesta temática.

Aprenda a preservar o seu website desde o zero com os cursos do Arquivo.pt na NAU

O programa "A Web do passado: preservação e pesquisa" é constituído por quatro cursos no total, cada um deles com uma taxa de esforço estimada de 4 horas, ao ritmo do estudante. As formações são totalmente gratuitas e as inscrições estão abertas até abril de 2026.

A Web do passado: preservação e pesquisa

A informação online desaparece rapidamente. Este Programa ensina como preservar e pesquisar a informação histórica publicada ao longo dos anos.

A NAU é cofinanciada pelo Plano de Recuperação e Resiliência (PRR).

Publicações relacionadas

Já pode aceder ao novo espaço exclusivo de formação da Administração Pública através do site da NAU

Categorias

NotíciasParceiro

NAU e Instituto Nacional de Administração (INA) lançam espaço de formação dedicado à Administração Pública

Categorias

NotíciasParceiro

«A parceria com a NAU surge como uma oportunidade de ampliar o impacto dos nossos programas de formação»: Accenture prepara-se para lançar os seus primeiros cursos na Plataforma NAU

Categorias

EntrevistaParceiro

Outras categorias de artigos

Artes e CulturaCiências da Saúde e da VidaCiências Exatas e TecnologiasCiências Naturais e AmbienteCiências SociaisComunicação e MarketingEconomia e GestãoFormação e EducaçãoHumanas e PolíticasNotíciasSobre um cursoEntrevistaArtigoEventoSobre a NAUParceiro
Programa de Recuperação e Resiliência República Portuguesa - Educação, Ciência e Inovação Financiado pela União Europeia - NextGenerationEU Compete 2020 Portugal 2020 União Europeia - Fundo Europeu de Desenvolvimento Regional União Europeia - Fundo Social Europeu
NAU site
Subscrever lista de email (newsletter)Siga-nos no FacebookSiga-nos no Linkedin
NAU
  • Sobre
  • Cursos
  • Como se tornar parceiro
  • Código aberto
  • Acessibilidade
Comunicação
  • Ajuda
  • Notícias
  • Media kit
  • Mapa do site
Legal
  • Termos e Condições
  • Política de Privacidade
  • Política de Cookies
  • Política de Certificação
  • Consentimento Newsletter
República Portuguesa - Educação, Ciência e Inovação FCCN - Serviços digitais FCT FCCN - Serviços digitais FCT

© 2025 FCCN-FCT. Todos os direitos reservados.