PreservaAon Watch: um sistema de suporte à preservação digital

Documentos relacionados
Desafios práticos à preservação digital. RODA e SCAPE. Luís Faria. Seminário O Ambiente Digital Aberto: desafios e impactos. lfaria@keep.

Nelson Madeira Serviços de Informática Universidade de Évora

CR.Doc. Management Platform for Clients and Documents

Publicação em contexto académico: OJS na prática

Repositórios digitais para documentos arquivísticos

EXPLORANDO TÉCNICAS E RECURSOS DO GERENCIADOR DE DADOS ABERTOS CKAN. TuaneFaria USP tuanefaria@yahoo.com.br

Preservação e disseminação de dados em Ciências Sociais

Agenda Digital Local Sessão IV Aspectos técnicos

DSPACE GESTÃO DE. Características e requisitos técnicos REPOSITÓRIOS INSTITUCIONAIS WHITE PAPER SERIES

Repensar a Gestão Documental Organização Inteligente

ArcGIS for INSPIRE. ArcGIS. ArcGIS for INSPIRE. Discovery. Download. View

CICLO DE VIDA DE SISTEMAS DE GESTÃO DE CONHECIMENTO

Certificação da Sociedade Portuguesa de Inovação pela NP4457:2007 O Processo de Certificação e Instrumentos de Apoio ao SGIDI

SOLUÇÕES DE COMUNICAÇÃO DIGITAL

com Repositórios Abertos

Conceito. As empresas como ecossistemas de relações dinâmicas

Nagios XI Soluções de Monitorização

Porquê preservar? que se deve preservar, durante quanto tempo e como preservar? SOS Digital: Tópico 1

Soluções de Pesquisa. Parceria com a Google. Motivação Produtos Como Googlizar a organização? Q&A Soluções de Pesquisa

Modelo de Requisitos para Sistemas Informatizados de Gestão Arquivística de documentos

Primeira Sessão Pública de Apresentação 30 de Janeiro de 2015, Lisboa

Plataforma multicanal de PROCESSOS DE NEGÓCIO

RepositóriUM. Repositório Institucional da Universidade do Minho. Eloy Rodrigues

Desenvolvimento Iterativo. Unified Process (UP) Esta abordagem ao desenvolvimento

Um consórcio de sucesso

Parceiro Oficial de Soluções Zabbix no Brasil

Section 01. Letter. Preliminary. Y Proyecto. PLAKO Título: WAPPY

Programa de Monitorização da Lagoa de Óbidos e do Emissário Submarino da Foz do Arelho

POLÍTICA DO REPOSITÓRIO INSTITUCIONAL DA UNIVERSIDADE NOVA DE LISBOA

É CLOUD. É ON-DEMAND.

Como funciona a MEO Cloud?

WEEBOX GESTÃO SIMPLIFICADA. Características e requisitos técnicos DE DOCUMENTOS WHITE PAPER SERIES

Pesquisa cruzada em múltiplas fontes e formatos (mesmo imagem) a partir duma única caixa nas colecções sem paralelo.

Governança de TI. ITIL v.2&3. parte 1

Business Process Management

Metodologia de Gerenciamento de Projetos Advancedit

GESTÃO DE PROJETOS PARA A INOVAÇÃO

Repositórios Digitais

Público Alvo: Investimento: Disciplinas:

Monitoração como serviço com o Microsoft Operations. Management Suite MDC209

O Recurso a Meios Digitais no Contexto do Ensino Superior. Um Estudo de Uso da Plataforma.

IC-Online: repositório institucional

Projecto RCAAP. Universidade do Minho, Dezembro 2008

BDG - BANCO DE DADOS DE GRADES UMA FERRAMENTA PARA DISPONIBILIZAR DADOS DE PREVISÃO DE MODELOS NUMÉRICOS DE TEMPO E CLIMA

Curso de Preservação Digital

Proposta de Estágio Ano Letivo 2011 / 2012 Tema: BidSuite - Web Platform of Bifds

Lisboa, 20 de Maio de Construindo redes e infraestruturas. DRIVER e RCAAP

Copyright OSIsoft, LLC.

Competências em Literacia da Informação. Saber avaliar a informação

Resultados da Pesquisa

Plataforma Colaborativa Gestão e Arquivo Digital de Documentos e Mensagens

PLANO DE GESTÃO DA TERRA INDIGENA SETE DE SETEMBRO EM CACOAL-RONDÔNIA-BRASIL. PAITER X PROJETO REDD+

Planejamento e Projeto de Redes de Computadores. Eduardo Barrére

Manual dos Serviços de Interoperabilidade

Guia do Usuário. Versão Desenvolvido por ofcdesk, llc. Todos os direitos reservados.

Principais funcionalidades. Arquitetura e requisitos técnicos. Modalidades de aquisição

PHC dcontroldoc. O acesso a diversos tipos de ficheiros

Pesquisa Internacional sobre Documentos Arquivísticos Autênticos Permanentes em Sistemas. CS03 REGISTROS AUDIOVISUAIS: Programas de TV

AUMENTE A SUA PRODUTIVIDADE COM O EDOCLINK APRESENTAÇÃO DE CASOS DE UTILIZAÇÃO

SESSÃO DE CAPACITAÇÃO

Sistemas de Gestão de Arquivos

iextranet A solução inovadora em gerenciamento e compartilhamento seguro de arquivos e de ambiente colaborativo

Manual do Ambiente Moodle para Professores

Jornada de Profissionais da Informação. Anabela Ribeiro 2007 DGARQ/Arquivo Distrital da Guarda 28 de Novembro de 2007

Capacitação em Valorização de Tecnologias

INSPIRE Ponto de situação Rui Pedro Julião

1 Criar uma entity a partir de uma web application que usa a Framework JavaServer Faces (JSF)

WHITEPAPER. Guia de compra para câmeras IP: tudo o que você precisa saber antes de adquirir a sua solução digital

Oportunidades de Financiamento no âmbito do tema ICT: Programa de Trabalho Elisabete Pires Ponto de Contacto Nacional do tema ICT

SOLUÇÕES EM GESTÃO DE RELACIONAMENTO

PROJECTO DE RESOLUÇÃO N.º 255/IX RECOMENDA AO GOVERNO A TOMADA DE MEDIDAS COM VISTA AO DESENVOLVIMENTO DO SOFTWARE LIVRE EM PORTUGAL

SPEKX Platform DATA SHEET. Visão Resumida da Plataforma. Release 3.3. Versão 1.0

REPOSITÓRIO DIGITAL UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. UFRGS Porto Alegre, RS Brasil 2009

Disciplina: Tecnologias de Informação e Comunicação Ano Letivo 2014/2015

Gerir o Utente da Estradas

Formador: Paulo Ramos IGRI13: Rui Bárcia Nº15. Burp Suite. Módulo 25

CENTRO DE COMPUTAÇÃO GRÁFICA Investigação & Desenvolvimento Tecnológico

Trabalho sobre Social Media Como implementar Social Media na empresa

SOLUÇÃO INTEGRADA ARQUIVO & BIBLIOTECA

Agenda Digital Local. Galicia. La participación de los diferentes stakeholders en el desarollo de la ADL. Ricardo Oliveira,

Virtualização e Consolidação de Centro de Dados O Caso da UTAD António Costa - acosta@utad.pt

E SE VOCÊ PUDESSE EXTRAIR INTELIGÊNCIA DO CONTEÚDO PRODUZIDO SOBRE SUA MARCA OU PRODUTO NAS MÍDIAS SOCIAIS?

Open Innovation: Caso Brisa

Mais valias dos Relatórios de Sustentabilidade Um contributo da PT

Arquivo Digital de Trabalhos Práticos de Alunos

Mesa Redonda Novas agendas de atuação e os perfis profissionais em bibliotecas universitárias

Liderança em idéias, métodos e resultados em BPM no Brasil. Automação de Processos. Jones Madruga

Aplicações práticas das diretrizes InterPARES em documentos arquivísticos digitais Daniela Francescutti Martins Hott

G t es ã tão E t s t ra é té i g? ca O Que é isso? TEORIA TE DAS DA ORGANIZA OR Ç GANIZA Õ Ç ES E Prof. Marcio Peres

Transcrição:

PreservaAon Watch: um sistema de suporte à preservação digital José Carlos Ramalho jcr@keep.pt KEEP SOLUTIONS www.keep.pt Luís Faria lfaria@keep.pt KEEP SOLUTIONS www.keep.pt Miguel Ferreira mferreira@keep.pt KEEP SOLUTIONS www.keep.pt Encontro Internacional de Arquivos Évora, Portugal, 2014-10- 03

KEEP SOLUTIONS: Projetos DigitArq, CRAV (2003..[2008-2012]) RODA (2006..[2008- [) RCAAP (2008- ) PPA (2009) Open source: RODA, KOHA, DSpace, Moodle, etc. ScienAfic research SCAPE: Preservação digital em larga escala 4C: previsão de custos na preservação digital e- ark: desenvolvimento de um modelo de referência europeu baseado no OAIS hpp://www.keep.pt This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 2

Parceiros This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 3

Monitorização da Preservação Digital 4

Porque necessitamos de monitorização? Obsolescência do formato Novas normas Novas tecnologias emergentes Repositório PolíTca insttucional Missão insttucional Corrupção binária Capacidade dos recursos Disponibilidade do sistema Quebras de segurança Metodologias dos produtores Tendências dos consumidores Limitações económicas Fatores polítcos e sociais 5

Porque necessitamos de monitorização? Obsolescência do formato Novas normas Novas tecnologias emergentes Repositório PolíTca insttucional Missão insttucional Corrupção binária Capacidade dos recursos Disponibilidade do sistema Quebras de segurança Metodologias dos produtores Tendências dos consumidores Limitações económicas Fatores polítcos e sociais 6

Porque necessitamos de monitorização? PolíTca insttucional Novas normas Obsolescência do formato Repositório Corrupção binária Capacidade dos recursos Novas tecnologias emergentes Riscos Metodologias dos produtores Missão insttucional Disponibilidade do sistema Quebras de segurança Tendências dos consumidores Limitações económicas Fatores polítcos e sociais 6

Porque necessitamos de monitorização? PolíTca insttucional Missão insttucional Novas normas Obsolescência do formato Repositório Corrupção binária Capacidade dos recursos Disponibilidade do sistema Quebras de segurança Novas tecnologias emergentes Riscos Metodologias dos produtores Oportunidades Tendências dos consumidores Limitações económicas Fatores polítcos e sociais 6

SCAPE Estado da Arte Digital Format Registries Automatic Obsolescence Notification System (AONS) Relatórios de vigilância tecnológica 7

SCAPE Estado da Arte Digital Format Registries Falta de cobertura Riscos genéricos definidos estaticamente Riscos não estruturados Focado na obsolescência do formato AONS Totalmente dependente dos registos de formato Relatórios de vigilância tecnológica Inacessíveis às máquinas (elegíveis) 8

Avaliação de Risco Sim, mas manualmente e ad hoc Não 40% Participantes: 60% 9

Monitorização Automatic Manual None Bitstream integrity Format obsolescesce Ingest Access Organization Format registries Experimentation Consumers Producers Technology 0% 20% 40% 60% 80% 100% 10

SCAPE O que é necessário? Precisamos de informação! De todo o lado e de toda a gente Partilhando Escalabilidade e usabilidade Dados estruturados Vocabulário controlado 11

Scout Uma nova aproximação 12

? Scout Tool Format Name Name Version PRONOM ID Renders Mime type License License PRONOM 13

SCAPE Objetivos Coletar informação de várias fontes Permitir a introdução manual de dados Base de dados centralizada para suporte à preservação digital Permitir que os utilizadores coloquem questões Notificar os utilizadores quando ocorrem mudanças ou eventos significativos 14

Problemas Um Repositório alberga conteúdos Uma Organização tem políacas em curso (e.g. não são permiados conteúdos comprimidos) P1: Será que os conteúdos respeitam as políticas vigentes? Há algum risco associado? Mesmo que conteúdo, política e ambiente estejam em constante mudança? Encontramos um risco na preservação digital! P2: Como decidiremos a ação a tomar mantendo os requisitos de confiança e autenticidade? This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 15

Saber que ação tomar Mais problemas P3: Como monitorizar a qualidade da ação tomada e como garantir que os invariantes de preservação se mantêm? Os conteúdos crescem exponencialmente em volume, heterogeneidade e complexidade P4: Como implementar a preservação digital em sistemas de grande escala (big data)? This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 16

Scout: a preservaton watch system Monitoriza facetas do mundo para detetar riscos e oportunidades de preservação Triple store Interoperabilidade Data Connector & Report API SCAPE Policy model PRONOM Web semanac extracaon Renderability experiments Interface Web Alertas: templates e SPARQL NoAficações por email Demo: hpp://scout.scape.keep.pt Content Policies Registries Scout Risk notification Web Human knowledge hpp://openplanets.github.io/scout/ This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 17

Ciclo de vida da preservação: cenário ideal access, ingest, harvest Environment and users monitored environment and users monitored content and events monitored actions Watch Policies create/re-evaluate plans Repository execute action plan Operations deploy plan Planning This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 18

Ciclo de vida da preservação: na prátca access, ingest, harvest Environment and users monitored environment and users monitored content and events monitored actions Scout Watch Policies create/re-evaluate plans Repository execute action plan deploy plan Planning Plato Operations Workflow engine This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 19

API para transferência de dados (interoperabilidade) Permite aceder e modificar conteúdos no repositório HTTP REST API Methods: Retrieve enadade inteletual, metadados, representação, ficheiro ou bit stream Ingest enadade inteletual (sync ou async) Update enadade inteletual, representação ou ficheiro Search enadades, representações ou ficheiros (SRU) Especificação da API: hpps://github.com/openplanets/scape- plavorm- api Implementação de ref.: Fins de 2013 no Fedora 4 e no RODA This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 20

API de relato Dá acesso aos eventos do repositório Eventos: Ingestão: início e fim Visualização ou descarga: metadados descriavos ou representações Execução de planos de preservação Fornecedor OAI- PMH Metadados PREMIS associados aos eventos Agent: quem acionou o evento Date/Ame: quando é que o evento ocorreu Details: que aconteceu API: hpps://github.com/openplanets/scape- plavorm- api Implementação de ref.: hpps://github.com/openplanets/roda This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 21

hpp://scout.scape.keep.pt

hpp://scout.scape.keep.pt

hpp://scout.scape.keep.pt

hpp://scout.scape.keep.pt

hpp://scout.scape.keep.pt

hpp://scout.scape.keep.pt

hpp://scout.scape.keep.pt

hpp://scout.scape.keep.pt

hpp://scout.scape.keep.pt

hpp://scout.scape.keep.pt

Conclusions P1: Será que os conteúdos respeitam as políticas vigentes? Há algum risco associado? Mesmo que conteúdo, política e ambiente estejam em constante mudança? S1: Utilize o Scout: preservation watch system This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 23

Conclusions P2: Como decidiremos a ação a tomar mantendo os requisitos de confiança e autenticidade? S2: Utilize o Plato: preservation planning tool This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 24

Conclusions P3: Como monitorizar a qualidade da ação tomada e como garantir que os invariantes de preservação se mantêm? S3: Q&A in preservation plans (Plato), monitoring of Q&A (Report API & Scout), automatic Scout triggers created by Plato This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 25

Conclusions P4: Como implementar a preservação digital em sistemas de grande escala (big data)? S4: Automação e integração dos processos de preservação. Caso de estudo do SCAPE: FITS + C3PO This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 26

Scout: Suporte de ualizadores Mais conetores Mais templates para alertas Plato: Roadmap Criação automáaca de alertas no Scout Publicação automáaca usando a API de gestão Implementações de um Repositório de referência: RODA e Fedora 4 This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 27

Conclusions Todas as APIs estão publicadas Implementações de referência: RODA e Fedora 4 Todas as ferramentas disponíveis no Github Adiciona uma política de preservação ao teu repositório já! This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 28

Ecossistema de Preservação

História dum ciclo de vida de Preservação (parte 1) Um Repositório tem conteúdos A Organização tem políacas em vigor (e.g. não permiar compressão) Formaliza as políacas Usa o Scout para monitorizar a conformidade Carrega as políacas no Scout Cria adaptadores para o teu repositório Cria alertas Recebe noaficações: há ficheiros comprimidos! Usa o C3PO para analisar em detalhe o problema Podes ter que dividi- lo em problemas mais pequenos This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 30

História dum ciclo de vida de Preservação (parte 2) Usa o Plato para encontrar uma solução para o problema: Carrega as políacas: objeavos automáacos Encontra ferramentas alternaavas automaacamente Testa as ferramentas automaacamente com amostras de conteúdo Encontra a melhor alternaava Cria um plano automaacamente com documentação, ações e Q&A Envia o plano diretamente ao repositório e os alertas ao Scout Executa o plano no motor de workflow O Repositório executa o plano diretamente no motor de workflow Os resultados são agregados através da API do conetor de dados As ações de preservação e as Q&A são enviadas ao Scout via a API de relato O Scout deteta os riscos que têm de ser resolvidos This work was par,ally supported by the SCAPE Project. The SCAPE project is co- funded by the European Union under FP7 ICT- 2009.4.1 (Grant Agreement number 270137). 31

Questões? José Carlos Ramalho Consultor / Investigador jcr@keep.pt / jcr@di.uminho.pt ARQUIVOS BIBLIOTECAS MUSEUS www.keep.pt