Práticas e ferramentas de gestão de dados

Documentos relacionados
#ForumGDI wifi: UPorto, login: CONFDADOS, pwd: CONFDADOS2016

Um repositório baseado no paradigma de base de dados

Serviços para suporte à GESTÃO DE DADOS CIENTÍFICOS: plano de intervenção dos SDUM

TAIL. Research Data Management. from creation to deposit and sharing

Projeto TAIL Gestão de dados de investigação da produção ao depósito e à partilha (resultados preliminares)

Research Data Management at INESC TEC using Dendro, CKAN and EUDAT

Estratégia Institucional para a gestão de dados de investigação na UMINHO: o papel dos SDUM

UPBox. Armazenamento na Nuvem para Dados de Investigação da U. Porto

Dados Abertos de Pesquisa na Área de Rede de computadores: Como a comunidade está se organizando para tornar os dados FAIR?

POLÍTICA DE DEPÓSITO DE DOCUMENTOS NO REPOSITÓRIO CIENTÍFICO INSTITUTO POLITÉCNICO DE PORTALEGRE. Preâmbulo

OS SERVIÇOS RCAAP PARA A GESTÃO DE DADOS DE INVESTIGAÇÃO

RELATÓRIO DO 4º FÓRUM GDI

RIA. Repositório Institucional da Universidade de Aveiro

Estatísticas da Educação e Ciência A produção académica da Universidade Aberta Outubro 2017

Módulo 10 - Repositórios em acesso aberto: estado atual e boas práticas

PLANO DE INTERVENÇÃO SERVIÇOS DE SUPORTE À GESTÃO DOS DADOS CIENTÍFICOS NA UM

Workshop temático - Repositório de dados abertos: plataformas, serviços e casos de uso

Agenda. Parte I. Parte II

Boas Práticas para Dados na Web: Desafios e Benefícios

Miguel Ángel Márdero Arellano

Social Dendro: Aplicação de técnicas das redes sociais à gestão de dados de investigação

Via verde - o caso do repositórium e outras considerações. Ana Alice Baptista Universidade do Minho

Diretrizes para Políticas de Acesso Aberto para instituições que realizam investigação científica

Boas Práticas para Dados na Web: Desafios e Benefícios

Integração de plataformas institucionais: o caso EUDAT

TÍTULO DA APRESENTAÇÃO Complemento de título

RELATÓRIO DO 1º FÓRUM GDI

Boas Práticas para Dados na Web: Desafios e Benefícios

Curadoria Digital em Instituições de Ensino Superior 1º Congresso RCI/EaD - Internacional

requisitos de acesso aberto e dados abertos

Acesso aberto e dados abertos para uma Política Nacional de Ciência Aberta

PMR3507 Fábrica digital

José Carvalho (Serviços de Documentação da Universidade do Minho,

Publicação Eletrónica - Vislumbres do futuro sob uma perspetiva da Web Semântica. Ana Alice Baptista Universidade do Minho - Portugal

O Arquivo de Ciência e Tecnologia Um espaço de conhecimento

Webinar PASTEUR4OA: políticas institucionais de Acesso Aberto da definição à monitorização

O desafio dos media. Projecto CHIC

Que História para o futuro digital? Maria Fernanda Rollo, Secretária de Estado da Ciência, Tecnologia e Ensino Superior Jornadas FCCN 12/04/2018

Soluções adequadas ao seu ramo de atividade ONG

UMA PERSPETIVA SOBRE O CONTRIBUTO DO REPOSITÓRIO PARA O ARQUIVO INSTITUCIONAL. Maria Eduarda Pereira Rodrigues IPCB-ESACB/ESART

CIÊNCIA ABERTA RUMO A UMA ESTRATÉGIA NACIONAL. Ana Alves Pereira

Gestão de dados em biodiversidade: uma perspectiva.

Um espaço de conhecimento

DSPACE 6 REPOSITÓRIOS INSTITUCIONAIS CARACTERÍSTICAS E REQUISITOS TÉCNICOS

REGULAMENTOS. Política de Acesso Livre (Open Access) da U.PORTO

Projeto Continuidade Digital

Novidades e Prémio Daniel Gomes #WDPD2018

POLÍTICA INFORMACIONAL DO REPOSITÓRIO INSTITUCIONAL DA UNIVERSIDADE FEDERAL DE ITAJUBÁ

Uma vida em cada palavra

AGRUPAMENTO DE ESCOLAS GONÇALO SAMPAIO ESCOLA E.B. 2, 3 PROFESSOR GONÇALO SAMPAIO

Infraestrutura de Dados Espaciais Município de Portimão

Desafios para os profissionais da informação. Alexandra Lourenço

Repositório Científico de Acesso Aberto de Portugal

Jornadas Ibéricas de Infraestruturas de Dados Espaciais

julho/2010 FISL O W3C e Dados abertos na Web

Acesso aberto à informação científica e o direito à informação e à saúde. Fernando César Lima Leite

Política de Acesso Aberto de Publicações Científicas na Biblioteca Digital do IPB. Preâmbulo

Coleções Científicas e Biodiversidade. A contribuição da rede specieslink na divulgação da biodiversidade brasileira

Encontro Nacional de Infraestruturas de Informação Geográfica Auditório da Direção Nacional da Polícia Judiciária 8 e 9 de novembro de 2016

Indicadores de produção científica: resolução USP 6.444

REPOSITÓRIO DO INSTITUTO DE ENGENHARIA NUCLEAR: CURADORIA DIGITAL, PUBLICAÇÕES AMPLIADAS E GESTÃO DE PESQUISA

A criação de um Nó Nacional GBIF e cooperação nacional e internacional

Plataforma NAU. Rui Ribeiro, FCT FCCN. Diretor de Projeto. Ensino e Formação a Distância para Grandes Audiências.

de gestão para as instituições

Soluções Inteligentes de Gestão de Conteúdos Enterprise Content Management

As certificações no mercado de ECM

O Repositorio Aberto da U.PORTO

Acesso livre e aberto e uso de dados sobre biodiversidade: perspectivas e desafios. Dora Ann Lange Canhos, CRIA, Brasil

Indicadores de produção científica na USP

Roteiro Nacional de Infraestruturas de Investigação

Mapa da Competência, Sistemas de Informação de Pesquisa em Processo. Maria de Nazaré Freitas Pereira BSB, Nov./2014

Auto Arquivo no Repositório Aberto

Acesso Aberto. Gabriel Coelho Lucas Schmidt Juliana Coelho Matheus Chung Nin

Ferramentas recomendadas para o PMER da advocacia

Bibliotecas de ensino superior: novas e saudáveis tendências. Carlos Lopes

PLANO DE DESENVOLVIMENTO ESTRATÉGICO DO REPOSITÓRIO CIENTÍFICO DO IPL Grupo de Bibliotecários do Instituto Politécnico de Lisboa

Serviços eletrónicos b-on

Implementação do sistema Archeevo na Universidade do Porto

Gestão de Redes e Sistemas Distribuídos

DECISÃO DE EXECUÇÃO (UE) /... DA COMISSÃO. de

PROJETO DE PROPOSTA DE RESOLUÇÃO

Um instrumento para a elaboração de planos de preservação digital

Composição da Lista A Triénio

Arquivo da Web Portuguesa: uma infraestrutura para investigação científica. Daniel Gomes

Ciência Aberta: uma nova perspectiva para gestão da pesquisa?

FLASH TALK As infraestruturas de investigação e a preservação de dados: a experiência do Arquivo Português de Informação Social

Ensino Superior: aspectos

Repositórios Digitais

Agenda 09h00 09h30 09h40 Linhas de evolução do produto 10h00 Case Tool 10h30 11h00 Módulo de Gestão de Reuniões 11h30 Capture Bites 12h00

Principais Funcionalidades

Despacho no lol/r/2010. Política Institucional de Acesso Aberto

Manual da Aplicação. REVVASE Livros e Material Escolar Bolsa de Manuais Escolares. DGEstE Direção Geral dos Estabelecimentos Escolares

REPOSITÓRIO DO ISPA GUIA DO AUTO-ARQUIVO

Proposta de Estágio 2017 Open Data & Earth Observation Data Aggregator

Semana do Open Access (24 a 30 de Outubro de 2011)

Transcrição:

Práticas e ferramentas de gestão de dados Workflows para a long-tail da investigação João Aguiar Castro, João Rocha da Silva, Ricardo Carvalho Amorim, João Correia Lopes, Gabriel David, Cristina Ribeiro Faculdade de Engenharia da Universidade do Porto/ INESC TEC

Conteúdo Gestão de dados de investigação (RDM) RDM como parte do processo de investigação Limitações dos repositórios atuais O projeto TAIL Conclusões 2

Gestão de dados de investigação (RDM) 3

Stakeholders Quem são os envolvidos no processo de RDM? Instituições Curadores Investigadores Entidades financiadoras 4

Instituições Cumprir com obrigações legais Contribuir para políticas de acesso aberto Implementar planos de gestão de dados 5

Investigadores Partilhar dados cedo com parceiros Publicar no final do projeto Citar dados em publicações e permitir citações Garantir a sobrevivência dos dados para além dos projetos (com suporte institucional) 6

Curadores Receber e produzir metadados em formatos interoperáveis Construir serviços de disseminação de dados Garantir as melhores condições para a reutilização Levar a cabo ações de preservação 7

Entidades financiadoras Especificar requisitos de gestão de dados para projetos de investigação Avaliar projetos e seus Data Management Plans (DMPs) Disseminar produção científica 8

Gestão de dados como parte do processo de investigação 9

Ecossistema diverso Grandes instituições ou comunidades Infraestruturas de suporte Bom financiamento Práticas maduras Pequenos grupos Práticas ad-hoc Recursos insuficientes para curadoria Necessidade de formação de recursos

Problema Data Management Plans (DMPs) são requisito H2020. Quais os standards para descrição? Como partilhar os dados e em que repositórios? Como garantir acesso aos dados após o projeto? 11

Mas... Os dados são diferentes das publicações Diversidade de domínios Contextos de produção difíceis de capturar Apenas os investigadores sabem como detalhar os processos de produção de dados Investigadores não são curadores Não têm conhecimentos de gestão de dados Mudam de equipa após final dos projetos de investigação Podem não estar disponíveis aquando do depósito de dados 12

Outras questões Como prevenir a perda de dados durante a investigação? Como introduzir RDM no dia-a-dia dos investigadores? Ferramentas devem proporcionar benefícios imediatos Como enriquecer as descrições dos dados? Incorporar o investigador no processo de descrição 13

Análise de soluções de repositórios atuais 14

Convergência em 3 fatores fundamentais 1 Envolver investigadores desde cedo 2 Produzir metadados do domínio 3 Promover a visibilidade na comunidade 15

Princípios Dados têm de estar associados a metadados de domínio É impraticável atribuir a produção de todos os metadados a curadores Investigadores já os produzem no seu dia a dia Mas em suportes frágeis e dispersos Registos devem facilitar a interoperabilidade 16

O workflow Armazenamento local Repositórios Dados (e metadados ) Fontes Citar Reutilizar Preservar 17

Repositórios de dados de investigação Serviços Plataformas trade-offs 18

Sistema de estatísticas de citações de dados Exportação para sistemas de referências bibliográficas Sem custos de manutenção DOIs Suporte para comunidades Metadados são pesquisáveis 19

Instalável localmente Pode ser amplamente personalizado Tem amplas referências no domínio governamental Módulos de colaboração, armazenamento e processamento de dados Apoio de agências europeias 20

Módulos que cobrem parcialmente o workflow de RDM: Gestão e comunicação de equipas Plataforma de cloud computing Disseminação de dados em motores de pesquisa Preservação a longo prazo Colaboração RDM@FEUP - EUDAT DataPublication@UPorto: multi-disciplinary data description and deposit linking the Dendro staging platform with the EUDAT European Infrastructure 21

Repositórios de dados São repositórios finais Preservam os dados Garantem a sua publicação Guardam estatísticas sobre acessos e citações Mas não tentam encorajar a sua descrição tão cedo quanto possível Dados podem nem chegar a estas plataformas! 22

O projeto TAIL 23

Objetivos Capturar dados e metadados cedo para posterior depósito em qualquer repositório Assegurar acesso a dados após inevitável obsolescência Suportar o processo de investigação com RDM desde o início Promover recolha de metadados específicos do domínio 24

TAIL @ FEUP Avaliado junto dos investigadores Metadados de domínio Sob controlo da instituição Compatibilidade com protocolos de disseminação Baseado na web semântica Exportação para qualquer repositório Gestão colaborativa Cliente móvel (caderno de laboratório eletrónico) Gestão de permissões Armazenamento local e privado 25

TAIL @ FEUP... Repositórios Repositórios de dados Repositórios de dados Repositórios de dados de dados Comunidade científica Dados & Metadados 26

TAIL @ FEUP 27

TAIL @ FEUP Controlo de versões Recomendação de descritores Gestor de ficheiros Folha de metadados 28

TAIL @ FEUP - LabTablet Caderno de laboratório eletrónico Suporte para metadados de domínio Modo de campo para acompanhar investigadores Fácil de usar Registo de percurso feito ou cobertura geográfica Aproveitamento dos sensores disponíveis no equipamento (temperatura,...) Folha de metadados 29

Conclusões 30

Conclusões (1/3) Dados de investigação são diferentes das publicações Políticas atuais são herdadas das publicações RDM deve ser introduzida no processo de investigação Repositórios surgem demasiado tarde Investigadores devem participar na descrição dos seus dados Necessário prever obsolescência Soluções devem assegurar sobrevivência dos dados 31

Conclusões (2/3) Dendro: uma solução para gestão de dados dentro dos grupos de investigação Metadados específicos do domínio Publicação dos dados em múltiplos repositórios LabTablet: um caderno de laboratório eletrónico Suporta investigadores nos laboratórios e saídas de campo Integrado com o Dendro para depósito de metadados e dados de ocasião 32

Conclusões (3/3) Projeto TAIL: acompanhamento dos investigadores desde a produção de dados até ao seu depósito 10 a 50 grupos de investigação Workflow integrado de ferramentas Resultados previstos Envolvimento dos investigadores na descrição de dados Conjuntos de dados depositados nos principais repositórios Satisfação dos requisitos de DMPs dos grupos de investigação 33

TAIL @ FEUP... Repositórios Repositórios de dados Repositórios de dados Repositórios de dados de dados Comunidade científica Dados & Metadados {joaoaguiarcastro, joaorosilva}@gmail.com {rcamorim, mcr}@fe.up.pt 34