SOAR Data Quality Management: A Brazilian SOAR Data Archive. Iranderly Fernandes de Fernandes UEFS



Documentos relacionados
Tutorial de Instalação

Conteúdo. Disciplina: INF Engenharia de Software. Monalessa Perini Barcellos

SISTEMA GT Sistema de Gravação Telefônica

Processo de Desenvolvimento de Software

GARANTIA DA QUALIDADE DE SOFTWARE

Roteiro para a escrita do documento de Especificação de Requisitos de Software (ERS)

Software de gerenciamento de impressoras

Gerência de Redes. Introdução.

Introdução ao Modelos de Duas Camadas Cliente Servidor

1 Sumário O Easy Chat Conceitos Perfil Categoria Instalação O Aplicativo HTML...

Banco de Dados, Integração e Qualidade de Dados. Ceça Moraes cecafac@gmail.com

Ensino Técnico Integrado ao Médio FORMAÇÃO PROFISSIONAL. Plano de Trabalho Docente 2015

Gerenciamento de projetos.

Gerenciamento de Incidentes

4.1 A Parte que recebeu a notificação de anormalidade deverá encaminhá-la imediatamente a um órgão responsável, para resolver a anormalidade.

Solução do segundo exercício proposto REDE DE HOTÉIS

Gerenciamento de Incidentes - ITIL. Prof. Rafael Marciano

Qualidade de Software. Profa. Cátia dos Reis Machado

UNIDADE 4. Introdução à Metodologia de Desenvolvimento de Sistemas

Sistemas Informatizados. Alfonso Izarra

Motivos para você ter um servidor

Modelo Cascata. Alunos: Bruno Nocera Zanette Pedro Taques

Desenvolvimento de um software de gerenciamento de projetos para utilização na Web

SOLUÇÕES PARA CONTINUIDADE DO NEGÓCIO

SIntegra Abordagem Completa Ferramentas Relacionadas.

ARCO - Associação Recreativa dos Correios. Sistema para Gerenciamento de Associações Recreativas Plano de Desenvolvimento de Software Versão <1.

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

Começo por apresentar uma breve definição para projecto e para gestão de projectos respectivamente.

Auditoria e Qualidade de Software ISO/IEC 9126 Engenharia de Software Qualidade de Produto

Roteador Load-Balance / Mikrotik RB750

IV. Intercâmbio Eletrônico de Dados (EDI)

GUIA RÁPIDO DE UTILIZAÇÃO DO PORTAL DO AFRAFEP SAÚDE

Fundamentos dos Sistemas de Informação Organização de Dados e Informações

1.264 Aula 1. Introdução ao curso Lição de casa 1 Métodos de desenvolvimento de software

Quality Content Resource Management Access Integration Consultation. Página de Acesso:

Engenharia de Software II

MANUAL EXPORTAÇÃO IMPORTAÇÃO

Microsoft LicenseWise. Visão Geral do Parceiro Versão 1.0 Junho 2007

IMPLEMENTAÇÃO DAS CAMADAS Inference Machine e Message Service Element PARA UM SERVIDOR DE SISTEMA DE GERENCIAMENTO DE Workflow HOSPITALAR

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, MODELAGEM DE DADOS. Aula 2. Prof. Rafael Dias Ribeiro. M.Sc.

Nota de Aplicação. Relatório em HTML no Vijeo Citect 1.0. Suporte Técnico Brasil. Versão:

Segundo Pré-teste. Data de realização. 18 de Novembro de Local.

Manual Do Usuário Processo Licitação

Gerência de Redes Áreas Funcionais de Gerenciamento. Douglas Duarte

Sistema Xibobó de Gestão de Eventos Caso de Uso: Processar Venda e Acompanhamento de Entrega de Ingressos

Diretrizes Propostas para Aplicação da APF em Programa Envolvendo Tecnologias Recentes Tais como Barramento, BPMS e Portal

Service Level Management SLM. Gerenciamento de Níveis de Serviço

DTM Suite. PRECISION feeding. DTM Suite O PRODUTO. FUNCIONALIDADE e VANTAGENS

Checklist de Projeto de Data Warehouse

QUALIDADE DE SOFTWARE

Introdução ao GED Simone de Abreu

Nota de Aplicação. Escrita em Banco de Dados SQL com o Vijeo Citect 1.0. Suporte Técnico Brasil. Versão:

Fábio Giordani. Técnico em Processamento de Dados Adm. Análise de Sistemas. Outros cursos. Coordenador Projetos e Consultoria em Infraestrutura

Ferramentas para Desenvolvimento de Software Livre: Ferramentas Gráficas para CVS

Microsoft Project 2003

Exame de Fundamentos da ITIL

MÓDULO 7 Modelo OSI. 7.1 Serviços Versus Protocolos

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini prof.andre.luis.belini@gmail.com /

Governança de T.I. Professor: Ernesto Junior Aula IV Unidade II

OTIMIZAÇÃO DE PROCESSOS

Atividade da gerência da qualidade

18º Congresso de Iniciação Científica IMPLEMENTAÇÃO DE UM MODELO DE TESTE DE APLICAÇÕES WEB

Gerenciamento de software como ativo de automação industrial

Arquitetura dos Sistemas de Informação Distribuídos

Noções de. Microsoft SQL Server. Microsoft SQL Server

BAIXA E INSTALAÇÃO DE CERTIFICADO A1. Versão 1.0r0 de 29 de Janeiro Classificação: Ostensivo

Manual Do Usuário Processo Aditivo de Prazo

PORTARIA Nº 178 DE 25 DE OUTUBRO DE 2012.

Projeto de Desenvolvimento Institucional de. Gestão Documental

PgAdmin. O pgadmin é um software gráfico para administração do SGBD PostgreSQL disponível para Windows e UNIX.

CSF FasTest SOLUÇÕES DE OUTPUT DE PAGAMENTO

Universidade Federal de Santa Maria Curso de Arquivologia. Disciplina de Banco de Dados Aplicados à Arquivística. Versao 1.

ATO Nº 233/2013. A PRESIDENTE DO TRIBUNAL REGIONAL DO TRABALHO DA 7ª REGIÃO, no uso de suas atribuições legais e regimentais,

Quality Content Resource Management Access Integration Consultation. Página de Acesso:

Requisitos de Software. Teresa Maciel DEINFO/UFRPE

BACTOCOUNT IBC EXPORTAÇÃO DE DADOS CONFIGURAÇÕES

BDG - BANCO DE DADOS DE GRADES UMA FERRAMENTA PARA DISPONIBILIZAR DADOS DE PREVISÃO DE MODELOS NUMÉRICOS DE TEMPO E CLIMA

Revisão: Introdução. - Integração com o AutoManager; 1 Atualização de versão do banco de dados PostgreSQL

Gestão do Conhecimento melhores práticas de compartilhamento e sustentabilidade. Gestão da Mudança no chão de fábrica 2010

QUESTIONAMENTO 06 ACERCA DO EDITAL DO PREGÃO ELETRÔNICO AA Nº 16/2013 BNDES

Pense num robô controlando todas as rotinas de sua empresa e permitindo aos colaboradores, cuidarem melhor dos seus clientes.

SIMA. Sistema Integrado de Monitorização, Controlo e Alarme

Valor total do protocolo diferente do valor total das guias Protocolo 1199 Outros

Metodologias de Desenvolvimento de Sistemas. Analise de Sistemas I UNIPAC Rodrigo Videschi

VALIDADOR DE ARQUIVOS SICREDI (VAS) Cobrança e Convênios

Plano de Trabalho Docente Ensino Técnico

Conteúdo O que é?... 4 Histórico... 4 Onde Baixar?... 4 Diferença entre Firebird e o Interbase... 4 Como instalar?... 4 Instalando o Ibexpert...

Em direção à portabilidade entre plataformas de Computação em Nuvem usando MDE. Elias Adriano - UFSCar Daniel Lucrédio - UFSCar

RECOLHA DE INFORMAÇÃO DE REMUNERAÇÕES, SUPLEMENTOS E DOS PONTOS DECORRENTES DA AVALIAÇÃO DE DESEMPENHO

Objetivo Problemas Detectados

Perguntas Freqüentes (FAQs)

Ambientação JAVA. Versão 0.1 MICHEL CORDEIRO ANALISTA DE NEGÓCIO (NTI 2014) 1 UNIVERSIDADE CEUMA 08/01/2014

Especialização em Engenharia de Software e Banco de Dados

MANUAL DE INSTALAÇÃO 1) ORACLE VIRTUALBOX ; 2) MICROSOFT WINDOWS ; 3) SUMÁRIOS GENEPLUS.

Por meio deste, aditamos o seguinte: ( 01 ) Ficam retiradas do Edital as seguintes exigências:

4o ENCONTRO DE USUÁRIOS DE BI

Gestão de contratos com métricas de resultado (serviços de software)

Transcrição:

SOAR Data Quality Management: A Brazilian SOAR Data Archive Iranderly Fernandes de Fernandes UEFS

O que é Data Quality É o desagradável ser que fica apontando os defeitos no conjunto de dados? Prefiro pensar que seja a consciência do conjunto de dados. 2

Uma Visão Richard Wang (2000) defende a idéia de que a qualidade dos dados depende dos processo utilizados durante o projeto e geração desses dados. Ele trata a questão da qualidade sob duas perspectivas: visão interna e visão externa. Onde a visão interna trata do projeto e da operação E a visão externa trata da utilização e o valor da qualidade. 3

O que a Qualidade de Dados deve garantir em uma Data Warehouse Acurácia - representa a margem entre valor correto do dado e sua possível variação. Fornece a margem de erro aceitável. Precisão - a representação dos dados é fidedigna à realidade. Integridade - as estruturas dos dados são mantidas de forma consistente, de forma a garantir a veracidade das relações entre elas. Completude - todos os dados necessários estão presentes. 4

O que a Qualidade de Dados deve Garantir em uma Data Warehouse Validade - os valores estão dentro dos limites estipulados. Disponibilidade - os dados estão disponíveis quando requisitados. Acesso - os dados são facilmente acessados, compreendidos e usados. 5

Os problemas de Qualidade de Dados são gerados por: erros de entrada de dados, acomodação indevida de informações devido à inexistência de uma forma adequada de armazená-las, integração de fontes de dados, erros sistêmicos como modelagem inadequada ou insuficiente evolução e a necessidade de interação de novos sistemas com outros sistemas. 6

Tratamento de problemas de Qualidade de Dados Data profiling, (detecção avaliação correção ) a deduplicação, a padronização de dados, verificação de valores, a adoção de metadados (só para citar alguns). 7

SOAR VO e Data Quality Uma breve estória de acertos e erros Ou o real valor da qualidade de dados 8

Objective Create a SOAR VO compliant archive. Provides a seamless access to the SOAR astronomical data Archives Catalogs ( that will be produced) Provides analysis environment under which multiwavelength study can be easily conducted An analysis tool is dedicated for each instrument A homogeneous interface to the software Easy access to the software 1 9

Structure SOAR-VO Physical Structure MMDDYYYY Program 1 Tree structure (simple) (to reproduce real world) Logical Structure Program 2 Science Calibration Science Relational data base Metadata extracted from FITS header Tables of metadata crated MMDDYYYY Program 3 Program 1 Program 4 Calibration Science Calibration Program 5 3 10

Structure General Concept User SOAR-VO Protocols SOAR DB Federated DB 5 11

VO - Protocol Cone Search SIAP SSAP Data Scope 7 12

VO - Protocol Cone Search Example 8 13

Query Results HTML VOTable 9 14

VO - Protocol CSV - Comma Separated Values Navigation Chart (test phase) 10 15

VO Protocol SIAP (Simple Image Access Protocol) Example Images Download File 13 16

VO Protocol SIAP (Simple Image Access Protocol) Example FITS HEADER 14 17

VO Protocol Data Scope Calling the NVO Service 15 18

Data Quality Onde entra a qualidade dos dados nisso? O susto!!!!!!! 34% dos dados antigos do SOAR apresentavam problemas nos metadados. Problemas na parte binária dos arquivos FITS (SOI) Neste momento é que se percebe a necessidade de um processo de Data Quality. 19

Investigação Onde seria a fonte deste problema? Como corrigí-lo? 20

Modos de Aquisição Fila (Brasil) Clássico (Parceiros e Brasil) Remoto (parceiros e Brasil) Imprecisão humana ao criar o header 21

Instrumentos SOI OSIRIS Godmann Outros Headers (metadados) não homogêneos. 22

Correções Da parte de obtenção de dados Aviso ao astrônomo que o Controle do telescópio está operacional (garante que os headers sejam escritos). Impossível definir um único modo de aquisição. Porém, pode se tentar minimizar a interação do astrônomo com o software de aquisição. Garantir que o observador forneça uma descrição detalhada da noite de observação através do log de observação. Reuniões da equipe de astrônomos residentes para discutir falhas e minimizá-las. 23

Correções Da parte dos bancos de dados Recuperar as informações faltantes por meio dos logs de observação. Ou por meio do banco de dados de solicitações de tempo. Criar um conjunto de metadados homogêneo e funcional ao VO e editá-los. 24

Concluindo Moral da estória: Com data quality tem solução. Porém é interessante garantir que não seja preciso mudanças drásticas durante o processo de criação da data warehouse. Como? Tentando descobrir pontualmente onde pode ser gerado uma imprecisão e de pronto sugerir a sua correção sistemática. Pensando todo o processo da aquisição e criação do dado até o usuário final 25

OBRIGADO 26