MultiPrInt: um modelo de procedência para integração de dados com suporte para um ambiente multiusuário

Documentos relacionados
Bruno Tomazela Orientadora: Profª Drª Cristina Dutra de Aguiar Ciferri. 04 de Abril de 2008

Integração de Dados. Disciplina de Procedência de Dados e Data Warehousing. Profa. Dra. Cristina Dutra de Aguiar Ciferri

Procedência de Dados. Disciplina de Procedência de Dados e Data Warehousing. Profa. Dra. Cristina Dutra de Aguiar Ciferri

PrIntCloud. Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13

Motivação e Conceitos Básicos

MIDB-OP: um Modelo de Integração de Dados Biológicos apoiado em Ontologias e Procedência de dados Caroline Beatriz Perlin

Bancos de Dados NoSQL

Segundo trabalho prático de implementação Sistema de reserva de assentos

Mineração de Dados. Arthur Emanuel de O. Carosia Cristina Dutra de Aguiar Ciferri

Aula 03. Evandro Deliberal

Banco de Dados I 6 Transações e Controle de Concorrência

Revisão e Introdução 23/05/12. Controle Distribuído da Concorrência. Revisão de Conceitos. Revisão de Conceitos. Transação Operação

ESCOLA POLITÉCNICA DA UNIVERSIDADE DE SÃO PAULO

Victor Hugo Andrade Soares monitor João Vitor dos Santos Tristão Primeiro Trabalho Prático

Controle de Concorrência

Segunda Parte do Trabalho Prático (Parte II) Valor: 70%

Banco de Dados I. Aula 18 - Prof. Bruno Moreno 22/11/2011

Integração de Dados. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

SGBD. Funções Básicas de um SGBD

Conceitos Básicos. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Visão do Usuário da DSM

BCC390 - Monografia I

SISTEMAS DISTRIBUÍDOS E TOLERÂNCIA A FALHAS MESTRADO DE ENGENHARIA INFORMÁTICA 2013/2014 DOCENTE: PROF. DRª. PAULA PRATA

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Configurar Ingressos

Primeira Parte do Trabalho Prático (Parte I) Valor: 40% Descrição do arquivo de dados

Técnicas de Recuperação em Banco de Dados

Sistemas de Arquivos Distribuídos. Bruno M. Carvalho Sala: 3F2 Horário: 35M34

Primeira Parte do Trabalho Prático (Parte I) Valor: 30% Descrição do arquivo de dados

Editores Colaborativos (Keepers)

Roteiro. Noções de Controle de Concorrência. BCC321 - Banco de Dados I. Ementa. Finalidade do Controle de Concorrência.

Desenvolvimento de Aplicações Distribuídas

SGBD. Definição. Funções básicas

Tipos de Índices. Profa. Dra. Cristina Dutra de Aguiar Ciferri

Sumário. Introdução a Transações

SQL Linguagem de Definição de Dados

Programação Distribuída. Metas de um Sistema Distribuído

Primeiro Trabalho Prático Turma A. Descrição do Trabalho. Considere os seguintes dados a respeito de um livro:

Processamento de Transações

Dados Espaciais e Indexação

Processamento de Transações

Oracle Comandos para Processamento de Transações

Gerência de Configuração: Terminologia. Leonardo Gresta Paulino Murta

Git. Bruno de Pinho Sche.no

Sistemas de Gerência de Bancos de Dados. 5 - Controle de Concorrência Tópicos Adicionais

Sumário. Recuperação de Falhas

BCD29008 Banco de dados

Sistemas Distribuídos

Controle de Transação

Controle de Transações. Banco de Dados André Luiz do Vale Soares

Gerência de Transações Distribuídas

Algoritmos de bulk-loading para o método de acesso métrico Onion-tree

BCD29008 Banco de dados

Segunda Parte do Trabalho Prático (Parte II) Valor: 60% Descrição do índice

Processamento de Transações. Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri

DDL). O resultado da compilação dos parâmetros DDLs é

Sistemas Distribuídos. Capítulo 7 - Aula 16

Trabalho Prático. Descrição Considere os seguintes dados a respeito de uma pessoa:

Árvores B. Árvores B. Estrutura de Dados II Jairo Francisco de Souza

Engenharia de Software. Prof. Raquel Silveira

Sistemas Distribuídos. Ricardo Ribeiro dos Santos

5.1. Fluxo para geração do Roadmap

Árvores-B: Remoção. Cristina Dutra de Aguiar Ciferri Thiago A. S. Pardo

Introdução à Computação II (Noturno) BCC Unesp Rio Claro/SP 2015 em PDF via Moodle: Escolha apenas 5 exercícios para entrega Exercício 01 (Pilhas)

Aula 7 TECNOLOGIA EM JOGOS DIGITAIS JOGOS MULTI PLAYER. Marcelo Henrique dos Santos

Arquitetura de um Ambiente de Data Warehousing

Árvore-B + Profa. Dra. Cristina Dutra de Aguiar Ciferri

Servidor V9 SP3. de Impressão 708P Impressora. Digital em

MATA60 BANCO DE DADOS Aula 5- Modelo Relacional. Prof. Daniela Barreiro Claro

Trabalho Prático. Primeira Parte do Trabalho (Parte I): peso 40%

Quinto Trabalho Prático. Este trabalho tem como objetivo indexar arquivos de dados usando um índice árvore-b.

Árvore-B. Árvore B. Características Gerais. Sistemas de Banco de Dados. Características Gerais. Revisão

Introdução. descrever os tipos de interfaces e linguagens oferecidas por um SGBD. mostrar o ambiente de programas dos SGBD s

Processamento de INDUSTRIA 4.0. Big Data. Aula #8 - Transações e concorrência MARMELADA NO RING, FONTE: ESTADAO EDUARDO CUNHA DE ALMEIDA

Arquitetura de um Ambiente de Data Warehousing

Lista de Exercícios. Av. Trabalhador São-carlense, 400. centro. São Carlos - SP cep Brasil.

Especificação de Caso de Uso

Segundo Trabalho Prático Turma A

Importação de Extrato Eletrônico EEFI Operadora de Cartão de Crédito REDECARD

Quarto Trabalho Prático. Este trabalho tem como objetivo indexar arquivos de dados usando um índice simples ou linear. Descrição de páginas de disco

4 Modelos Propostos para Otimização de Planejamentos com Restrições de Precedência 4.1 Representação com Algoritmos Genéticos

Listas Estáticas. SCC Algoritmos e Estruturas de Dados I. Prof. Fernando V. Paulovich. *Baseado no material do Prof.

ERP BRASCOMM Sistema de Gestão Empresarias 100% Web. Manual do Usuário. Módulo de Administração da Produção

Modelagem Multidimensional - Nível Físico -

Programação Distribuída. Tipos de Sistemas Distribuídos

Departamento de Ciências de Computação SCC Instituto de Ciências Matemáticas e de Computação ICMC Universidade de São Paulo USP

BANCO DE DADOS 2 TRANSAÇÃO

Trabalho Prático. Descrição do arquivo de dados

Modelos de Dados Temporais

Contato. professorluisleite.wordpress.com

Data Quality Services (DQS)

Modelagem Multidimensional - Nível Físico -

Arquitetura de um Ambiente de Data Warehousing

5 Usando as Representações de Design Rationale

Árvores-B + Profa. Dra. Cristina Dutra de Aguiar Ciferri. Algoritmos e Estruturas de Dados II Árvore-B +

Gerenciamento de Transações em Banco de Dados

Artigo - Blog Módulo CRM

Transcrição:

MultiPrInt: um modelo de procedência para integração de dados com suporte para um ambiente multiusuário Disciplina: Procedência de Dados e Data Warehousing Aluna: Dayse Silveira de Almeida Professora: Cristina D. A. Ciferri

26/04/2013 ICMC-USP 2/46 Roteiro Introdução Propostas preliminares para o Modelo MultiPrInt Conceito de transação Métodos para controle de concorrência Repositório centralizado e repositórios distribuídos Momento da integração Cópia locais distribuídas, cópias locais centralizadas e única cópia local centralizada Sugestões da banca Próximos passos

26/04/2013 ICMC-USP 3/46 Ambiente Multiusuário O ambiente multiusuário exige que operações sejam tratadas em termos de transações Transações são conjuntos de operações de leitura e escrita que formam uma única unidade lógica de execução, acessando e atualizando diversos itens de dados Os principais métodos de controle de concorrência baseados em serialização são Bloqueio, timestamp, validação e múltiplas versões

26/04/2013 ICMC-USP 4/46 Ambiente Multiusuário Bloqueio itens de dados acessados de maneira mutuamente exclusiva Ordem de execução de acordo com a solicitação do bloqueio Timestamp fixo e exclusivo a cada transação no sistema antes do início da execução Ordem de execução selecionada com antecedência Validação transações executadas em fases: leitura, validação e escrita; Múltipla versão não assegura a serialização abortando ou adiando transações Armazena cópias antigas de cada item de dado Escrita cria uma nova versão Leitura seleciona uma versão para ser lida assegurando a serialização

26/04/2013 ICMC-USP 5/46 Roteiro Introdução Propostas preliminares para o Modelo MultiPrInt Conceito de transação Métodos para controle de concorrência Repositório centralizado e repositórios distribuídos Momento da integração Cópia locais distribuídas, cópias locais centralizadas e única cópia local centralizada Sugestões da banca Próximos passos

26/04/2013 ICMC-USP 6/46 Propostas Preliminares para o Modelo MultiPrInt Colaboração nos resultados Ambientes multiusuários Definir transação no contexto do modelo Reformular o formato das operações para identificação de transações Definir conflitos entre transações Resolução de conflitos gerados concorrentemente Controle de concorrência sobre o repositório Momento da integração de dados de usuários concorrentes Garantir reaplicação entreprocessos

26/04/2013 ICMC-USP 7/46 Transação Ações permitidas ao usuário: inserção, remoção, cópia e edição Transação definida em termos de ação do usuário Cada ação é englobada em uma única transação Definição (transação) Uma transação é uma sequência completa de operações de modificação nas fontes locais, induzidas por uma única ação do usuário, ou seja, uma ação de inserção, remoção, cópia ou edição

26/04/2013 ICMC-USP 8/46 Roteiro Introdução Propostas preliminares para o Modelo MultiPrInt Conceito de transação Métodos para controle de concorrência Repositório centralizado e repositórios distribuídos Momento da integração Cópia locais distribuídas, cópias locais centralizadas e única cópia local centralizada Sugestões da banca Próximos passos

26/04/2013 ICMC-USP 9/46 Métodos para Controle de Concorrência Quanto ao armazenamento das transações concorrentes no repositório de operações, pretende-se investigar duas abordagens 1. Repositório centralizado 2. Repositórios distribuídos

26/04/2013 ICMC-USP 10/46 1. Repositório Centralizado 1. Bloquear o repositório para escrita 2. Para manter o repositório consistente: redo No momento da integração 3. VRT para validação completa e reaplicação

26/04/2013 ICMC-USP 11/46 2. Repositórios Distribuídos Consistência dos repositórios locais: redo Repositórios buscados e validados na origem e destino Individualmente e sequencialmente Para transações válidas: busca-se conflitos

26/04/2013 ICMC-USP 12/46 Conflitos Multiusuários Definição (operações conflitantes) 1. a = (origem, destino, idobjeto, atributo) e b = (origem, destino, idobjeto, atributo), ou 2. a = (destino, idobjeto, atributo) e b = (origem, idobjeto, atributo), ou 3. a = (origem, idobjeto, atributo) e b = (destino, idobjeto, atributo)

26/04/2013 ICMC-USP 13/46 Conflitos Multiusuários Definição (transações conflitantes) Duas transações t e t conflitam se quaisquer de suas operações conflitam

26/04/2013 ICMC-USP 14/46 Conflitos Multiusuários Usuário id op origem destino idobjeto atributo valororigem valordestino timestamp X1 1 cp Bruno Daniel Artigo [Título=MultiPrInt: X2 1 cp Bruno Daniel Artigo [Título=MultiPrInt: 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X3 1 cp Daniel Bruno Artigo [Título=MultiPrInt: X4 1 cp Emanuel Bruno Artigo [Título=MultiPrInt: X5 1 ed null Daniel Artigo [Título=MultiPrInt: 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X6 1 cp Daniel Fábio Artigo [Título=MultiPrInt: X7 1 cp Bruno Gabriel Artigo [Título=MultiPrInt: Página final 24 15 13:41:47_ Página final 24 15 11:22:33_ Página final 24 20 11:25:22_ Página final 15 24 10:45:39_ Página final 234 24 08:28:43_ Página final 22 15 09:45:57_ Página final 22 20 09:50:02_ Página final 15 42 10:13:45_ Página final 24 20 12:24:55_ Figura17: Transações conflitantes em nível multiusuário

26/04/2013 ICMC-USP 15/46 2. Repositórios Distribuídos Transações não conflitantes são reaplicadas Para o conjunto de transações conflitantes: Reaplicar a mais recente Detectar transitivas a essa e reaplicar Transações conflitantes não escolhidas para reaplicação I. Remoção do repositório II. Tratamento

26/04/2013 ICMC-USP 16/46 2. Repositórios Distribuídos I. Remoção de transações conflitantes Ignorar X ignorar e remover

26/04/2013 ICMC-USP 17/46 2. Repositórios Distribuídos II. Tratamento de transações conflitantes Transações conflitantes não escolhidas são consideradas sobrepostas Removidas ou refeitas de acordo com o tipo de sobreposição

26/04/2013 ICMC-USP 18/46 2. Repositórios Distribuídos II. Tratamento de transações conflitantes Se a sobreposição detectada for do destino A transação t deve ser removida de seu repositório Suas transitivas são refeitas de acordo com o valor de t, e reaplicadas

26/04/2013 ICMC-USP 19/46 2. Repositórios Distribuídos Usuário id op origem destino idobjeto atributo valororigem valordestino timestamp X1 1 cp Bruno Daniel Artigo [Título=MultiPrInt: X2 1 cp Bruno Daniel Artigo [Título=MultiPrInt: 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X3 1 cp Daniel Bruno Artigo [Título=MultiPrInt: X4 1 cp Emanuel Bruno Artigo [Título=MultiPrInt: X5 1 ed null Daniel Artigo [Título=MultiPrInt: 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X6 1 cp Daniel Fábio Artigo [Título=MultiPrInt: X7 1 cp Bruno Gabriel Artigo [Título=MultiPrInt: Página final 24 15 13:41:47_ Página final 24 15 11:22:33_ Página final 24 20 11:25:22_ Página final 15 24 10:45:39_ Página final 234 24 08:28:43_ Página final 22 15 09:45:57_ Página final 22 20 09:50:02_ Página final 15 42 10:13:45_ Página final 24 20 12:24:55_ Figura 18: Sobreposição do destino

26/04/2013 ICMC-USP 20/46 2. Repositórios Distribuídos Usuário id op origem destino idobjeto atributo valororigem valordestino timestamp X1 1 cp Bruno Daniel Artigo [Título=MultiPrInt: X2 1 cp Bruno Daniel Artigo [Título=MultiPrInt: 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X3 1 cp Daniel Bruno Artigo [Título=MultiPrInt: X4 1 cp Emanuel Bruno Artigo [Título=MultiPrInt: X5 1 ed null Daniel Artigo [Título=MultiPrInt: 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X6 1 cp Daniel Fábio Artigo [Título=MultiPrInt: X7 1 cp Bruno Gabriel Artigo [Título=MultiPrInt: Página final 24 15 13:41:47_ Página final 24 15 11:22:33_ Página final 24 20 11:25:22_ Página final 15 24 10:45:39_ Página final 234 24 08:28:43_ Página final 22 15 09:45:57_ Página final 24 20 09:50:02_ Página final 15 42 10:13:45_ Página final 24 20 12:24:55_ Figura 18: Sobreposição do destino

26/04/2013 ICMC-USP 21/46 2. Repositórios Distribuídos II. Tratamento de transações conflitantes Se a sobreposição detectada for da origem A transação t e suas transitivas são refeitas de acordo com o valor de t, e reaplicadas

26/04/2013 ICMC-USP 22/46 2. Repositórios Distribuídos Usuário id op origem destino idobjeto atributo valororigem valordestino timestamp X1 1 cp Bruno Daniel Artigo [Título=MultiPrInt: X2 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X3 1 cp Daniel Bruno Artigo [Título=MultiPrInt: X4 1 cp Emanuel Bruno Artigo [Título=MultiPrInt: X5 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X6 1 cp Daniel Fábio Artigo [Título=MultiPrInt: X7 1 cp Bruno Gabriel Artigo [Título=MultiPrInt: Página final 24 15 13:41:47_ Página final 24 20 11:25:22_ Página final 15 24 10:45:39_ Página final 234 24 08:28:43_ Página final 24 20 09:50:02_ Página final 15 42 10:13:45_ Página final 24 20 12:24:55_ Figura 18: Sobreposição da origem

26/04/2013 ICMC-USP 23/46 2. Repositórios Distribuídos Usuário id op origem destino idobjeto atributo valororigem valordestino timestamp X1 1 cp Bruno Daniel Artigo [Título=MultiPrInt: X2 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X3 1 cp Daniel Bruno Artigo [Título=MultiPrInt: X4 1 cp Emanuel Bruno Artigo [Título=MultiPrInt: X5 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X6 1 cp Daniel Fábio Artigo [Título=MultiPrInt: X7 1 cp Bruno Gabriel Artigo [Título=MultiPrInt: Página final 24 15 13:41:47_ Página final 24 20 11:25:22_ Página final 24 24 10:45:39_ Página final 234 24 08:28:43_ Página final 24 20 09:50:02_ Página final 15 42 10:13:45_ Página final 24 20 12:24:55_ Figura 18: Sobreposição da origem

26/04/2013 ICMC-USP 24/46 2. Repositórios Distribuídos Usuário id op origem destino idobjeto atributo valororigem valordestino timestamp X1 1 cp Bruno Daniel Artigo [Título=MultiPrInt: X2 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X3 1 cp Daniel Bruno Artigo [Título=MultiPrInt: X4 1 cp Emanuel Bruno Artigo [Título=MultiPrInt: X5 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X6 1 cp Daniel Fábio Artigo [Título=MultiPrInt: X7 1 cp Bruno Gabriel Artigo [Título=MultiPrInt: Página final 24 15 13:41:47_ Página final 24 20 11:25:22_ Página final 24 24 10:45:39_ Página final 234 24 08:28:43_ Página final 24 20 09:50:02_ Página final 15 42 10:13:45_ Página final 24 20 12:24:55_ Figura 18: Sobreposição da origem

26/04/2013 ICMC-USP 25/46 2. Repositórios Distribuídos Usuário id op origem destino idobjeto atributo valororigem valordestino timestamp X1 1 cp Bruno Daniel Artigo [Título=MultiPrInt: X2 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X3 1 cp Daniel Bruno Artigo [Título=MultiPrInt: X4 1 cp Emanuel Bruno Artigo [Título=MultiPrInt: X5 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X6 1 cp Daniel Fábio Artigo [Título=MultiPrInt: X7 1 cp Bruno Gabriel Artigo [Título=MultiPrInt: Página final 24 15 13:41:47_ Página final 24 20 11:25:22_ Página final 24 24 10:45:39_ Página final 234 24 08:28:43_ Página final 24 20 09:50:02_ Página final 24 42 10:13:45_ Página final 24 20 12:24:55_ Figura 18: Sobreposição da origem

26/04/2013 ICMC-USP 26/46 2. Repositórios Distribuídos II. Tratamento de transações conflitantes Se o destino na transação sobreposta t for igual à origem na transação escolhida como correta t A transação t e suas transitivas devem ser removidas do seu repositório

26/04/2013 ICMC-USP 27/46 2. Repositórios Distribuídos Usuário id op origem destino idobjeto atributo valororigem valordestino timestamp X1 1 cp Bruno Daniel Artigo [Título=MultiPrInt: X2 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X3 1 cp Daniel Bruno Artigo [Título=MultiPrInt: X4 1 cp Emanuel Bruno Artigo [Título=MultiPrInt: X5 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X6 1 cp Daniel Fábio Artigo [Título=MultiPrInt: X7 1 cp Bruno Gabriel Artigo [Título=MultiPrInt: Página final 24 15 13:41:47_ Página final 24 20 11:25:22_ Página final 24 24 10:45:39_ Página final 234 24 08:28:43_ Página final 24 20 09:50:02_ Página final 24 42 10:13:45_ Página final 24 20 12:24:55_ Figura 18: Destino de t é igual à origem de t

26/04/2013 ICMC-USP 28/46 2. Repositórios Distribuídos II. Tratamento de transações conflitantes Se nenhum dos casos anteriores ocorre A origem na transação t é igual à origem na transação escolhida como correta t A transação não é conflitante com t e deve ser reaplicada

26/04/2013 ICMC-USP 29/46 2. Repositórios Distribuídos Usuário id op origem destino idobjeto atributo valororigem valordestino timestamp X1 1 cp Bruno Daniel Artigo [Título=MultiPrInt: X2 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X3 1 cp Daniel Bruno Artigo [Título=MultiPrInt: X5 2 cp Daniel Carlos Artigo [Título=MultiPrInt: X6 1 cp Daniel Fábio Artigo [Título=MultiPrInt: X7 1 cp Bruno Gabriel Artigo [Título=MultiPrInt: Página final 24 15 13:41:47_ Página final 24 20 11:25:22_ Página final 24 24 10:45:39_ Página final 24 20 09:50:02_ Página final 24 42 10:13:45_ Página final 24 20 12:24:55_ Figura 18: Origem de t é igual à origem de t

26/04/2013 ICMC-USP 30/46 Repositório Centralizado e Repositórios Distribuídos Timestamp não garante a escolha da transação correta Transações conflitantes em nível multiusuário Propostas Remover todas as transações conflitantes PrInt: garantir a validade das operações e reprodução apenas de operações válidas Recomendação ao usuário no instante da reconciliação Desafio: identificar usuários Para conflitos de um único usuário: política redo Para conflitos multiusuários: recomendação Investigação inviável para repositórios distribuídos

26/04/2013 ICMC-USP 31/46 Roteiro Propostas preliminares para o Modelo MultiPrInt Conceito de transação Métodos para controle de concorrência Repositório centralizado e repositórios distribuídos Momento da integração Cópia locais distribuídas, cópias locais centralizadas e única cópia local centralizada Sugestões da banca Próximos passos

26/04/2013 ICMC-USP 32/46 Momento da Integração Duas abordagens 1. Processo definido pelo usuário e cópias locais distribuídas; Uma cópia local para cada usuário 2. Processo automático e cópia local centralizada Uma cópia local para todos os usuários

26/04/2013 ICMC-USP 33/46 1. Processo definido pelo usuário, cópias locais distribuídas Para repositório distribuído Usuário decide o momento da integração Antes do próximo processo de reconciliação Repositórios de todos os usuários são buscados, integrados e reaplicados

26/04/2013 ICMC-USP 34/46 1. Processo definido pelo usuário, cópias locais distribuídas Para repositório distribuído Figura 19: MultiPrInt com repositório e cópias locais distribuídas

26/04/2013 ICMC-USP 35/46 1. Processo definido pelo usuário, cópias locais distribuídas Para repositório centralizado Usuário decide o momento da integração Antes do próximo processo de reconciliação Reaplicar até o último processo de reconciliação finalizado

26/04/2013 ICMC-USP 36/46 1. Processo definido pelo usuário, cópias locais distribuídas Para repositório centralizado Figura 20: MultiPrInt com repositório centralizado e cópias distribuídas

26/04/2013 ICMC-USP 37/46 1.5. Processo definido pelo usuário, cópias locais centralizadas Máquina remota Repositório centralizado Cópias locais centralizadas Uma para cada usuário Figura 21: MultiPrInt com repositório centralizado e cópias locais centralizadas

26/04/2013 ICMC-USP 38/46 2. Processo definido automaticamente, cópia local centralizadas Momento pré-definido Verificação/notificação do estado de todos os processos de reconciliação Antes do início de novos processos de reconciliação de todos os usuários Para repositório centralizado Validar e reaplicar usando VRT Para repositório distribuído Coletar todos os repositórios, integrar e reaplicar (utilizando os algoritmos mostrados)

26/04/2013 ICMC-USP 39/46 Roteiro Propostas preliminares para o Modelo MultiPrInt Conceito de transação Métodos para controle de concorrência Repositório centralizado e repositórios distribuídos Momento da integração Cópia locais distribuídas, cópias locais centralizadas e única cópia local centralizada Sugestões da banca Próximos passos

26/04/2013 ICMC-USP 40/46 Sugestões da Banca Redefinir a transação Transações longas Usuário definir o tamanho da transação checkout do versionamento Definição atual de transação interfere na propagação intraprocesso Autor: Ciferri, C. D. A para Ciferri, Cristina Dutra Aguiar Propagar para as demais instâncias Uma transação para cada operação de edição Transações diante de conflitos

26/04/2013 ICMC-USP 41/46 Transações para Propagação Intraprocesso begin transaction copia2 operacao cp Objeto=Artigo[Título= MultiPrInt: Multiuser...] Autor[Nome= Ciferri, C. D. A] Origem= Ana Destino= Bruno Atributo= nome valororigem= Ciferri, C. D. A valordestino= Ciferri, Cristina Dutra Aguiar operacao ed Objeto=Artigo[Título= X] Autor[Nome= Ciferri, C. D. A] Origem=null Destino=Bruno Atributo=nome valororigem= Ciferri, C. D. A valordestino= Ciferri, Cristina Dutra Aguiar operacao ed Objeto=Artigo[Título= Y] Autor[Nome= Ciferri, C. D. A] Origem=null Destino=Bruno Atributo=nome valororigem= Ciferri, C. D. A valordestino= Ciferri, Cristina Dutra Aguiar end transaction copia2 begin transaction edicao2 operacao ed Objeto=Artigo[Título= MultiPrInt: Multiuser...] Autor[Nome= Ciferri, C. D. A] Origem= null Destino= Bruno Atributo= nome valororigem= Ciferri, C. D. A valordestino= Ciferri, Cristina Dutra Aguiar operacao ed Objeto=Artigo[Título= X] Autor[Nome= Ciferri, C. D. A] Origem=null Destino=Bruno Atributo=nome valororigem= Ciferri, C. D. A valordestino= Ciferri, Cristina Dutra Aguiar operacao ed Objeto=Artigo[Título= Y] Autor[Nome= Ciferri, C. D. A] Origem=null Destino=Bruno Atributo=nome valororigem= Ciferri, C. D. A valordestino= Ciferri, Cristina Dutra Aguiar end transaction copia2

26/04/2013 ICMC-USP 42/46 Transação Definição (transação) Uma transação é uma sequência completa de operações de modificação nas fontes locais, induzidas por uma única ação do usuário, ou seja, uma ação de inserção, remoção, cópia ou edição

26/04/2013 ICMC-USP 43/46 Sugestões da Banca Bloqueio do repositório centralizado Criação de um índice Resolução de conflitos Consenso quanto à transação escolhida para reaplicação algoritmos baseados em consenso Reputação Votação análise dos valores de todas as transações Heurística suposição de validade

26/04/2013 ICMC-USP 44/46 Próximos Passos Repositório centralizado Remover transações conflitantes Usar timestamp Selecionar transação como maior timestamp, remover as demais transações conflitantes Selecionar transação como maior timestamp, tratar as demais transações conflitantes Confiança resolver conflitos Repositórios distribuídos

26/04/2013 ICMC-USP 45/46 Referências [Tomazela et al. 2013] Tomazela, B., Hara, C. S., Ciferri, R. R., Ciferri, C. D. A. (2013). Empowering Integration Processes with Data Provenance. Data & Knowledge Engineering. Aceito para publicação.

MultiPrInt: um modelo de procedência para integração de dados com suporte para um multiusuário Disciplina: Procedência de Dados e Data Warehousing Aluna: Dayse Silveira de Almeida Professora: Cristina D. A. Ciferri Obrigada.