Universidade Federal de Pernambuco Centro de Informática Pós-Graduação em Ciência da Computação

Tamanho: px
Começar a partir da página:

Download "Universidade Federal de Pernambuco Centro de Informática Pós-Graduação em Ciência da Computação"

Transcrição

1 Universidade Federal de Pernambuco Centro de Informática Pós-Graduação em Ciência da Computação Por Damires Yluska de Souza Fernandes Exame de Qualificação e Proposta de Tese Profa. Dra. Ana Carolina Salgado Orientadora Recife, Março de 2007

2 Fernando Pessoa. ii

3 Resumo O gerenciamento de dados em ambientes Ponto-a-Ponto (P2P) representa uma tarefa complexa e desafiante devido ao número excessivo de pontos, sua natureza autônoma e à heterogeneidade de seus esquemas. Um PDMS (Peer Data Management System) é um sistema P2P que provê usuários com uma interface onde consultas são formuladas transparentemente sobre fontes de dados heterogêneas e autônomas, sendo considerados, diante disso, uma evolução dos sistemas de integração de dados. O sistema SPEED (Semantic PEEr-to-Peer Data Management System) base sobre a qual será desenvolvido este trabalho, é um PDMS baseado em semântica que adota uma arquitetura de super-pontos. Nesta arquitetura, pontos de dados (associados a fontes de dados) são agrupados de acordo com seu domínio em clusters semânticos. Cada cluster semântico possui um tipo especial de ponto (ponto de integração) que é responsável por tarefas mais complexas como processamento de consultas. Clusters semânticos são agrupados em comunidades semânticas, onde um ponto semântico atua como gerenciador da comunidade, oferecendo uma ontologia de domínio e organizando serviços. Um dos principais serviços que um PDMS pode prover é o processamento de consultas. No SPEED, pontos de integração são responsáveis por processar consultas. Neste sentido, quando um ponto de integração recebe uma consulta, ele identifica os termos da consulta e os compara com os termos ontológicos da ontologia de domínio do cluster; daí, a partir de mapeamentos semânticos e de um índice de consultas, ele identifica os pontos que podem respondê-la. Em seguida, reformula a consulta de acordo com os mapeamentos, reenvia para cada um dos pontos, recebe os resultados e os integra. Ao término, envia o resultado final para o ponto que iniciou a consulta. O ponto crítico do processamento, no entanto, é a reformulação da consulta entre pontos através de caminhos de mapeamentos semânticos disponíveis. Dentro deste escopo, o presente trabalho visa desenvolver um processo de reformulação de consulta baseado em semântica para o sistema SPEED. Para desenvolver este processo, duas questões chaves serão tratadas: a definição e utilização de mapeamentos semânticos e o emprego de fatores semânticos. Para a primeira questão, este trabalho irá formalizar uma Linguagem de Mapeamentos Semânticos (LMS) que será utilizada para definição dos mapeamentos e sua aplicação. A segunda questão, por sua vez, está associada a um importante diferencial deste trabalho que é a utilização de aspectos semânticos. Ou seja, metadados, ontologias e contexto (informação circunstancial que torna uma situação única e compreensível) serão utilizados como meio de enriquecer e otimizar todo o processo de reformulação de consulta. iii

4 Abstract Data management in P2P systems is a challenging and difficult problem considering the excessive number of peers, their autonomous nature and the heterogeneity of their schemas. A Peer Data Management System (PDMS) is a P2P application which enables users to transparently query several heterogeneous and autonomous data sources. In this sense, PDMS are considered an evolution of Data Integration Systems. Semantic PEEr-to-Peer Data Management System SPEED, our current research system, is a semantic-based PDMS which adopts the super-peer architecture. In this architecture, data peers (associated to data sources) are grouped according to their domain forming one or more semantic clusters. Every semantic cluster has a special type of peer, called integration peer, which is responsible for complex processes like query processing. Semantic clusters are also grouped in semantic communities where a semantic peer acts as a manager. Semantic peers are intended to offer a domain ontology and special services. Query processing is considered one of the most important services provided in a PDMS. In SPEED system, integration peers are responsible for query processing. So, when a query arrives at the integration peer, it identifies for each query element its corresponding ontological term, according to the cluster domain ontology. Then, the integration peer searches the query index and looks at semantic mappings to find out peers which are able to answer the query. Next, it reformulates the query into a set of queries which will be sent to the peers. The query reformulation is done according to semantic mappings. Finally, answers from every peer are returned to the integration peer, where they are integrated to produce the answer. The final result is sent back to the data peer from which the query was submitted. However, the key step in query processing is reformulating a peer's query over other peers on the available semantic mapping paths. In this sense, this work aims to develop a semantic-based query reformulation process for SPEED system. In order to develop this process, two relevant issues will be dealt: semantic mapping definition and semantic knowledge employment. To the former, we will formalize a semantic mapping language which will be used to define mappings and their usage. A distinguishing of our work is the usage of semantic aspects. In this light, we use context information, i.e. the circumstantial information that makes a situation unique and comprehensible, as well as ontologies and metadata, as a way to enrich the query reformulation process. iv

5 Sumário Capítulo 1 Introdução Motivação Definição do Problema Objetivos Estrutura do Documento Capítulo 2 A Problemática da Integração de Dados A Evolução dos Bancos de Dados e a Era da Informação Sistemas de Integração de Dados Definição Abordagens para Integração de Dados Arquitetura de Mediadores Arquitetura de Data Warehouse Um Framework Formal para Integração de Dados Estudo de Caso: O Sistema Integra Ambiente Comum Ambiente de Geração e Manutenção do Mediador Ambiente de Integração de Dados Ambiente do Usuário Problemas e Desafios na Integração de Dados Sistemas P2P e PDMS Considerações Capítulo 3 Enriquecimento Semântico dos Sistemas de Integração de Dados Metadados XML e Padrões de Metadados Tipos de Metadados Ontologias Tipos de Ontologias Construção de Ontologias v

6 3.2.3 Representação de Ontologias O Uso de Ontologias na Integração de Dados Interoperabilidade de Ontologias Contexto Sistemas Sensíveis ao Contexto Técnicas para Representação de Contexto Contexto na Integração de Dados Contexto na Identificação de Mapeamentos entre Esquemas Contexto no Processamento de Consultas Contexto na Resolução de Conflitos Um Exemplo de Aplicação - COntext INterchange Project (COIN) Vantagens Considerações Capítulo 4 Sistemas P2P e os Gerenciadores de Dados Sistemas P2P Arquiteturas Roteamento PDMS PeerDB Piazza Rosa P2P XPeer Helios/H Humboldt Discoverer Quadro Comparativo Outros Sistemas Considerações Capítulo 5 Processamento de Consultas em PDMS Introdução Processamento de Consultas Processamento de Consultas em Modelo Centralizado vi

7 5.2.2 Processamento de Consultas em Modelo Distribuído Processamento de Consultas em Sistemas P2P Processamento de Consultas em PDMS Reformulação da Consulta Mapeamentos Semânticos Conceitos Fundamentais Formalizando Mapeamentos Global-as-View (GAV) Local-as-View (LAV) GAV x LAV Outras Estratégias Considerações sobre Reformulação de Consulta e Mapeamentos Considerações Capítulo 6 Proposta de Tese O Sistema SPEED A Arquitetura do SPEED Principais Componentes Funcionais Aspectos Essenciais no SPEED Enriquecimento Semântico no SPEED Metadados no SPEED Ontologias no SPEED Contexto no SPEED A Ontologia de Contexto do SPEED Definição dos Mapeamentos Reformulação de Consultas no SPEED Descrição Geral do Processo Um Exemplo Contribuições Metodologia Cronograma Referências Anexo A vii

8 Lista de Figuras Fig. 2.1 Arquitetura de Mediadores Fig. 2.2 Arquitetura de Datawarehouse Fig. 2.3 Arquitetura do Sistema Integra Fig. 3.1 Registro Dublin Core Expresso em XML-RDF Fig. 3.2 Aplicações de Ontologia Fig. 3.3 Arquiteturas de Integração que Utilizam Ontologias Fig 3.4 Estratégias de Interoperabilidade de Ontologias Fig 3.5 Aplicação Tradicional Fig. 3.6 Aplicação Sensível ao Contexto Fig. 3.7 Técnicas de Representação de Contexto Fig. 3.8 Sistema COIN Fig. 4.1 Um Ambiente P2P Fig. 4.2 Classificação dos Sistemas Computacionais Fig. 4.3 Categorias de Arquiteturas Fig. 4.4 Arquitetura do PeerDB Fig. 4.5 Exemplo de Tabela Fig. 4.6 Mapeamentos no Piazza Fig. 4.7 Arquitetura Interna do Sistema Rosa-P2P Fig. 4.8 Clusters na Arquitetura do XPeer Fig. 4.9 ixpeer: extensão ao XPeer utilizando primitives do AutoMed Fig Arquitetura de Referência de um Ponto H Fig Arquitetura Estendida do Humboldt Discoverer Fig Projeto da Rede P2P com o índice Humboldt Discoverer Fig Processamento de Consultas usando o Humboldt Discoverer Fig. 5.1 Processamento de Consultas em um PDMS Genérico Fig. 5.2 Passos Típicos durante a execução de uma consulta em um SGBD Fig. 5.3 Processamento de Consultas em Sistema baseado em Mediador Fig. 5.4 Processamento de Consulta em PDMS com Super-Ponto viii

9 Fig. 6.1 Arquitetura Geral do Sistema SPEED Fig. 6.2 Componentes Funcionais dos Pontos Fig. 6.3 Esquemas Exportados em Notação Ontológica Fig. 6.4 Ontologia de Referência no Nível da Comunidade Semântica Fig. 6.5 Ontologia de Referência no Nível do Cluster (ORC) Fig. 6.6 Taxonomia de Informações Contextuais no SPEED Fig. 6.7 Ontologia de Contexto do SPEED Fig. 6.8 Uma Visão Parcial de Entity, Peer, Meaning e suas Instâncias Fig. 6.9 Visão Parcial de Peer, Entity e Meaning acrescentando slots e valores correntes Fig Visão Parcial de P2PQuery com a Reformulação de Q11 para Q Fig Meta-ontologia de Mapeamentos Fig Processo de Execução de Consulta no SPEED Fig Ontologia de Referência do Cluster Fig Ontologias dos Pontos P1 e P Fig. A.1 Ontologia de Contexto para Integração de Dados Geográficos ix

10 Lista de Quadros Quadro 2.1: Abordagem Materializada x Virtual Quadro 3.1: Elementos do Padrão Dublin Core Quadro 3.2: Exemplos de Arquiteturas de Integração com Ontologias Quadro 3.3: Resumo das Técnicas de Representação de Contexto Quadro 4.1: Comparação entre Sistemas Distribuídos, de Integração e PDMS Quadro 4.2: Requisitos de PDMS Quadro Comparativo 4.3: Características dos PDMS... 69/70 Quadro 6.1: Exemplos de Mapeamentos Quadro 6.2: Cronograma de Atividades x

11 Capítulo 1 Introdução Neste capítulo, introduzimos o contexto onde está inserida esta monografia de qualificação e proposta de tese. Para tal, apresentamos a motivação para este trabalho, definimos o problema, seus objetivos e a organização do documento. 1.1 Motivação A sociedade da informação, que vem crescendo continuamente ao longo dos últimos anos, busca um completo acesso a todo tipo de informação disponível, esteja ela em um banco de dados local, distribuída em fontes diversas ou compartilhada através de projetos interinstitucionais. Entretanto, muito mais do que acessar tal informação, é desejável realizar consultas e análises sobre elas sem a preocupação em como localiza-las e combiná-las. Neste sentido, usuários desejam se beneficiar de tecnologias que promovam o acesso a dados distribuídos, a partir de fontes heterogêneas ou não, onde serviços inter-relacionados permitam um nível de abstração total sobre como eles estão sendo gerenciados. Ao mesmo tempo, usuários podem ser beneficiados se sistemas levarem em consideração a semântica onde eles e seus objetivos estão envolvidos. Tendo em vista esta necessidade, soluções vêm sendo pesquisadas com o intuito de prover usuários com mais facilidades de consulta, no nível de abstração desejado e com foco semântico. Duas soluções recentes merecem destaque: sistemas de integração de dados e PDMS (Peer Data Management Systems). Sistemas de Integração de Dados têm como principal objetivo liberar o usuário de ter que, manualmente, localizar fontes, interagir com elas isoladamente e depois combinar os resultados obtidos. Um aspecto fundamental em sistemas desta categoria é que eles devem ser capazes de unir todos os esquemas das fontes associadas, de modo a criar uma visão única que será o elo de comunicação com o usuário. Esta visão única é chamada de esquema de mediação ou esquema global e é através dela que o usuário formula suas consultas. PDMS são considerados uma extensão natural dos sistemas de integração de dados [Heese et al. 2005], que, por sua vez, já são uma extensão dos sistemas distribuídos de bancos de dados. A grande diferença, entretanto, é que PDMS não utilizam um esquema global, pois são, na verdade, sistemas de gerenciamento de dados construídos sobre redes Peer-to-Peer (P2P). Isto significa que eles são construídos sobre ambientes de computação distribuída sem controle centralizado onde o software que é executado em cada ponto (peer) é equivalente em 1

12 funcionalidade e tanto atua como cliente quanto servidor. Como não usam esquema global, PDMS normalmente adotam estratégias baseadas em índices de roteamento, metadados e mapeamentos entre pontos para conseguir executar as consultas. Para que um ponto possa participar de um PDMS, ele deve publicar seu esquema de dados de modo que este possa ser visto pelos demais pontos da rede e, em contrapartida, o sistema deve prover mapeamentos deste ponto com outros. Através de mapeamentos ou da composição de mapeamentos, o sistema pode obter dados relevantes de qualquer ponto que esteja conectado [Tatarinov, Halevy 2004]. Como típicos sistemas P2P, PDMS herdam todas as suas características, dentre elas o fato de cada ponto poder entrar e sair da rede a qualquer momento e a autonomia que cada um tem. Do ponto de vista de gerenciamento de dados, PDMS devem lidar com questões como [Sung et al. 2005]: Localização dos Dados: pontos devem ser capazes de referenciar e localizar dados armazenados em outros pontos. Processamento de Consultas: dada uma consulta, o sistema deve ser capaz de descobrir os pontos que podem contribuir com dados relevantes à execução da consulta e processá-la eficientemente. Integração dos Dados: mesmo quando fontes de dados compartilhadas no sistema seguem diferentes esquemas ou representações, o sistema deve ainda ser capaz de acessar os dados, integrá-los e retornar os resultados. Consistência dos Dados: a consistência deve ser mantida em caso de replicação e uso de cache. A título de ilustração, vamos supor que cientistas de várias instituições de pesquisa desejem compartilhar dados sobre Bacias Hidrográficas. De acordo com as propriedades de flexibilidade e descentralização, um PDMS é adequado ao compartilhamento e troca de dados de diversos domínios como, por exemplo, o projeto sobre Bacias Hidrográficas. Para participar do PDMS, cada instituição deve disponibilizar o conjunto de dados local que será compartilhado com os demais pontos o esquema exportado. Depois de exportar seu esquema, os cientistas da instituição podem utilizar o PDMS para realizar suas consultas. Mas, por que um cientista teria interesse em utilizar um PDMS? Em linhas gerais, ele tem um objetivo fundamental: obter respostas às suas consultas, de forma transparente e rápida. Ao mesmo tempo, ele busca um sistema com fontes diversas, espalhadas e autônomas porque o que ele obtém utilizando apenas sua fonte local pode não ser suficiente. Em outras palavras, ele busca respostas mais completas e significativas para o que ele necessita naquele momento. Ele pode também desejar responder questões muito complexas, que envolvam critérios e condições diferentes e que, para isso, seja necessária a combinação de dados de várias fontes. Assim, no exemplo de Bacias Hidrográficas, cada instituição possui e gerencia dados sobre suas bacias, mas no momento em que compartilham esses dados, todos os envolvidos no sistema tendem a obter respostas mais completas e relevantes para suas pesquisas, sem intervir na autonomia de cada um. 2

13 Tanto sistemas de integração de dados quanto PDMS são soluções que envolvem a problemática da integração de dados, questão diretamente relacionada aos fatores de heterogeneidade, distribuição e autonomia das fontes de dados. Halevy e seu grupo realizaram uma retrospectiva sobre os dez anos de pesquisa na área de integração de dados, desde o projeto Manifold [Levy et al. 1996] até a busca por arquiteturas P2P [Halevy et al. 2006]. Nesta retrospectiva, eles apontam direções de pesquisa consideradas fundamentais para a solução de problemas de integração: geração de mapeamentos entre esquemas, processamento de consultas adaptativo, utilização de XML como padrão de representação de dados, formalização de álgebras para especificação de mapeamentos e manipulação de esquemas, utilização da Inteligência Artificial como meio de obter raciocínio e utilização de ambientes P2P. Este trabalho está inserido dentro destas perspectivas de pesquisa. Ele busca desenvolver soluções para o problema da reformulação de consulta em PDMS, utilizando semântica como forma de enriquecer todo o processo e consequentemente otimizá-lo. O processo de reformulação de uma consulta pode ser dividido em duas etapas: a reescrita da consulta que gera uma expressão de consulta e a resolução da consulta cujo resultado é o conjunto de todas as respostas possíveis para aquela expressão de consulta [Halevy 2000]. Para viabilizar as duas etapas, é necessário fazer uso de mapeamentos semânticos entre os esquemas que estão sendo empregados na reformulação. Os mapeamentos semânticos descrevem relacionamentos entre os termos usados em dois ou mais esquemas. Isto significa que soluções para o problema de reformulação de consulta devem incluir linguagens para especificação de mapeamentos e algoritmos que usem estes mapeamentos para resolver ou responder adequadamente as consultas. Desse modo, a reformulação de consultas está diretamente relacionada ao problema de definição e utilização de mapeamentos. Muita pesquisa vem sendo realizada sobre este tema [Friedman et al. 1999; Halevy 2001; Lenzerini 2002; Madhavan, Halevy 2003; Tatarinov, Halevy 2004; Karvounarakis 2005; McBrien, Poulovassilis 2006], mas pouco se tem realizado no sentido de aplicar semântica neste processo. O uso de conhecimento semântico em suas várias formas, incluindo meta-modelos, regras semânticas e restrições de integridade, pode otimizar as capacidades de transformação de consultas em outras semanticamente equivalentes que possam ser respondidas em menos tempo e/ou com menos recursos [Necib, Freytag 2005]. Este trabalho parte da premissa que o uso de semântica através de metadados, ontologias e contexto pode ser empregado satisfatoriamente como forma de otimizar todo o processo de reformulação de consultas. Metadados são utilizados para descrever os conteúdos das fontes de dados (em pontos) e podem também ser utilizados para descrever resultados parciais de consultas. Ontologias são utilizadas normalmente como um vocabulário compartilhado de termos, podendo ser empregadas para: (i) descrever os metadados das fontes ligadas aos pontos de dados, como meio de uniformização de representação; (ii) servir de referência de termos, na forma de ontologias de domínio, ajudando a resolver problemas de heterogeneidade semântica e (iii) representar informações contextuais, enquanto técnica de formalização. 3

14 Em especial, um diferencial deste trabalho em relação a outros é a utilização de contexto através de conceitos, regras, proposições e/ou suposições associados a uma situação específica como, por exemplo, uma entidade, uma consulta ou um ponto de dados. Neste sentido, o contexto ajuda a definir qual conhecimento deve ser utilizado, quais restrições devem ser consideradas nas diversas operações de manipulação, como na reformulação de consulta, quais as condições que irão ativar as ações e em que momento estas ações devem ser executadas. No caso da reformulação da consulta, informações contextuais percebidas e/ou inferidas sobre o ambiente (altamente dinâmico), a submissão da consulta, o perfil do usuário, os pontos, os mapeamentos semânticos, os dados e entidades envolvidas e outras serão utilizadas para otimizar todo o processo de reformulação. Como resultado, espera-se evitar redundâncias na composição de caminhos de mapeamentos e reformulações que impliquem em resultados vazios, através da pré-computação de caminhos de mapeamentos [Tatarinov, Halevy 2004]. Além disso, resultados de consultas se tornarão mais significativos e completos para o usuário. 1.2 Definição do Problema Como visto na seção anterior, um PDMS é um sistema de gerenciamento de dados que faz uso de uma arquitetura P2P. Seu objetivo principal é permitir a troca de dados, compartilhamento de informações e o processamento de consultas, sendo este último reconhecido como o principal serviço que um PDMS pode prover [Arenas et al. 2003]. Neste sentido, processar uma consulta em um sistema como esse significa prover capacidades de responder às consultas sobre uma rede arbitrária de pontos com esquemas locais e compartilhados e um conjunto de mapeamentos entre estes pontos. O processamento de consultas em um PDMS envolve basicamente as seguintes etapas: submissão da consulta, análise da consulta, identificação dos pontos capazes de respondê-la, reformulação de acordo com mapeamentos, execução, integração e apresentação dos resultados. Dentro deste escopo, este trabalho apresenta um processo geral que envolve tais etapas, mas focaliza nos aspectos relacionados à reformulação da consulta através dos mapeamentos e de forma enriquecida semanticamente. Assim, podemos definir o problema como segue: Dado um PDMS, uma consulta é submetida em um ponto de dados e deve ser propagada por todos os demais pontos da rede que tenham dados para contribuir com a resposta. Mapeamentos entre pontos estão definidos e a semântica da consulta deve ser comum aos pontos que irão respondê-la. Então o problema se encontra em reformular a consulta através dos mapeamentos por todos os pontos com semântica comum à identificada na consulta. A reformulação da consulta vai ser dividida em duas etapas: a reescrita da consulta que gera uma expressão de consulta () e a resolução da consulta cujo resultado é o conjunto de todas as respostas possíveis para aquela expressão de consulta. Estes resultados serão retornados ao ponto onde foi submetida a consulta e sua integração será realizada. 4

15 O diferencial deste trabalho está em realizar todo este processo, considerando fatores semânticos, principalmente contexto, em cada etapa a ser cumprida. 1.3 Objetivos Este trabalho visa desenvolver um processo de reformulação de consulta baseada em semântica para PDMS. Para tal, pretende: Estabelecer um formalismo para definição dos mapeamentos semânticos. Estabelecer técnicas para extrair a semântica dos mapeamentos. Construir um índice semântico de consultas, a partir de ontologias. Desenvolver uma ontologia de contexto como forma de representação e utilização deste tipo de informação. Aplicar contexto em todas as fases do processo de reformulação. Modelar e desenvolver o processo de reformulação de consultas para o sistema SPEED (Semantic PEEr-to-Peer Data Management System), base de desenvolvimento deste trabalho. Validar o processo de reformulação de consultas, através de estudos de casos. 1.4 Estrutura do Documento Esta monografia está organizada em duas partes - a qualificação e a proposta de tese, divididas em seis capítulos, sendo o capítulo seis especificamente dedicado à referida proposta. Desta maneira a monografia encontra-se organizada como segue: O capítulo dois discute a problemática da integração de dados, através de conceitos fundamentais, problemas e desafios a serem trilhados. O capítulo três aborda aspectos semânticos que podem contribuir para a otimização de processos de integração de dados, em especial o processamento de consultas. Os aspectos semânticos introduzidos são metadados, ontologias e contexto. O capítulo quatro descreve os sistemas P2P e PDMS, mostrando suas características, topologias e conceitos básicos, além de analisar sistemas reais que vêm sendo pesquisados. O capítulo cinco expõe o panorama do processamento de consultas em PDMS e, em especial, a problemática da reformulação de consulta e da sua relação com a definição de mapeamentos. Finalmente, o capítulo seis apresenta a proposta de tese que norteia este trabalho. Para tal, introduz o sistema SPEED base sobre o qual será desenvolvido este trabalho, traça metas relacionadas às possíveis soluções do problema (reformulação da consulta com base em aspectos semânticos), mostra as contribuições esperadas, a metodologia a ser empregada e o cronograma de trabalho. 5

16 Capítulo 2 A Problemática da Integração de Dados A competitividade nos ambientes de negócios depende da qualidade do acesso às informações de que as empresas necessitam no dia-a-dia. Estas informações se encontram atualmente distribuídas pelas intranets das empresas e pela Internet, através de múltiplas fontes de dados que podem estar em diferentes formatos: sistemas legados, bancos de dados relacionais, bancos de dados objeto-relacionais, sistemas de arquivos, XML, páginas Web, planilhas eletrônicas, entre outros. Combinar todas estas informações não representa uma tarefa fácil, o que dificulta atividades de consulta a um domínio específico e impede que ações sejam tomadas em tempo hábil. Entretanto, de que forma é possível obter acesso a estas informações sem intervir na autonomia dos sistemas que os mantêm? A busca pela interoperabilidade compartilhamento e troca de informações - fez nascer a busca pela integração dos dados, ou seja, viabilizar a consulta a dados pertencentes a fontes heterogêneas, distribuídas e autônomas, através de uma visão integrada e única. Um sistema de integração de dados visa oferecer aos usuários uma interface uniforme de acesso a diferentes fontes de dados, de modo que os usuários possam definir o que eles desejam obter nas suas consultas, e o sistema determine onde as informações podem ser encontradas, realize a integração das mesmas e apresente o resultado desejado. Com base neste contexto, este capítulo descreve a problemática da integração de dados, conceitua sistemas de integração de dados, mostra abordagens para sua construção, assim como um exemplo de sistema. Ao término, problemas e desafios são apontados com o intuito de fornecer o panorama de pesquisa na qual este trabalho está inserido. 2.1 A Evolução dos Bancos de Dados e a Era da Informação Os bancos de dados surgiram aproximadamente em meados dos anos 60 com o objetivo de possibilitar o gerenciamento de grandes quantidades de dados, assim como de estruturar esses dados e prover rotinas padronizadas de acesso aos mesmos. O grande avanço da computação, a difusão das redes e a diversidade das aplicações que necessitam de persistência de dados propiciaram a evolução das tecnologias e arquiteturas de bancos de dados. Distribuição e heterogeneidade vêm se tornando premissas básicas para organizar a infra-estrutura dos sistemas computacionais recentes. 6

17 Como resultado, surgiram os bancos de dados distribuídos e, com eles, tipos diversos de SGBD e soluções de distribuição. Os SGBD distribuídos são considerados homogêneos quando utilizam o mesmo software em múltiplos sítios, caso contrário, são considerados heterogêneos [Navathe, Elmasri 2005]. A heterogeneidade pode acontecer quando as informações se encontram armazenadas em formatos diferentes (banco de dados relacional, banco de dados orientado a objetos, HTML, XML, etc), plataformas diferentes ou quando se apresentam diferenças estruturais e/ou semânticas entre as fontes das mesmas. Alternativas para lidar com bancos de dados distribuídos e heterogêneos incluem organizá-los em federações, construir data warehouses ou ainda criar sistemas com múltiplos bancos de dados acoplados. Quando cada SGBD é um SGBD independente e autônomo que tem seus próprios usuários locais, transações locais e DBA (Database Administrator), formase uma federação de bancos de dados. Neste tipo de organização, os participantes de uma federação compartilham seus objetos sem perder o controle sobre os mesmos. Um sistema de banco de dados federado provê um esquema global da federação que é compartilhado por todas as aplicações envolvidas. Por outro lado, considera-se um sistema de múltiplos bancos de dados (Multidatabase System) aquele que não possui um esquema global, mas o constrói interativamente conforme a necessidade da aplicação [Navathe, Elmasri 2005]. A sociedade da informação, que vem crescendo ao longo dos últimos anos, busca um completo acesso a todo tipo de informação disponível, esteja ela em um banco de dados local, distribuída em sítios diversos, armazenada em formato relacional ou em XML ou ainda em sistemas de arquivos diversos. Halevy et al. [Halevy et al. 2005] identificam ambientes deste tipo como um DataSpace (DataSpace Support Platforms DSSP) ou espaço de dados, uma nova abstração para gerenciamento de dados onde serviços inter-relacionados gerenciam grandes volumes de dados relacionados, mas distribuídos, de forma consistente e eficiente. DSSP não constituem uma abordagem de integração de dados, mas de coexistência de dados [Halevy et al. 2005]. O objetivo de um DataSpace é prover a funcionalidade básica sobre todas as fontes de dados, independentemente de como elas estão integradas. Por exemplo, um DSSP pode prover uma busca por palavra-chave ou realizar operações mais sofisticadas como consultas SQL-like, mineração de dados, entre outras. Um DSSP deve estar habilitado a: Lidar com dados e aplicações numa grande variedade de formatos através de diferentes interfaces; Evitar controle completo sobre seus dados (diferentemente de um SGBD); Permitir a realização de consultas em diferentes níveis, retornando o melhor resultado possível (best-effort) ou respostas aproximadas. Isto significa que, quando determinadas fontes se encontrarem indisponíveis, o sistema deve ser capaz de produzir os melhores resultados, utilizando os dados disponíveis naquele momento; Oferecer ferramentas para prover integração dos dados, quando necessário. Ao analisarmos o ambiente Web, tão propício a consultas e buscas, podemos considerá-lo como um exemplo de DataSpace, visto que ele reflete um universo 7

18 heterogêneo, diversificado e altamente procurado por usuários para suas buscas. Ao mesmo tempo em que promove a usabilidade e favorece as buscas e pesquisas, a Web se torna um ambiente desafiador porque amplia consideravelmente a dificuldade de realizar consultas sobre um determinado domínio ou cruzar informações sobre diversas fontes de dados. Tendo em vista tais dificuldades, soluções vêm sendo pesquisadas com o intuito de prover usuários com mais facilidades de consulta, ao mesmo tempo em que eles tenham visões simplificadas dos dados que se encontram, na verdade, localizados em fontes distribuídas, heterogêneas e autônomas. Duas soluções recentes merecem destaque: sistemas de integração de dados e PDMS (Peer Data Management Systems). Sistemas de Integração de Dados têm como principal objetivo liberar o usuário de ter que, manualmente, localizar fontes, interagir com elas isoladamente e depois combinar os resultados obtidos. Um aspecto fundamental em sistemas desta categoria é que eles devem ser capazes de unir todos os esquemas das fontes associadas, de modo a criar uma visão única que será o elo de comunicação com o usuário. Esta visão única é chamada de esquema de mediação ou esquema global. A manutenção de um esquema único pode se tornar um aspecto limitante se usuários desejam compartilhar dados sem qualquer autoridade central. Peer Data Management Systems (PDMS) têm sido propostos como uma alternativa de arquitetura para compartilhamento de dados descentralizados [Tatarinov, Halevy 2004]. Um PDMS é composto por um conjunto de pontos (peers), cada um com um esquema associado que representa seu domínio de interesse. Geralmente mapeamentos são providos entre pares ou um pequeno número de pontos que compartilham interesses comuns. Assim, quando um usuário formula uma consulta, o sistema pode obter dados relevantes de qualquer ponto conectado através destes mapeamentos. Ambas as soluções envolvem a problemática da integração de dados. Usuários buscam compartilhar dados, realizar consultas num grau de abstração, onde o acesso às fontes e a integração dos resultados sejam efetuados da maneira mais transparente possível. Isso tudo aliado a um bom desempenho e a resultados mais completos. Estas premissas têm direcionado pesquisas em torno de sistemas de integração de dados em arquiteturas convencionais (com um esquema único) ou em ambientes Peer-to-Peer (P2P). Em resumo, desde o surgimento dos bancos de dados, o problema de integração de dados tem sido reconhecido como amplo e de grande importância. Como conseqüência, a comunidade de Banco de Dados vem dedicando especial interesse e pesquisa nessa área com o objetivo de prover soluções de integração adequadas. Exemplos de sistemas convencionais de integração são o TSIMMIS [Chawathe et al. 1994], Integra [Lóscio 2003]. Exemplos de PDMS que vêm sendo desenvolvidos são PeerDB [Ng et al. 2003], Piazza [Kadiyska et al. 2003] e XPeer [Bellahsène et al. 2004]. 2.2 Sistemas de Integração de Dados O bem mais precioso de uma empresa é a informação que ela gerencia, entretanto a tarefa de prover acesso a informações combinadas e integradas não tem sido fácil. Ao mesmo tempo 8

19 em que cresce a importância da informação nas organizações, sejam elas públicas ou privadas, ocorre a crescente disseminação da mesma nas intranets e na Internet. Ou seja, as informações permanecem distribuídas em fontes diversas e autônomas. Neste cenário, como é possível obter acesso aos milhares de dados espalhados na Internet e nas intranets, sem intervir na autonomia dos sistemas que os mantêm? A busca pela interoperabilidade compartilhamento e troca de informações - fez nascer a busca pela integração dos dados. Um dos objetivos da integração num ambiente informacional é buscar o aumento do valor da informação no momento em que dados de várias fontes são acessados, relacionados e combinados [Almeida, Bax 2003]. A busca por soluções para integração de dados vem sendo pesquisada desde o início dos anos 90 e já é hoje uma realidade não somente no meio acadêmico, mas também no meio comercial [Halevy et al. 2006]. Nesta seção, apresentamos o conceito de sistemas de integração de dados, as abordagens existentes para o seu desenvolvimento e um exemplo de sistema Definição A principal tarefa de um sistema de integração de dados é fornecer uma interface uniforme para responder consultas que normalmente requerem extração e combinação de dados originários de diversas fontes distintas, heterogêneas, distribuídas e autônomas [Levy99]. Exemplos de aplicações cuja integração de dados se faz necessária são sistemas legados, projetos científicos como aqueles oriundos de pesquisas biológicas e astronomia, sistemas de informações geográficas, comércio eletrônico, entre outras. Sistemas de integração de dados vêm se tornando populares por serem capazes de, além de integrarem informações de fontes diversas, responderem consultas mais complexas ou fornecerem uma resposta mais completa, de acordo com as fontes relevantes disponíveis. Outro aspecto importante é que, apesar das bases serem distribuídas e heterogêneas, o usuário tem a impressão de estar utilizando um sistema centralizado e homogêneo, visto que a forma como a informação está sendo recuperada se torna transparente para ele. Ambientes como a World Wide Web, dinâmicos e evolutivos, requerem sistemas de integração que permitam esse acesso da forma mais simples e transparente possível. Entretanto, nesse meio, alguns desafios como a pouca representação de metadados, as mudanças constantes nas fontes (evolução e autonomia), a diferença entre formatos de dados, alguns semi-estruturados ou não estruturados e a heterogeneidade das plataformas são fatores críticos que devem ser considerados [Batista 2003]. A problemática da integração de dados está diretamente relacionada com as questões de heterogeneidade. De maneira mais ampla, a heterogeneidade ocorre em dois níveis: sintático e semântico. O nível sintático se refere ao esquema próprio de cada sistema para armazenamento e documentação de seus dados. O nível semântico, por sua vez, refere-se à representação conceitual ou o significado da informação, presente em cada sistema. De forma mais detalhada, a heterogeneidade das fontes pode ser encontrada em diversos níveis [Batista 2003]: 9

20 Modelo de dados fontes de dados podem apresentar modelos variados, como sistemas de arquivo, relacional, objeto-relacional, semi-estruturado; Esquema determina objetos, atributos, relacionamentos e restrições, podendo ser estruturado, pouco estruturado ou não estruturado; Codificação de Valores valores e itens de valores podem se encontrar formatados diferentemente, em cada fonte. Por exemplo, o valor de um produto pode estar em U$$ numa fonte e em R$ em outra; Linguagem de consulta dependendo da fonte, pode haver ou não uma linguagem de consulta nativa, por exemplo, SQL, OQL, xquery; Plataformas de hardware, de sistema operacional e de SGBD podem variar de uma fonte para outra; Percebe-se, no entanto, que além dos aspectos sintáticos ou estruturais, aspectos relacionados ao significado das informações têm sido considerados o grande gargalo das soluções de integração de dados existentes. Um entendimento da semântica dos conceitos e de seus relacionamentos pode ser a chave para um resultado de integração mais satisfatório. Além de considerar questões de heterogeneidade, o sistema de integração de dados deve gerenciar aspectos relativos à autonomia e distribuição das fontes de dados. A autonomia está relacionada ao fato de que as fontes geralmente operam de forma independente e, por conseguinte, podem modificar seus dados e esquemas a qualquer momento sem notificar o sistema de integração. A principal questão da distribuição das fontes de dados diz respeito aos desafios impostos pela localização dessas fontes em ambientes heterogêneos como são as intranets e a própria Internet Abordagens para Integração de Dados Três abordagens básicas têm sido utilizadas no desenvolvimento de sistemas de integração de dados: a abordagem virtual, a abordagem materializada e a híbrida que envolve a combinação das anteriores [Batista 2003]. Na abordagem virtual, as informações são extraídas diretamente das fontes no momento em que são solicitadas por intermédio de uma consulta. Isto significa que as informações se encontram sempre atualizadas (nas fontes). Por outro lado, caso as fontes estejam indisponíveis naquele momento, não será possível recuperar aquelas informações. Na abordagem materializada, as informações relevantes são previamente recuperadas, integradas e armazenadas através de um repositório central. Assim, quando uma consulta é formulada, ela é executada sobre os dados que se encontram neste repositório, não havendo recuperação direta das fontes. Isto implica muitas vezes em inconsistência entre o repositório e as fontes (que são autônomas e evoluem rapidamente), podendo gerar dados desatualizados. O Quadro 2.1 resume vantagens e desvantagens de ambas as abordagens. A escolha por uma ou outra vai depender da aplicação que irá utilizá-la. Vale salientar que, para aplicações complexas e de grande escala, a aplicação de recursos de ambas as abordagens pode ser necessária, o que implica em utilizar uma abordagem híbrida [Batista 2003, Costa 10

Integração de Dados na Web. Ana Carolina Salgado Bernadette Lóscio

Integração de Dados na Web. Ana Carolina Salgado Bernadette Lóscio Integração de Dados na Web Ana Carolina Salgado Bernadette Lóscio Conteúdo Introdução Integração de Informações Consultando a Web Introdução Motivação Web e BD Arquitetura na Web Introdução Evolução da

Leia mais

PEER DATA MANAGEMENT SYSTEM

PEER DATA MANAGEMENT SYSTEM PEER DATA MANAGEMENT SYSTEM INTRODUÇÃO, INFRA-ESTRUTURA E MAPEAMENTO DE ESQUEMAS AGENDA Data Management System Peer Data Management System P2P Infra-estrutura Funcionamento do PDMS Mapeamento de Esquemas

Leia mais

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados: MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação

Leia mais

Planejamento Estratégico de TI. Prof.: Fernando Ascani

Planejamento Estratégico de TI. Prof.: Fernando Ascani Planejamento Estratégico de TI Prof.: Fernando Ascani Data Warehouse - Conceitos Hoje em dia uma organização precisa utilizar toda informação disponível para criar e manter vantagem competitiva. Sai na

Leia mais

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd. Apresentação Este curso tem como objetivo, oferecer uma noção geral sobre a construção de sistemas de banco de dados. Para isto, é necessário estudar modelos para a construção de projetos lógicos de bancos

Leia mais

PROJETO DE REDES www.projetoderedes.com.br

PROJETO DE REDES www.projetoderedes.com.br PROJETO DE REDES www.projetoderedes.com.br Centro Universitário de Volta Redonda - UniFOA Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro

Leia mais

Roteiro 2 Conceitos Gerais

Roteiro 2 Conceitos Gerais Roteiro 2 Conceitos Gerais Objetivos: UC Projeto de Banco de Dados Explorar conceitos gerais de bancos de dados; o Arquitetura de bancos de dados: esquemas, categorias de modelos de dados, linguagens e

Leia mais

Arquitetura de SGBD. Prof. Antonio Almeida de Barros Junior

Arquitetura de SGBD. Prof. Antonio Almeida de Barros Junior Arquitetura de SGBD Prof. Antonio Almeida de Barros Junior Agenda Caracterização de SGBDs SGBDs Centralizados SGBDs Cliente-Servidor SGBDs Distribuídos Homogêneos Multi-SGBDs Heterogêneos SGBDs Paralelos

Leia mais

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido Arquitetura Roteiro Arquitetura Tipos de Arquitetura Centralizado Descentralizado Hibrido Questionário 2 Arquitetura Figura 1: Planta baixa de uma casa 3 Arquitetura Engenharia de Software A arquitetura

Leia mais

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. jef@ime.usp.br DCC-IME-USP

Banco de Dados. Introdução. João Eduardo Ferreira Osvaldo Kotaro Takai. jef@ime.usp.br DCC-IME-USP Banco de Dados Introdução João Eduardo Ferreira Osvaldo Kotaro Takai jef@ime.usp.br DCC-IME-USP Importância dos Bancos de Dados A competitividade das empresas depende de dados precisos e atualizados. Conforme

Leia mais

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING

BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Bancos de Dados Distribuídos Conceitos e Arquitetura Vantagens das Arquiteturas C/S (em relação

Leia mais

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo tiagodemelo@gmail.com. http://www.tiagodemelo.info

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo tiagodemelo@gmail.com. http://www.tiagodemelo.info Bancos de dados distribuídos Prof. Tiago Eugenio de Melo tiagodemelo@gmail.com Última atualização: 20.03.2013 Conceitos Banco de dados distribuídos pode ser entendido como uma coleção de múltiplos bds

Leia mais

Data Warehouse Processos e Arquitetura

Data Warehouse Processos e Arquitetura Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997)

Leia mais

Etapas da evolução rumo a tomada de decisão: Aplicações Isoladas: dados duplicados, dados inconsistentes, processos duplicados.

Etapas da evolução rumo a tomada de decisão: Aplicações Isoladas: dados duplicados, dados inconsistentes, processos duplicados. Histórico Etapas da evolução rumo a tomada de decisão: Aplicações Isoladas: dados duplicados, dados inconsistentes, processos duplicados. Sistemas Integrados: racionalização de processos, manutenção dos

Leia mais

Introdução Banco de Dados

Introdução Banco de Dados Introdução Banco de Dados Vitor Valerio de Souza Campos Adaptado de Vania Bogorny Por que estudar BD? Os Bancos de Dados fazem parte do nosso dia-a-dia: operação bancária reserva de hotel matrícula em

Leia mais

Qualidade da Informação em Reformulação de Consultas em um PDMS: Uma Perspectiva

Qualidade da Informação em Reformulação de Consultas em um PDMS: Uma Perspectiva Qualidade da Informação em Reformulação de Consultas em um PDMS: Uma Perspectiva Bruno Felipe de França Souza 1, Ana Carolina Salgado 1, Maria da Conceição Moraes Batista 2 1 Centro de Informática Universidade

Leia mais

Introdução. Banco de dados. Por que usar BD? Por que estudar BD? Exemplo de um BD. Conceitos básicos

Introdução. Banco de dados. Por que usar BD? Por que estudar BD? Exemplo de um BD. Conceitos básicos Introdução Banco de Dados Por que usar BD? Vitor Valerio de Souza Campos Adaptado de Vania Bogorny 4 Por que estudar BD? Exemplo de um BD Os Bancos de Dados fazem parte do nosso dia-a-dia: operação bancária

Leia mais

Banco de Dados. 13 - Arquiteturas para SGBDs

Banco de Dados. 13 - Arquiteturas para SGBDs Banco de Dados 13 - Arquiteturas para SGBDs 1 Tópicos Caracterização de SGBDs SGBDs Centralizados SGBDs Cliente-Servidor SGBDs Distribuídos Homogêneos Multi-SGBDs Heterogêneos SGBDs Paralelos SGBDs e a

Leia mais

BANCO DE DADOS. Introdução a Banco de Dados. Conceitos BásicosB. Engenharia da Computação UNIVASF. Aula 1. Breve Histórico

BANCO DE DADOS. Introdução a Banco de Dados. Conceitos BásicosB. Engenharia da Computação UNIVASF. Aula 1. Breve Histórico Banco de Dados // 1 Banco de Dados // 2 Conceitos BásicosB Engenharia da Computação UNIVASF BANCO DE DADOS Aula 1 Introdução a Banco de Dados Campo representação informatizada de um dado real / menor unidade

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS. Bancos de Dados Conceitos Fundamentais

FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS. Bancos de Dados Conceitos Fundamentais FACULDADE INTEGRADAS DE PARANAÍBA ADMINISTRAÇÃO DE EMPRESAS Bancos de Dados Conceitos Fundamentais Tópicos Conceitos Básicos Bancos de Dados Sistemas de Bancos de Dados Sistemas de Gerenciamento de Bancos

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Conceitos Básicos Introdução Banco de Dados I Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM Dados

Leia mais

Bancos de Dados. Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações

Bancos de Dados. Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações Conceitos F undamentais em S is temas de B ancos de Dados e s uas Aplicações Tópicos Conceitos Básicos Bancos de Dados Sistemas de Bancos de Dados Sistemas de Gerenciamento de Bancos de Dados Abstração

Leia mais

Curso Superior de Tecnologia em BD Curso Superior de Tecnologia em DAI

Curso Superior de Tecnologia em BD Curso Superior de Tecnologia em DAI Curso Superior de Tecnologia em BD Curso Superior de Tecnologia em DAI Fundamentos de Banco de Dados Aula 01 Introdução aos Sistemas de Bancos de Dados Introdução aos Sistemas de BD Objetivo Apresentar

Leia mais

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com.

Banco de Dados I. Apresentação (mini-currículo) Conceitos. Disciplina Banco de Dados. Cont... Cont... Edson Thizon (edson@esucri.com. Sistemas da Informação Banco de Dados I Edson Thizon (edson@esucri.com.br) 2008 Apresentação (mini-currículo) Formação Acadêmica Mestrando em Ciência da Computação (UFSC/ ) Créditos Concluídos. Bacharel

Leia mais

INTRODUÇÃO E CONCEITOS BÁSICOS. Prof. Ronaldo R. Goldschmidt

INTRODUÇÃO E CONCEITOS BÁSICOS. Prof. Ronaldo R. Goldschmidt INTRODUÇÃO E CONCEITOS BÁSICOS Prof. Ronaldo R. Goldschmidt Hierarquia Dado - Informação - Conhecimento: Dados são fatos com significado implícito. Podem ser armazenados. Dados Processamento Informação

Leia mais

Arquitetura de Banco de Dados

Arquitetura de Banco de Dados Arquitetura de Banco de Dados Daniela Barreiro Claro MAT A60 DCC/IM/UFBA Arquitetura de Banco de dados Final de 1972, ANSI/X3/SPARC estabeleceram o relatório final do STUDY GROUP Objetivos do Study Group

Leia mais

BANCO DE DADOS E BUSINESS INTELIGENCE. C/H: 20 horas (20/02, 25/02, 27/02, 04/03, 06/03)

BANCO DE DADOS E BUSINESS INTELIGENCE. C/H: 20 horas (20/02, 25/02, 27/02, 04/03, 06/03) MBA em Gestão de TI MÓDULO: BANCO DE DADOS E BUSINESS INTELIGENCE C/H: 20 horas (20/02, 25/02, 27/02, 04/03, 06/03) PROFESSOR: Edison Andrade Martins Morais prof@edison.eti.br http://www.edison.eti.br

Leia mais

Semântica para Sharepoint. Busca semântica utilizando ontologias

Semântica para Sharepoint. Busca semântica utilizando ontologias Semântica para Sharepoint Busca semântica utilizando ontologias Índice 1 Introdução... 2 2 Arquitetura... 3 3 Componentes do Produto... 4 3.1 OntoBroker... 4 3.2 OntoStudio... 4 3.3 SemanticCore para SharePoint...

Leia mais

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Aula 2 Computação em Nuvem Desafios e Oportunidades A Computação em Nuvem

Leia mais

Data Warehousing Visão Geral do Processo

Data Warehousing Visão Geral do Processo Data Warehousing Visão Geral do Processo Organizações continuamente coletam dados, informações e conhecimento em níveis cada vez maiores,, e os armazenam em sistemas informatizados O número de usuários

Leia mais

CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE

CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE A proposta para o ambiente apresentada neste trabalho é baseada no conjunto de requisitos levantados no capítulo anterior. Este levantamento, sugere uma

Leia mais

Figura 1 - Arquitetura multi-camadas do SIE

Figura 1 - Arquitetura multi-camadas do SIE Um estudo sobre os aspectos de desenvolvimento e distribuição do SIE Fernando Pires Barbosa¹, Equipe Técnica do SIE¹ ¹Centro de Processamento de Dados, Universidade Federal de Santa Maria fernando.barbosa@cpd.ufsm.br

Leia mais

Projeto de Arquitetura

Projeto de Arquitetura Projeto de Arquitetura Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 11 Slide 1 Objetivos Apresentar projeto de arquitetura e discutir sua importância Explicar as decisões de projeto

Leia mais

2 Conceitos relativos a Web services e sua composição

2 Conceitos relativos a Web services e sua composição 15 2 Conceitos relativos a Web services e sua composição A necessidade de flexibilidade na arquitetura das aplicações levou ao modelo orientado a objetos, onde os processos de negócios podem ser representados

Leia mais

Banco de Dados. Conceitos e Arquitetura de Sistemas de Banco de Dados. Profa. Flávia Cristina Bernardini

Banco de Dados. Conceitos e Arquitetura de Sistemas de Banco de Dados. Profa. Flávia Cristina Bernardini Banco de Dados Conceitos e Arquitetura de Sistemas de Banco de Dados Profa. Flávia Cristina Bernardini Relembrando... Vantagens da Utilização de SGBD Redundância controlada Consistência dos dados armazenados

Leia mais

2 Conceitos básicos. 2.1 Arquiteturas tradicionais para integração de dados. 2.1.1 Arquitetura de mediadores

2 Conceitos básicos. 2.1 Arquiteturas tradicionais para integração de dados. 2.1.1 Arquitetura de mediadores 17 2 Conceitos básicos 2.1 Arquiteturas tradicionais para integração de dados 2.1.1 Arquitetura de mediadores Um mediador é um componente de software que intermedia o acesso de clientes (usuários ou componentes

Leia mais

Banco de Dados, Integração e Qualidade de Dados. Ceça Moraes cecafac@gmail.com

Banco de Dados, Integração e Qualidade de Dados. Ceça Moraes cecafac@gmail.com Banco de Dados, Integração e Qualidade de Dados Ceça Moraes cecafac@gmail.com Sobre a professora CeçaMoraes Doutora em Computação (UFPE) Áreas de atuação Desenvolvimento de Software e Banco de Dados Experiência

Leia mais

GBC043 Sistemas de Banco de Dados. Introdução. Ilmério Reis da Silva ilmerio@facom.ufu.br www.facom.ufu.br/~ilmerio/sbd UFU/FACOM

GBC043 Sistemas de Banco de Dados. Introdução. Ilmério Reis da Silva ilmerio@facom.ufu.br www.facom.ufu.br/~ilmerio/sbd UFU/FACOM GBC043 Sistemas de Banco de Dados Introdução Ilmério Reis da Silva ilmerio@facom.ufu.br www.facom.ufu.br/~ilmerio/sbd UFU/FACOM Página 2 Definição BD Def. Banco de Dados é uma coleção de itens de dados

Leia mais

1 http://www.google.com

1 http://www.google.com 1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou

Leia mais

Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br Programação com acesso a BD Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br 1 Modelos de Dados, Esquemas e Instâncias 2 Modelos de Dados, Esquemas e Instâncias Modelo de dados: Conjunto de conceitos

Leia mais

Gestão de Armazenamento

Gestão de Armazenamento Gestão de Armazenamento 1. Introdução As organizações estão se deparando com o desafio de gerenciar com eficiência uma quantidade extraordinária de dados comerciais gerados por aplicativos e transações

Leia mais

Banco de Dados 1 Prof. MSc Wagner Siqueira Cavalcante

Banco de Dados 1 Prof. MSc Wagner Siqueira Cavalcante Banco de Dados 1 Programação sucinta do curso:. Conceitos fundamentais de Banco de Dados.. Arquitetura dos Sistemas Gerenciadores de Banco de Dados (SGBD ou DBMS).. Características típicas de um SGBD..

Leia mais

CAPÍTULO 1 INTRODUÇÃO

CAPÍTULO 1 INTRODUÇÃO CAPÍTULO 1 INTRODUÇÃO A atuação do homem no meio ambiente, ao longo da história, fornece provas de suas ações em nome do progresso. Esta evolução tem seu lado positivo, pois abre novos horizontes, novas

Leia mais

SISTEMA GERENCIADOR DE BANCO DE DADOS

SISTEMA GERENCIADOR DE BANCO DE DADOS BANCO DE DADOS Universidade do Estado de Santa Catarina Centro de Ciências Tecnológicas Departamento de Ciência da Computação Prof. Alexandre Veloso de Matos alexandre.matos@udesc.br SISTEMA GERENCIADOR

Leia mais

Módulo 4: Gerenciamento de Dados

Módulo 4: Gerenciamento de Dados Módulo 4: Gerenciamento de Dados 1 1. CONCEITOS Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não

Leia mais

Tipos de Sistemas Distribuídos (Cluster e Grid)

Tipos de Sistemas Distribuídos (Cluster e Grid) Tipos de Sistemas Distribuídos (Cluster e Grid) Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência

Leia mais

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados. BANCO DE DADOS Universidade do Estado de Santa Catarina Centro de Ciências Tecnológicas Departamento de Ciência da Computação Prof. Alexandre Veloso de Matos alexandre.matos@udesc.br INTRODUÇÃO Hoje é

Leia mais

Projeto Demoiselle. Para perguntas e respostas, utilizem a lista de discussões de usuários da comunidade: demoiselle-users@lists.sourceforge.

Projeto Demoiselle. Para perguntas e respostas, utilizem a lista de discussões de usuários da comunidade: demoiselle-users@lists.sourceforge. Projeto Demoiselle Para perguntas e respostas, utilizem a lista de discussões de usuários da comunidade: demoiselle-users@lists.sourceforge.net Palestrantes: Antônio Carlos Tiboni Luciana Campos Mota 20/07/2009

Leia mais

Disciplina de Banco de Dados Introdução

Disciplina de Banco de Dados Introdução Disciplina de Banco de Dados Introdução Prof. Elisa Maria Pivetta CAFW - UFSM Banco de Dados: Conceitos A empresa JJ. Gomes tem uma lista com mais ou menos 4.000 nomes de clientes bem como seus dados pessoais.

Leia mais

Modelos e Arquiteturas de Sistemas Computacionais

Modelos e Arquiteturas de Sistemas Computacionais Modelos e Arquiteturas de Sistemas Computacionais Prof. Ricardo J. Rabelo UFSC Universidade Federal de Santa Catarina DAS Departamento de Automação e Sistemas SUMÁRIO Importância da definição da Arquitetura

Leia mais

SISTEMA DE BANCO DE DADOS. Banco e Modelagem de dados

SISTEMA DE BANCO DE DADOS. Banco e Modelagem de dados SISTEMA DE BANCO DE DADOS Banco e Modelagem de dados Sumário Conceitos/Autores chave... 3 1. Introdução... 4 2. Arquiteturas de um Sistema Gerenciador... 5 3. Componentes de um Sistema... 8 4. Vantagens

Leia mais

Sistemas de Banco de Dados Aspectos Gerais de Banco de Dados

Sistemas de Banco de Dados Aspectos Gerais de Banco de Dados Sistemas de Banco de Dados Aspectos Gerais de Banco de Dados 1. Conceitos Básicos No contexto de sistemas de banco de dados as palavras dado e informação possuem o mesmo significado, representando uma

Leia mais

2 Auto-sintonia de Bancos de Dados e Agentes de Software

2 Auto-sintonia de Bancos de Dados e Agentes de Software 2 Auto-sintonia de Bancos de Dados e Agentes de Software A uso da abordagem de agentes de software 1 pode trazer benefícios a áreas de aplicação em que é necessário construir sistemas autônomos, ou seja,

Leia mais

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc.

04/08/2012 MODELAGEM DE DADOS. PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS. Aula 1. Prof. Rafael Dias Ribeiro. M.Sc. MODELAGEM DE DADOS PROF. RAFAEL DIAS RIBEIRO, M.Sc. @ribeirord MODELAGEM DE DADOS Aula 1 Prof. Rafael Dias Ribeiro. M.Sc. @ribeirord 1 Objetivos: Apresenta a diferença entre dado e informação e a importância

Leia mais

Service Oriented Architecture (SOA)

Service Oriented Architecture (SOA) São Paulo, 2011 Universidade Paulista (UNIP) Service Oriented Architecture (SOA) Prof. MSc. Vladimir Camelo vladimir.professor@gmail.com 04/09/11 vladimir.professor@gmail.com 1 04/09/11 vladimir.professor@gmail.com

Leia mais

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO

FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO @ribeirord FUNDAMENTOS DE SISTEMAS DE INFORMAÇÃO Rafael D. Ribeiro, M.Sc,PMP. rafaeldiasribeiro@gmail.com http://www.rafaeldiasribeiro.com.br Lembrando... Aula 4 1 Lembrando... Aula 4 Sistemas de apoio

Leia mais

Sistema de Bancos de Dados. Conceitos Gerais Sistema Gerenciador de Bancos de Dados

Sistema de Bancos de Dados. Conceitos Gerais Sistema Gerenciador de Bancos de Dados Sistema de Bancos de Dados Conceitos Gerais Sistema Gerenciador de Bancos de Dados # Definições # Motivação # Arquitetura Típica # Vantagens # Desvantagens # Evolução # Classes de Usuários 1 Nível 1 Dados

Leia mais

INDICE 3.APLICAÇÕES QUE PODEM SER DESENVOLVIDAS COM O USO DO SAXES

INDICE 3.APLICAÇÕES QUE PODEM SER DESENVOLVIDAS COM O USO DO SAXES w w w. i d e a l o g i c. c o m. b r INDICE 1.APRESENTAÇÃO 2.ESPECIFICAÇÃO DOS RECURSOS DO SOFTWARE SAXES 2.1. Funcionalidades comuns a outras ferramentas similares 2.2. Funcionalidades próprias do software

Leia mais

Faculdade Lourenço Filho - ENADE 2011-1

Faculdade Lourenço Filho - ENADE 2011-1 1. Quando se constrói um banco de dados, define-se o modelo de entidade e relacionamento (MER), que é a representação abstrata das estruturas de dados do banco e seus relacionamentos. Cada entidade pode

Leia mais

Sistemas Distribuídos Arquitetura de Sistemas Distribuídos Aula II Prof. Rosemary Silveira F. Melo Arquitetura de Sistemas Distribuídos Conceito de Arquitetura de Software Principais elementos arquiteturais

Leia mais

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO

Intranets. FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO Intranets FERNANDO ALBUQUERQUE Departamento de Ciência da Computação Universidade de Brasília 1.INTRODUÇÃO As intranets são redes internas às organizações que usam as tecnologias utilizadas na rede mundial

Leia mais

Criação e publicação de um dataset de dados interligados das edições passadas do Simpósio Brasileiro de Banco de Dados

Criação e publicação de um dataset de dados interligados das edições passadas do Simpósio Brasileiro de Banco de Dados U NIVERSIDADE FEDERAL DE PERNAMBUCO GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO CENTRO DE INFORMÁTICA 2 0 1 2. 2 Criação e publicação de um dataset de dados interligados das edições passadas do Simpósio Brasileiro

Leia mais

Banco de Dados. Módulo 11 - Modelo de Dados Semi-Estruturados

Banco de Dados. Módulo 11 - Modelo de Dados Semi-Estruturados Banco de Dados Módulo 11 - Modelo de Dados Semi-Estruturados Dados Semi-estruturados Características principais dos dados semi-estruturados: sem imposição de tipos auto-descritivos: a descrição da estrutura

Leia mais

Roteiro. Conceitos e Arquitetura de Sistemas de Banco de Dados. Conceitos e Arquiteturas de Sistemas de Banco de Dados. BCC321 - Banco de Dados I

Roteiro. Conceitos e Arquitetura de Sistemas de Banco de Dados. Conceitos e Arquiteturas de Sistemas de Banco de Dados. BCC321 - Banco de Dados I Roteiro Conceitos e Arquitetura de Sistemas de Banco de Dados Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz

Leia mais

Ferramenta CORIDORA Web Mapping para Mapeamento de Esquemas em Bancos de Dados Heterogêneos

Ferramenta CORIDORA Web Mapping para Mapeamento de Esquemas em Bancos de Dados Heterogêneos Ferramenta CORIDORA Web Mapping para Mapeamento de Esquemas em Bancos de Dados Heterogêneos Fernando Busanello Meneghetti 1, Fabiano Gama Paes 1, Gustavo Zanini Kantorski 1 Curso de Sistemas de Informação

Leia mais

Pós Graduação Engenharia de Software

Pós Graduação Engenharia de Software Pós Graduação Engenharia de Software Ana Candida Natali COPPE/UFRJ Programa de Engenharia de Sistemas e Computação FAPEC / FAT Estrutura do Módulo Parte 1 QUALIDADE DE SOFTWARE PROCESSO Introdução: desenvolvimento

Leia mais

Disciplina: Tecnologias de Banco de Dados para SI s

Disciplina: Tecnologias de Banco de Dados para SI s Curso de Gestão em SI Disciplina: Tecnologias de Banco de Dados para SI s Rodrigo da Silva Gomes (Extraído do material do prof. Ronaldo Melo - UFSC) Banco de Dados (BD) BD fazem parte do nosso dia-a-dia!

Leia mais

Aspectos semânticos em um sistema de integração de informações na Web 1 1 Centro de Informática Universidade Federal de Pernambuco (UFPE)

Aspectos semânticos em um sistema de integração de informações na Web 1 1 Centro de Informática Universidade Federal de Pernambuco (UFPE) Aspectos semânticos em um sistema de integração de informações na Web 1 Rosalie Barreto Belian, Ana Carolina Salgado 1 Centro de Informática Universidade Federal de Pernambuco (UFPE) e-mail: {rbb, acs}@cin.ufpe.br

Leia mais

Administração de Banco de Dados

Administração de Banco de Dados Administração de Banco de Dados Professora conteudista: Cida Atum Sumário Administração de Banco de Dados Unidade I 1 INTRODUÇÃO A BANCO DE DADOS...1 1.1 Histórico...1 1.2 Definições...2 1.3 Importância

Leia mais

SISTEMAS DISTRIBUÍDOS

SISTEMAS DISTRIBUÍDOS Arquiteturas www.pearson.com.br capítulo 2 slide 1 2.1 Estilos Arquitetônicos Formado em termos de componentes, do modo como esses componentes estão conectados uns aos outros, dos dados trocados entre

Leia mais

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064 Sistemas Distribuídos Professora: Ana Paula Couto DCC 064 Arquiteturas Capítulo 2 Agenda Estilos Arquitetônicos Arquiteturas de Sistemas Arquiteturas Centralizadas Arquiteturas Descentralizadas Arquiteturas

Leia mais

A evolução da tecnologia da informação nos últimos 45 anos

A evolução da tecnologia da informação nos últimos 45 anos A evolução da tecnologia da informação nos últimos 45 anos Denis Alcides Rezende Do processamento de dados a TI Na década de 1960, o tema tecnológico que rondava as organizações era o processamento de

Leia mais

MBA Inteligência Competitiva Com ênfase em BI/CPM. Metadados

MBA Inteligência Competitiva Com ênfase em BI/CPM. Metadados MBA Inteligência Competitiva BI/CPM 1 Data Warehousing PÓS-GRADUAÇÃO MBA Inteligência Competitiva Com ênfase em BI/CPM Metadados Andréa Cristina Montefusco (36927) Hermes Abreu Mattos (36768) Robson Pereira

Leia mais

Análise e Projeto de Sistemas. Engenharia de Software. Análise e Projeto de Sistemas. Contextualização. Perspectiva Histórica. A Evolução do Software

Análise e Projeto de Sistemas. Engenharia de Software. Análise e Projeto de Sistemas. Contextualização. Perspectiva Histórica. A Evolução do Software Análise e Projeto de Sistemas Análise e Projeto de Sistemas Contextualização ENGENHARIA DE SOFTWARE ANÁLISE E PROJETO DE SISTEMAS ENGENHARIA DA INFORMAÇÃO Perspectiva Histórica Engenharia de Software 1940:

Leia mais

O que é o Virto ERP? Onde sua empresa quer chegar? Apresentação. Modelo de funcionamento

O que é o Virto ERP? Onde sua empresa quer chegar? Apresentação. Modelo de funcionamento HOME O QUE É TOUR MÓDULOS POR QUE SOMOS DIFERENTES METODOLOGIA CLIENTES DÚVIDAS PREÇOS FALE CONOSCO Suporte Sou Cliente Onde sua empresa quer chegar? Sistemas de gestão precisam ajudar sua empresa a atingir

Leia mais

SISTEMAS DE BANCO DE DADOS. Prof. Adriano Pereira Maranhão

SISTEMAS DE BANCO DE DADOS. Prof. Adriano Pereira Maranhão SISTEMAS DE BANCO DE DADOS Prof. Adriano Pereira Maranhão 1 REVISÃO BANCO DE DADOS I O que é banco de dados? Ou seja afinal o que é um SGBD? REVISÃO BD I REVISÃO DE BD I Um Sistema de Gerenciamento de

Leia mais

08/04/2013. Agenda. O Sistema CACHÉ. O Sistema CACHÉ. O Sistema CACHÉ. O Sistema CACHÉ

08/04/2013. Agenda. O Sistema CACHÉ. O Sistema CACHÉ. O Sistema CACHÉ. O Sistema CACHÉ Agenda Caché Server Pages Uma Aplicação Banco de Dados Fernando Fonseca Ana Carolina Salgado Mestrado Profissional 2 SGBD de alto desempenho e escalabilidade Servidor de dados multidimensional Arquitetura

Leia mais

Plano de Ensino. Apresentação da Unidade Curricular

Plano de Ensino. Apresentação da Unidade Curricular Plano de Ensino Plano de Ensino Apresentação da Unidade Curricular o Funcionamento, arquitetura e conceitos fundamentais dos bancos de dados relacionais e objeto relacionais. Utilização de linguagem DDL

Leia mais

Sistemas de Informação I

Sistemas de Informação I + Sistemas de Informação I Tipos de SI Ricardo de Sousa Britto rbritto@ufpi.edu.br + Introdução 2 n As organizações modernas competem entre si para satisfazer as necessidades dos seus clientes de um modo

Leia mais

Evolução. Tópicos. Bancos de Dados - Introdução. Melissa Lemos. Evolução dos Sistemas de Informação Esquemas Modelos. Características de SGBDs

Evolução. Tópicos. Bancos de Dados - Introdução. Melissa Lemos. Evolução dos Sistemas de Informação Esquemas Modelos. Características de SGBDs 1 Bancos de Dados - Introdução Melissa Lemos melissa@inf.puc-rio.br Tópicos Evolução dos Sistemas de Informação Esquemas Modelos Conceitual Lógico Características de SGBDs 2 Evolução tempo Programas e

Leia mais

ALESSANDRO PEREIRA DOS REIS PAULO CESAR CASTRO DE ALMEIDA ENGENHARIA DE SOFTWARE - CAPABILITY MATURITY MODEL INTEGRATION (CMMI)

ALESSANDRO PEREIRA DOS REIS PAULO CESAR CASTRO DE ALMEIDA ENGENHARIA DE SOFTWARE - CAPABILITY MATURITY MODEL INTEGRATION (CMMI) ALESSANDRO PEREIRA DOS REIS PAULO CESAR CASTRO DE ALMEIDA ENGENHARIA DE SOFTWARE - CAPABILITY MATURITY MODEL INTEGRATION (CMMI) APARECIDA DE GOIÂNIA 2014 LISTA DE TABELAS Tabela 1 Áreas de processo por

Leia mais

Metas de um Sistema Distribuído

Metas de um Sistema Distribuído Metas de um Sistema Distribuído Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia do

Leia mais

MASSACHUSETTS INSTITUTE OF TECHNOLOGY SLOAN SCHOOL OF MANAGEMENT

MASSACHUSETTS INSTITUTE OF TECHNOLOGY SLOAN SCHOOL OF MANAGEMENT MASSACHUSETTS INSTITUTE OF TECHNOLOGY SLOAN SCHOOL OF MANAGEMENT 15.565 Integração de Sistemas de Informação: Fatores Tecnológicos, Estratégicos e Organizacionais 15.578 Sistemas de Informação Global:

Leia mais

C O B I T. Gerenciamento dos Riscos Mitigação. Aceitação. Transferência. Evitar/Eliminar.

C O B I T. Gerenciamento dos Riscos Mitigação. Aceitação. Transferência. Evitar/Eliminar. C O B I T Evolução Estratégica A) Provedor de Tecnologia Gerenciamento de Infra-estrutura de TI (ITIM) B) Provedor de Serviços Gerenciamento de Serviços de TI (ITSM) C) Parceiro Estratégico Governança

Leia mais

MÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS

MÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS MÓDULO 8 ARQUITETURA DOS SISTEMAS DE BANCO DE DADOS Quando falamos em arquitetura, normalmente utilizamos esse termo para referenciar a forma como os aplicativos computacionais são estruturados e os hardwares

Leia mais

Introdução. Motivação. Sistema Gerenciador de Banco de Dados (SGBD) Banco de Dados (BD) Sistema de Banco de Dados (SBD)

Introdução. Motivação. Sistema Gerenciador de Banco de Dados (SGBD) Banco de Dados (BD) Sistema de Banco de Dados (SBD) Pós-graduação em Ciência da Computação CCM-202 Sistemas de Banco de Dados Introdução Profa. Maria Camila Nardini Barioni camila.barioni@ufabc.edu.br Bloco B - sala 937 2 quadrimestre de 2011 Motivação

Leia mais

Engenharia de Software II

Engenharia de Software II Engenharia de Software II Aula 27 http://www.ic.uff.br/~bianca/engsoft2/ Aula 27-26/07/2006 1 Ementa Processos de desenvolvimento de software Estratégias e técnicas de teste de software Métricas para software

Leia mais

Conceitos de Banco de Dados

Conceitos de Banco de Dados Conceitos de Banco de Dados Autor: Luiz Antonio Junior 1 INTRODUÇÃO Objetivos Introduzir conceitos básicos de Modelo de dados Introduzir conceitos básicos de Banco de dados Capacitar o aluno a construir

Leia mais

Anexo VI Edital nº 03361/2008. Projeto de Integração das informações de Identificação Civil. 1. Definições de interoperabilidade adotadas pela SENASP

Anexo VI Edital nº 03361/2008. Projeto de Integração das informações de Identificação Civil. 1. Definições de interoperabilidade adotadas pela SENASP Anexo VI Edital nº 03361/2008 Projeto de Integração das informações de Identificação Civil 1. Definições de interoperabilidade adotadas pela SENASP A Senasp procura adotar os padrões de interoperabilidade

Leia mais

2. Conceitos e Arquitetura de Bancos de Dados

2. Conceitos e Arquitetura de Bancos de Dados Bancos de Dados 2. Conceitos e Arquitetura de Bancos de Dados 1 Arquitetura Moderna de SGBD SGBD antigos eram monolíticos e rígidos, voltados para funcionamento em ambientes centralizados (mainframes e

Leia mais

Roteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)?

Roteiro. BCC321 - Banco de Dados I. Conceitos Básicos. Conceitos Básicos. O que é um banco de dados (BD)? Roteiro BCC321 - Banco de Dados I Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br www.decom.ufop.br/luiz Conceitos Básicos Banco

Leia mais

UMA ABORDAGEM SOBRE OS PADRÕES DE QUALIDADE DE SOFTWARE COM ÊNFASE EM SISTEMAS PARA WEB

UMA ABORDAGEM SOBRE OS PADRÕES DE QUALIDADE DE SOFTWARE COM ÊNFASE EM SISTEMAS PARA WEB UMA ABORDAGEM SOBRE OS PADRÕES DE QUALIDADE DE SOFTWARE COM ÊNFASE EM SISTEMAS PARA WEB Alan Francisco de Souza¹, Claudete Werner¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil alanfsouza.afs@gmail.com,

Leia mais

1. CONCEITOS BÁSICOS DE BD, SBD E SGBD

1. CONCEITOS BÁSICOS DE BD, SBD E SGBD Introdução 1. CONCEITOS BÁSICOS DE BD, SBD E SGBD A importância da informação para a tomada de decisões nas organizações tem impulsionado o desenvolvimento dos sistemas de processamento de informações.

Leia mais

MC536 Bancos de Dados: Teoria e Prática

MC536 Bancos de Dados: Teoria e Prática Universidade Estadual de Campinas - UNICAMP Instituto de Computação - IC MC536 Bancos de Dados: Teoria e Prática Aula #1 Arquitetura de Banco de Dados Profs. Anderson Rocha e André Santanchè Campinas,

Leia mais

BANCO DE DADOS AULA 02 INTRODUÇÃO AOS BANCOS DE DADOS PROF. FELIPE TÚLIO DE CASTRO 2015

BANCO DE DADOS AULA 02 INTRODUÇÃO AOS BANCOS DE DADOS PROF. FELIPE TÚLIO DE CASTRO 2015 BANCO DE DADOS AULA 02 INTRODUÇÃO AOS BANCOS DE DADOS PROF. FELIPE TÚLIO DE CASTRO 2015 NA AULA PASSADA... 1. Apresentamos a proposta de ementa para a disciplina; 2. Discutimos quais as ferramentas computacionais

Leia mais

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Aula 3 Virtualização de Sistemas 1. Conceito Virtualização pode ser definida

Leia mais

Introdução à Engenharia de Software

Introdução à Engenharia de Software Introdução à Engenharia de Software Professor: Rômulo César romulodandrade@gmail.com www.romulocesar.com.br Imagem Clássica Objetivo da aula Depois desta aula você terá uma visão sobre o que é a engenharia

Leia mais