MODELAGEM DE UM DATA WAREHOUSE DE DADOS DE PROVENIÊNCIA EM UM AMBIENTE DISTRIBUÍDO PARA OTIMIZAR EXPERIMENTOS CIENTÍFICOS

Tamanho: px
Começar a partir da página:

Download "MODELAGEM DE UM DATA WAREHOUSE DE DADOS DE PROVENIÊNCIA EM UM AMBIENTE DISTRIBUÍDO PARA OTIMIZAR EXPERIMENTOS CIENTÍFICOS"

Transcrição

1 MODELAGEM DE UM DATA WAREHOUSE DE DADOS DE PROVENIÊNCIA EM UM AMBIENTE DISTRIBUÍDO PARA OTIMIZAR EXPERIMENTOS CIENTÍFICOS Vinícius Neves Motta Projeto de Graduação apresentado ao Curso de Engenharia de Computação e Informação da Escola Politécnica, Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Engenheiro. Orientadora: Profª. Marta Lima de Queirós Mattoso Rio de Janeiro Março de 2015

2 MODELAGEM DE UM DATA WAREHOUSE DE DADOS DE PROVENIÊNCIA EM UM AMBIENTE DISTRIBUÍDO PARA OTIMIZAR EXPERIMENTOS CIENTÍFICOS Vinícius Neves Motta PROJETO DE GRADUAÇÃO SUBMETIDO AO CORPO DOCENTE DO CURSO DE ENGENHARIA DE COMPUTAÇÃO E INFORMAÇÃO DA ESCOLA POLITÉCNICA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE ENGENHEIRO DE COMPUTAÇÃO E INFORMAÇÃO Autor: Orientador: Coorientador: Examinador: Vinícius Neves Motta Profa. Marta Lima de Queirós Mattoso Prof. Flavio da Silva Costa Prof. Alexandre Assis Rio de Janeiro RJ, Brasil Março de 2015 ii

3 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO Escola Politécnica Departamento de Eletrônica e de Computação Centro de Tecnologia, bloco H, sala H-217, Cidade Universitária Rio de Janeiro RJ CEP Este exemplar é de propriedade da Universidade Federal do Rio de Janeiro, que poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar qualquer forma de arquivamento. É permitida a menção, reprodução parcial ou integral e a transmissão entre bibliotecas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou venha a ser fixado, para pesquisa acadêmica, comentários e citações, desde que sem finalidade comercial e que seja feita a referência bibliográfica completa. Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es). iii

4 DEDICATÓRIA Ao meu irmão e minha mãe, que me deram o apoio e a base necessários para o sucesso na realização desse trabalho e durante toda a graduação. iv

5 AGRADECIMENTO Agradeço primeiramente à minha mãe e ao meu irmão, que apesar das dificuldades impostas pela vida, me deram o apoio necessário para que eu pudesse seguir em frente e concluir esse curso de graduação. Agradeço à professora Marta Lima de Queirós Mattoso e ao professor Flavio da Silva Costa, respectivamente orientadora e coorientador, pelos conselhos e orientações que tornaram esse trabalho possível. Agradeço ainda aos meus amigos e colegas de faculdade, pelo apoio e ajuda, durante toda essa jornada de graduação. v

6 RESUMO À medida que o uso de computadores vem se tornado mais frequente em experimentos científicos, a utilização de infraestrutura virtualizada tem se tornado uma alternativa aos custosos investimentos em hardware. Além de processar as simulações precisamos conceber boas estratégias para armazenar os dados gerados por estas simulações. Isto é crucial, pois com uma quantidade enorme de dados que são gerados, a solução mais eficiente, garante ao usuário um melhor desempenho. Como diversas novas soluções têm surgidos, devemos testá-las para avaliar possíveis ganhos de desempenho e usabilidade. No nosso trabalho, será avaliado o uso de um data warehouse distribuído, implementado em nuvem, para armazenar dados de proveniência gerados na execução de workflows científicos. Palavras-Chave: Workflow Científico, Bases de Dados Distribuídas, Data Warehouse. vi

7 ABSTRACT The use of computers has been constantly increasing, in the last years. With this growing user of computer, scientists have been running experiments on virtual environments more and more. As a consequence, there is a growing need for designing solutions to store the data generated by these simulations. Because there is an enormous quantity of data being generated, it is extremely important to choose an efficient solution, in order to guarantee to the user a better performance. As there are many solutions being created, the need to test these solutions, searching for a better performance and usability has being created. On this work, it will be evaluated the use of a distributed data warehouse on the cloud, to store provenance data that is generated on the execution of scientific workflows. Key-words: Scientific Workflow, Distributed Data Base, Data Warehouse. vii

8 SIGLAS UFRJ Universidade Federal do Rio de Janeiro SGBD Sistema de Gerência de Banco de Dados. SGWfC Sistema de Gerência de Workflow Científico DM - DataMart viii

9 Sumário 1 Introdução e Motivação Motivação: Utilização de Data Warehouse Motivação: Utilização de Bases de Proveniência Datawarehouse Modelo Dimensional Arquitetura As Bases de Proveniência PROV W3C Somente Inserção de Dados Mais voltado às consultas Alto volume de dados -> Paralelismo e Distribuição Em geral as consultas estão pré-programadas para o cientista 4 Experimentos 4.1 Descrição dos Esquemas Implementação Física Descrição das Consultas Consulta Consulta Consulta Consulta Consulta Consulta Consulta Consulta Consulta Análise de Desempenho ix

10 5 Conclusão 23 Bibliografia 25 x

11 Lista de Figuras Figura 1. Exemplo de tabela de fatos Figura 2. Exemplo de tabela de dimensões Figura 3. Modelo de captura de proveniência do SciCumulus Figura 4. Modelo de Dados para o DM Activation Figura 5. Modelo de Dados para o DM Workflow Figura 6. Modelo de Dados para o DM Activity Figura 7. Gráfico comparativo dos tempos de execução da consulta Figura 8. Gráfico comparativo dos tempos de execução da consulta Figura 9. Gráfico comparativo dos tempos de execução da consulta Figura 10. Gráfico comparativo dos tempos de execução da consulta Figura 11. Gráfico comparativo dos tempos de execução da consulta Figura 12. Gráfico comparativo dos tempos de execução da consulta Figura 13. Gráfico comparativo dos tempos de execução da consulta Figura 14. Gráfico comparativo dos tempos de execução da consulta Figura 15. Gráfico comparativo dos tempos de execução da consulta xi

12 Lista de Tabelas Tabela 1. Tabela contendo os tempos de execução para cada consulta e para cada solução xii

13 Capítulo 1 Introdução e Motivação Devido à rápida evolução da tecnologia, a utilização de computadores para o avanço da pesquisa científica é cada vez mais uma realidade. Em especial na criação e na execução de experimentos científicos apoiados por computador. A possibilidade de se fazer simulações em computadores se tornou uma ferramenta cada vez mais poderosa devido ao rápido crescimento da capacidade de processamento computacional. Para executar todas as etapas dessas simulações, frequentemente, se utiliza diferentes softwares. Cada etapa é uma atividade, a qual deve ser executada para que seus resultados possam ser utilizados por outra atividade, gerando uma dependência entre elas. Este conjunto de atividades encadeadas é o que chamamos de workflow científico. O software que possibilita a execução de um workflow científico é chamado de Sistema de Gerência de Workflows Científicos (SGWfC), sendo responsável pela execução do workflow científico, assim, garantindo a execução de todas as suas atividades na ordem correta. Um workflow científico pode ser executado com diversas configurações e diversas entradas de dados de forma a procurar a maneira mais eficiente e/ou rápida de se executar este workflow, ou ainda, qual é a configuração que trará o melhor resultado, no contexto do experimento em desenvolvimento. Por este motivo, é importante não só armazenar os resultados gerados pela execução das atividades de um workflow, mas, também, os dados de execução do mesmo. Com estes dados o cientista é capaz de determinar qual é a melhor configuração para a execução de um determinado workflow científico. Estes dados que são gerados sobre a execução de um workflow são chamados de proveniência. Por executarem o mesmo experimento inúmeras vezes e pelo fato de cada execução gerar uma grande quantidade de dados, uma opção que pode ser adotada é utilizar um Sistema Gerenciador de Banco de Dados (SGBD) para armazenar os dados de proveniência. Além da complexidade dos experimentos, existe ainda a complexidade de trabalhar de forma cooperativa em um ambiente distribuído. Pois o usuário nem sempre tem acesso à proveniência gerada por outro cientista, que já pode ter executado o 1

14 mesmo experimento que ele. Não só isso, o usuário pode não saber onde acessar tal informação[13]. Por isso, há uma necessidade de se repensar o modo de armazenamento dos dados de proveniência, garantindo que os usuários possam, não só ter um acesso facilitado aos dados de proveniência gerados por outros usuários, mas também saber que estes dados existem. Este trabalho tem como objetivo avaliar a utilização de data warehouses de dados de proveniência por meio da análise do desempenho de consultas representativas do cenário real. E ainda, avaliar a utilização deste data warehouse em um ambiente distribuído. Este projeto de graduação está dividido em 5 capítulos, sendo esta introdução o primeiro capítulo. O capítulo 2 explicita o conceito de data warehouse e apresenta qual solução foi implementada. O capítulo 3 trata das bases de proveniência e das suas características. O capítulo 4 explica detalhadamente o que foi realizado nos experimentos e como eles foram conduzidos. Por fim, o capítulo 5 apresenta a conclusão deste trabalho. 1.1 Motivação: Utilização de Data Warehouse Data warehouses são extensamente usados no meio corporativo para o armazenamento de enormes quantidades de dados, no entanto, pouco utilizado em universidades[1]. Considerando-se que execuções de workflows científicos geram grandes quantidades de dados de proveniência torna interessante o estudo de viabilidade da utilização de data warehouses para armazenar tais dados. Existem diversas formas de se desenvolver um data warehouse, utilizando-se de modelo relacional ou modelo não-relacional de dados. Além disso, data warehouses são concebidos para armazenamento e o processamento de grandes quantidades de dados de forma eficiente, propiciando organização e recuperação rápida dos dados armazenados. 1.2 Motivação: Utilização de Bases de Proveniência Pelo fato dos cientistas realizarem diversas simulações computacionais em seus experimentos, muitos dados de proveniência são gerados e armazenados na base de dados. No entanto, os cientistas tendem a fazer a mesma consulta na mesma base de dados repetidas vezes, alterando somente os parâmetros da consulta, pois o interesse dos 2

15 cientistas é analisar as informações geradas pelos experimentos. Do mesmo modo, SGWfC que fazem uso de proveniência, também rodam consultas com o mesmo formato, alterando apenas os parâmetros de busca. Além disso, como nas bases de proveniência só há inserção e consulta de dados, as regras do banco de dados não precisam ser tão rígidas, pois não há remoção ou atualização de valores nestas bases. Sendo assim, uma de nossas motivações neste trabalho foi buscar estratégias que otimizassem o acesso aos dados de proveniência. 3

16 Capítulo 2 Data Warehouse Data warehouses são amplamente usados por empresas para armazenar dados. Isto ocorre, pois há uma produção cada vez maior de informação. Informação esta que precisa ser armazenada, pois, frequentemente, ela é vital para a empresa. Além disso, há a necessidade de poder acessar grandes quantidades de dados de variadas maneiras e de forma eficiente. Em específico, neste projeto de graduação, os dados de proveniência precisam ser armazenados e acessados de forma eficiente e de diversas formas. Estes dados são necessários, pois precisamos analisar o desempenho da execução dos workflows científicos e tornar mais rápidas e eficientes as próximas execuções. E, com este objetivo, este projeto de graduação se propõe a avaliar o uso de data warehouses. Um dos principais objetivos de um data warehouse é armazenar os dados de forma segura e bem organizada garantindo o acesso otimizado a estes. Este capítulo irá detalhar o conceito de data warehouse e o modo pelo qual este pode ser implementado. Primeiramente, explicaremos o modelo de dados utilizado para a construção de um data warehouse, a arquitetura do mesmo e sua implementação em um SGBD. 2.1 Modelo Dimensional O primeiro passo para se construir um data warehouse é a concepção de como ele organizará os dados armazenados, isto é, como será seu modelo de dados. Diferentemente da maioria dos bancos de dados, que utilizam um modelo relacional, um data warehouse utiliza o modelo dimensional. Este modelo, concebido nos anos 70, foi estruturado de forma dimensional, de modo a atender a necessidade humana de simplicidade[1]. Esta simplicidade se traduz em tornar simples as operações realizadas em cima do data warehouse, como, por exemplo, Rollup, Drill-Down, Slice-Dice e Pivot[2]. Estas operações envolvem o agrupamento e detalhamento de certos dados e a filtragem 4

17 dos mesmos. Num data warehouse estas operações são fundamentais devido à quantidade de dados armazenados. Na modelagem dimensional, os dados são organizados em dois tipos de tabela: Tabelas de fatos e tabelas de dimensões. As tabelas de fatos são as tabelas que, usualmente, armazenam medidas, sejam elas medidas do desempenho de um software, como a quantidade de produtos vendidos em uma transação financeira com um consumidor. Fatos podem ser numéricos ou não, além de, se forem numéricos, poderem ser aditivos, semiaditivos ou não aditivos. Fatos aditivos são aqueles que podem ser somados em qualquer condição, tal qual a quantidade de dólares por venda. Fatos semiaditivos são aqueles que podem ser somados em determinadas condições. E, finalmente, fatos não aditivos são aqueles que não podem ser somados em condição nenhuma. É importante ressaltar que deve se priorizar fatos aditivos, pois raramente o usuário pede por somente uma linha da tabela de fatos, mas, sim, um conjunto delas[1]. Fatos aditivos são capazes de condensar informações com grande facilidade e me retornar informações como, por exemplo, o total de dólares obtidos nas vendas do dia. Além disso, fatos são interseccionados com dimensões, tais como tempo e data, que definem a granularidade do fato. Quanto maior a quantidade de dimensões interseccionadas com uma tabela de fatos, com maior detalhamento um fato é armazenado na tabela, isto é, o fato possui uma maior granularidade. Apesar de ser possível ter fatos textuais, é importante ressaltar que isto deve ser evitado ao máximo, pois fatos textuais são mais difíceis de se analisar[1], pois tabelas de fato normalmente contêm milhões de linhas. É importante notar, também, que a maioria dos casos em que se encontra fatos textuais, eles podem ser facilmente retirados da tabela de fatos e serem colocados em uma tabela de dimensões. Por fim, é importante notar que toda tabela de fatos possui duas ou mais chaves estrangeiras, pois, usualmente, elas contêm duas ou mais dimensões. Na Figura 1 temos um exemplo de uma tabela de fatos. Figura 1. Exemplo de tabela de fatos. 5

18 A tabela de dimensões é a tabela que contém a descrição textual do negócio. Normalmente, contém muitas colunas ou atributos, que descrevem uma linha em uma tabela de dimensões[1]. Diferentemente das tabelas de fatos, as tabelas de dimensões contêm poucas linhas, apesar de cada linha conter muita informação. Este tipo de tabela, normalmente, é o mais importante para buscas com filtros, tais como datas, computadores, empresas, produtos. Tabelas de dimensões bem construídas são a chave para a usabilidade e a legibilidade de um data warehouse [1]. Por isto, é importante que se tome grande cuidado ao construir uma tabela de dimensões. Ao se construir uma tabela de dimensões, é importante que todos os atributos tenham nomes que os descrevam bem. É por meio destes atributos que a maioria das buscas com filtro serão feitas. Então, é importante que o usuário consiga saber facilmente qual atributo ele vai utilizar como restrição para obter os resultados desejados em uma consulta. É importante, também, evitar o uso de abreviações ao escolher o nome para um atributo, pois nem todos os usuários serão especialistas no assunto. Por fim, quanto mais se trabalha para se encontrar nomes adequados para os atributos de uma tabela de dimensões, mais legível fica o data warehouse, acarretando em melhor usabilidade do mesmo. Os valores que cada atributo pode assumir pode ser tanto numérico, quanto textual. No caso dos valores numéricos, é importante analisar corretamente se este valor numérico é um fato ou uma característica de uma dimensão do data warehouse, isto é crucial para melhorar sua usabilidade.. Por fim, na Figura 2, mostramos um exemplo de tabela de dimensões. 2.2 Arquitetura Figura 2. Exemplo de tabela de dimensões. Há variadas arquiteturas utilizadas para projetar um data warehouse, uma das mais utilizadas, atualmente, é a chamada arquitetura bottom-up apresentada por Kimball[1][2]. Esta arquitetura é preferida, pois o desenvolvimento do data warehouse 6

19 é feito de forma incremental, evitando quaisquer problemas relacionados a necessidades novas que surjam no caminho. Primeiramente, é necessário entender como é organizado um data warehouse. Um data warehouse, usualmente, é composto por Data Marts(DM). Os DMs são subconjunto de dados do data warehouse. Cada DM contém um subconjunto de dados direcionado a um tipo de usuário final. Isto é vantajoso, pois permite o acesso descentralizado ao data warehouse, além de conseguir garantir um melhor atendimento à demanda do usuário final[2]. A arquitetura bottom-up procura explorar as vantagens do uso de DMs para construir um data warehouse. Esta arquitetura permite a construção incremental do data warehouse por meio de DMs independentes. Além disso, isto permite um desenvolvimento mais acelerado do data warehouse, pois é possível o desenvolvimento de vários DMs ao mesmo tempo. Também é importante destacar que facilita o enfoque na construção de um data warehouse que atenda as necessidades principais do problema em questão. No entanto, apesar da facilidade de desenvolvimento do data warehouse por meio desta arquitetura, ela facilita a criação de um data warehouse com redundância de dados. Por isso, é importante atentar para a conformidade das tabelas de dimensões dos DMs[1], a qual garante que não haja redundância de dados a medida que se constrói novos DMs. Na prática, a conformidade das tabelas de dimensões se traduz na utilização da mesma tabela de dimensões para datas em diferentes DMs, o que evita a redundância de dados. Para garantir esta conformidade das tabelas de dimensões entre DMs foi criada uma ferramenta chamada Data Warehouse Bus Matrix. Esta ferramenta é uma tabela na qual as linhas são os nomes dos DMs e as colunas são as tabelas de dimensões existentes no data warehouse. Nesta tabela, marca-se quais tabelas de dimensões cada DM contém, o que é importante para verificar quais tabelas podem ser utilizadas por mais de um DM e quantas tabelas de dimensões cada DM tem. 7

20 Capítulo 3 As Bases de Proveniência A palavra proveniência, segundo o dicionário Aurélio [9], significa: 1. Lugar de onde alguma coisa provém: procedência. 2. Fonte, procedência, origem.. Com essa definição em mente caracterizamos uma base de proveniência como uma base de dados cuja fonte, procedência ou origem vem de informações de experimentos científicos. As bases de proveniência, no que diz respeito a esse trabalho, são aquelas criadas no intuito de armazenar as informações relativas à execução de um determinado workflow científico. Com essas informações é possível validar os resultados obtidos ou utilizar os dados referentes às configurações de execuções anteriores como parâmetro para novas execuções. A base de proveniência cujas consultas foram utilizadas nesse trabalho foi oriunda do SciCumulus [10]: uma solução computacional para atender as fases do ciclo de vida de um workflow executado em nuvem PROV W3C A W3C (World Wide Web Consortium) [11] é uma comunidade internacional onde as organizações membros, profissionais em tempo integral e o público trabalham juntos para desenvolver padrões para a Web. A W3C possui uma família de especificações para modelar uma base de dados de proveniência, a PROV. De acordo com [12], proveniência é informação sobre entidades, atividades e pessoas envolvidas na produção de um conjunto de dados ou coisa, que podem ser usadas para formar avaliações sobre a sua qualidade, confiabilidade ou confiança. Segundo [10], o modelo de captura de proveniência do SciCumulus segue as recomendações do W3C e é apresentado abaixo na Figura 3. 8

21 Figura 3. Modelo de captura de proveniência do SciCumulus. Do modelo de dados acima, as principais entidades são: Atividade, Workflow e Cloud Activity. Estas entidades guardam os dados mais importantes de proveniência, que são os dados de tempo de execução de workflow, atividades do workflow e ativações de atividade, dados de quais execuções já foram terminadas, etc. Estes dados são importantes para a melhoria do desempenho de uma simulação que seja feita novamente por um usuário Somente Inserção de Dados Enquanto o workflow está em execução, os seus dados de proveniência estão sendo inseridos na base de dados. Os dados são apenas inseridos ou consultados, não havendo atualizações ou remoções dos valores dessa base de dados realizada 9

22 pelo programa que está executando o workflow ou pelos cientistas que a utilizam. Essa característica promove a necessidade de regras não tão rígidas quanto as impostas pelos bancos relacionais Mais voltado às consultas Como citado na subseção anterior, a base de dados sofre apenas inserção e consultas de dados. Porém, enquanto os dados para cada workflow são inseridos apenas uma vez, os dados referentes a ele podem ser consultados diversas vezes, por vários cientistas. Logo, o número de consultas realizadas sobre essa base de dados de proveniência é bem maior que o número referente às inserções feitas nela Alto volume de dados Paralelismo e Distribuição Os sistemas que gerenciam as execuções dos workflows podem gerar grandes volumes de dados, fazendo com que a base de dados gerenciada pelo SGBD possa crescer muito. Para trabalhar com essa grande quantidade de informação é interessante que as consultas possam ser realizadas de forma paralela em um ambiente otimizado, para que o tempo de resposta das mesmas seja reduzido, utilizando a presença de vários processadores e discos trabalhando paralelamente. Não só isso, mas também há o fato de que, usualmente, pesquisas não são conduzidas somente por um cientista ou por um grupo de pesquisa [13]. Por isso, a concepção de um armazenamento distribuído desses dados é bastante atraente. Não só por promover uma maior agilidade no trabalho de um grupo de pesquisa, mas também, por promover a possibilidade do uso da proveniência da execução da mesma simulação de outro grupo de pesquisa, podendo otimizar as execuções desta simulação, o que agiliza o trabalho de pesquisa Em geral as consultas estão pré-programadas para o cientista As consultas executadas pelos cientistas, em muitos casos, já se encontram prontas, uma vez que eles querem sempre as mesmas informações referentes às execuções de seus workflows. Elas são executadas por eles alterando apenas os seus parâmetros, para que os dados retornados por elas correspondam aos workflows escolhidos. Do mesmo modo ocorre nos SGWfC baseados no uso de proveniência tais como o SciCumulus. Assim, não há a necessidade de que o sistema gerenciador 10

23 de banco de dados possua suporte ao SQL (Structured Query Language), uma vez que as consultas podem ser respondidas com auxílio de linguagem de programação ou outro tipo de banco de dados sem SQL. Além disso, o modelo usado para armazenar os dados poderia ser melhorado em função das consultas que já se encontram prontas, usando um banco de dados não relacional que não possua uma forma rigorosa para criar o modelo de dados. 11

24 Capítulo 4 Implementação Neste capítulo serão apresentadas e descritas todas as informações relevantes sobre o processo da criação e execução dos experimentos. Como o objetivo do trabalho é avaliar o desempenho de um data warehouse distribuído que armazene os dados de proveniência, analisando o tempo de execução das consultas que foram desenvolvidas para serem executadas originalmente no PostgreSQL[3]. 4.1 Descrição dos esquemas No capítulo 3, foi descrito o esquema usado para armazenar os dados de proveniência do SciCumulus. Nesta seção, será descrita a criação do esquema do data warehouse a ser utilizado nos experimentos. No capítulo 2, foi explicitado como se constrói um data warehouse utilizando-se uma arquitetura bottom-up e modelo dimensional. Para o nosso DW, foram desenvolvidos 3 DMs: Activation, Workflow, Activity. No primeiro DM, são armazenadas as informações relativas a execução de ativações, ele contém cinco tabelas: Activation Executions, Date, Workflow, Activity, Time, Computer, a Figura 4 mostra como foi modelado o DM. No segundo DM, são armazenadas as informações relativas à execução de workflows, ele contém quatro tabelas: Workflow Executions, Workflow, Date, Time, a Figura 5 mostra como foi modelado o DM. No terceiro, e último, DM, são armazenadas as informações relativas a execução de atividades, ele contém cinco tabelas: Activity Executions, Activity, Workflow, Time, Date, a Figura 6 mostra como foi modelado o DM. Estes 3 DMs foram desenvolvidos de forma incremental e compõem o data warehouse. 12

25 Figura 4. Modelo de Dados para o DM Activation Figura 5. Modelo de Dados para o DM Workflow 13

26 Figura 6. Modelo de Dados para o DM Activity. Neste data warehouse, as tabelas Activity Executions, Workflow Executions e Activation Executions são as tabelas de fatos, e as tabelas Time, Date, Workflow, Date e Computer são as tabelas de dimensões. 4.2 Implementação Física Nesta seção será descrita quais foram os passos para a implementação do datawarehouse distribuído na nuvem. Inicialmente, o datawarehouse foi implementado no PostgreSQL[3], que está hospedado em um servidor da Amazon[4]. A implementação, neste caso, não foi distribuída, mas, somente, em um servidor. 14

27 Após a implementação inicial no servidor da Amazon, prosseguiu-se para a implementação de um datawarehouse distribuído. Houve a tentativa de fazer esta implementação em várias soluções de SGBDs paralelos em busca de uma que atendesse aos requisitos. Isto se deu, pois o ambiente da nuvem torna a implementação de um banco de dados distribuído mais complexa. As soluções de paralelismo existentes nem sempre são adaptáveis para serem usadas na nuvem, o que motivou a procura por diversas soluções, como irá ser demonstrado abaixo. A primeira alternativa, foi procurar uma solução para paralelismo já oferecida pelo PostgreSQL. No entanto, até o presente momento, só é possível ter um banco de dados paralelo com o uso de software externo desenvolvido por si mesmo [5]. A segunda alternativa, foi o plugin PgPool-II [6], que pode ser integrado ao PostgreSQL para a criação de bancos de dados paralelos, só necessitando de ter os bancos de dados criados em cada servidor que será utilizado para a criação do banco de dados paralelo. No entanto, o plugin se mostrou incompatível com o PostgreSQL (pelo menos para nuvem) e incompleto, apresentando diversos problemas mesmo quando somente implementando o banco de dados mostrado no tutorial. A terceira alternativa, foi o software Postgres-XC [7], que é uma versão do PostgreSQL com recursos para paralelismo. No entanto, ela só oferece o recurso da replicação de bancos de dados em diferentes servidores. A quarta alternativa, foi o software SQL Server [8], que é um SGBD oferecido pela Microsoft. É um SGBD robusto, oferecendo bom desempenho para consultas em Bancos de Dados com enormes quantidades de dados. No entanto, este SGBD não oferece solução para bancos de dados paralelos na nuvem. O único paralelismo utilizado neste SGBD é no momento de fazer uma consulta ao banco de dados, utilizando-se dos núcleos do processador para paralelizar a execução desta consulta. Por fim, foi utilizado o software NuoDB [14], que oferece uma solução de paralelismo na nuvem. Este software é um SGBD com suporte a paralelismo, oferecendo o uso de banco de dados paralelos em 2 ou mais servidores. Todas as operações a serem feitas no NuoDB podem ser feitas por uma interface web. Foi necessário implementar o data warehouse novamente no NuoDB devido ao fato de não ser integrado ao PostgreSQL e por ter pequenas diferenças na hora da criação de tabelas. É possível, também, modificar o banco de dados paralelo de qualquer dos servidores usados por ele. 15

28 4.3 Descrição das Consultas As consultas escolhidas foram apontadas pelos especialistas como sendo um conjunto representativo do universo de consultas utilizadas. Cada uma delas apresenta ao cientista informações sobre os experimentos, que são sinalizados para as consultas por meio de parâmetros, gerando assim uma espécie de relatório sobre os mesmos. As consultas escolhidas seguiram o critério de determinação de consultas representativas do universo de consultas utilizadas apresentado em [15]. O que torna a análise de desempenho destas consultas uma análise representativa do caso real Consulta 1 SELECT a.tag, a.description FROM hactivity a, hworkflow w WHERE a.wkfid=w.wkfid and w.tag like '%Scimultaneous%' Esta consulta lista o nome e a descrição das atividades de um determinado workflow. Como pode ser visto, o parâmetro w.tag é quem filtra o resultado por nome de workflow Consulta 2 SELECT a.tag, t.taskid FROM hactivation t, hactivity a, hworkflow w WHERE w.wkfid = a.wkfid and a.actid = t.actid and w.tag ='SciPhy' ORDER BY a.tag Esta consulta lista as ativações de cada atividade de um workflow especificado pelo usuário. Como pode ser visto, o parâmetro w.tag é quem filtra o resultado por nome de workflow Consulta 3 SELECT a.actid, a.tag, a.status FROM hactivity a, hworkflow w WHERE a.wkfid=w.wkfid and w.tag like '%SciPhylomics%' and a.status<> 'FINISHED' 16

29 Esta consulta lista as atividades que não terminaram de ser executadas, seja por estarem ainda sendo executadas ou por sua execução ter sido interrompida inesperadamente. Como pode ser visto, o parâmetro w.tag é quem filtra o resultado por nome de workflow e o parâmetro a.status é quem filtra o resultado por status de execução Consulta 4 SELECT a.actid, a.tag, date_part('epoch',endtime - starttime )*1000 as duracao FROM hactivity a, hworkflow w WHERE a.wkfid=w.wkfid and a.status= 'FINISHED' and w.tag like '%SciEvol%' Esta consulta lista a duração da execução das atividades que já tiveram sua execução completa de um determinado workflow. Como pode ser visto, o parâmetro w.tag é quem filtra o resultado por nome de workflow e o parâmetro a.status é quem filtra o resultado por status de execução Consulta 5 SELECT a.actid, a.tag, starttime FROM hactivity a, hworkflow w WHERE a.wkfid=w.wkfid and w.tag like '%Scimultaneous%' and a.status='running' Esta consulta lista o instante de início de execução das atividades que não tiveram sua execução completa de um determinado workflow. Como pode ser visto, o parâmetro w.tag é quem filtra o resultado por nome de workflow e o parâmetro a.status é quem filtra o resultado por status de execução Consulta 6 SELECT x.taskid, date_part('epoch',x.endtime - x.starttime )*1000 as duracao FROM hactivity a, hactivation x WHERE a.actid=x.actid and a.tag='raxml' and x.status='finished' 17

30 Esta consulta lista a duração da execução das ativações que já tiveram sua execução completa de uma determinada atividade. Como pode ser visto, o parâmetro a.tag é quem filtra o resultado por nome de atividade e o parâmetro x.status é quem filtra o resultado por status de execução Consulta 7 SELECT x.taskid, x.exitstatus, x.terr FROM hactivity a, hworkflow w, hactivation x WHERE a.wkfid=w.wkfid and a.actid=x.actid and (w.tag like '%scievol%' or w.tag like '%SciEvol%') and x.exitstatus<>0 Esta consulta lista as mensagens de erro das ativações que tiveram um erro em sua execução para um workflow determinado. Como pode ser visto, o parâmetro w.tag é quem filtra o resultado por nome de workflow e o parâmetro x.exitstatus é quem filtra o resultado por status de execução Consulta 8 SELECT w.wkfid, w.tag from hworkflow w WHERE exists (select 1 from hworkflow w2, hactivity a where w2.wkfid = w.wkfid and w2.wkfid = a.wkfid and a.tag = 'modelgenerator') Esta consulta lista todos os workflows que contém uma atividade específica. Como pode ser visto, o parâmetro a.tag é quem filtra o resultado por nome de atividade Consulta 9 SELECT w.wkfid,w.tag,a.tag,t.exitstatus,t.processor,t.workspace,t.status, 3799,5809 t.endtime,t.starttime, extract ('epoch' from (t.endtime-t.starttime)) ',' as duration FROM hworkflow w, hactivity a, hactivation t WHERE w.wkfid = a.wkfid and a.actid = t.actid and not exists (select * from hactivation a2 where a2.actid = a.actid and a2.exitstatus <> 0) 18

31 Esta consulta lista, por ordem crescente de execuções dos workflows, as datas e horas de início e término, nomes dos workflows e suas descrições, bem como o nome de todas as atividades associadas a todas as execuções dos workflows que foram executados e que não contenham nenhuma ativação que executou com erro. 4.4 Análise de Desempenho Nesta seção, serão expostos os resultados das consultas no banco de dados relacional, no data warehouse e no data warehouse distribuído, com o objetivo de analisar o desempenho das consultas nas diferentes soluções. Os computadores utilizados como servidores têm as seguintes configurações: Windows Server 2008 R2, processador intel i GHz, 8 GB de memória RAM e 50 GB de HD. Nas Figura 7, Figura 8, Figura 9, Figura 10, Figura 11 e Figura 12, temos os gráficos mostrando de forma comparativa os resultados de cada consulta. É interessante notar que nos casos em que a diferença de desempenho é pequena, esta diferença continua sendo importante, pois estas consultas são executadas muitas vezes seguidas, o que significa que uma diferença de 0,1s em uma execução de consulta, pode se tornar 100s se executarmos esta consulta 1000 vezes. Figura 7. Gráfico comparativo dos tempos de execução da consulta 1. 19

32 Figura 8. Gráfico comparativo dos tempos de execução da consulta 2. Figura 9. Gráfico comparativo dos tempos de execução da consulta 3. Figura 10. Gráfico comparativo dos tempos de execução da consulta 4. 20

33 Figura 11. Gráfico comparativo dos tempos de execução da consulta 5. Figura 12. Gráfico comparativo dos tempos de execução da consulta 6. Figura 13. Gráfico comparativo dos tempos de execução da consulta 7. 21

34 Figura 14. Gráfico comparativo dos tempos de execução da consulta 8. Figura 15. Gráfico comparativo dos tempos de execução da consulta 9. Na tabela abaixo, estão expostos os resultados para todas as consultas, para uma análise quantitativa. Consultas Banco de Dados Relacional Datawarehouse Datawarehouse distribuído Consulta 1 0,71s 0,16s 0,09s Consulta 2 3,3s 0,20s 0,11s Consulta 3 0,51s 0,25s 0,19s Consulta 4 0,70s 0,16s 0,08s Consulta 5 0,62s 0,21s 0,10s Consulta 6 0,70s 0,16s 0,10s Consulta 7 0,82s 0,24s 0,12s Consulta 8 0,82s 0,32s 0,20s Consulta 9 5,1s 0,52s 0,23s Tabela 1. Tabela contendo os tempos de execução para cada consulta e para cada solução. 22

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP.

DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. DESENVOLVIMENTO DE PLUG-INS KETTLE PARA GERAÇÃO DE MONDRIAN SCHEMA A PARTIR DE BASES RELACIONAIS, UTILIZANDO A METODOLOGIA AGILE ROLAP. Eduardo Cristovo de Freitas Aguiar (PIBIC/CNPq), André Luís Andrade

Leia mais

Prova INSS RJ - 2007 cargo: Fiscal de Rendas

Prova INSS RJ - 2007 cargo: Fiscal de Rendas Prova INSS RJ - 2007 cargo: Fiscal de Rendas Material de Apoio de Informática - Prof(a) Ana Lucia 53. Uma rede de microcomputadores acessa os recursos da Internet e utiliza o endereço IP 138.159.0.0/16,

Leia mais

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.

SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4. SUMÁRIO 1. INTRODUÇÃO... 2 2. O QUE É DATA WAREHOUSE?... 2 3. O QUE DATA WAREHOUSE NÃO É... 4 4. IMPORTANTE SABER SOBRE DATA WAREHOUSE... 5 4.1 Armazenamento... 5 4.2 Modelagem... 6 4.3 Metadado... 6 4.4

Leia mais

Bases de Dados aplicadas a Inteligência de Negócios

Bases de Dados aplicadas a Inteligência de Negócios Agenda Bases de Dados aplicadas a Inteligência de Negócios Professor Sérgio Rodrigues professor@sergiorodrigues.net Sistemas de Gerenciamento de Bancos de Dados (SGBD) Tipos de Banco de Dados Noções de

Leia mais

2 Auto-sintonia de Bancos de Dados e Agentes de Software

2 Auto-sintonia de Bancos de Dados e Agentes de Software 2 Auto-sintonia de Bancos de Dados e Agentes de Software A uso da abordagem de agentes de software 1 pode trazer benefícios a áreas de aplicação em que é necessário construir sistemas autônomos, ou seja,

Leia mais

Estatística Básica via MySQL para Pesquisas On-Line

Estatística Básica via MySQL para Pesquisas On-Line Estatística Básica via MySQL para Pesquisas On-Line Gabriel Ramos Guerreiro - DEs, UFSCar 1 2 Anderson Luiz Ara-Souza - DEs, UFSCar 1 3 Francisco Louzada-Neto - DEs, UFSCar 1 4 1. INTRODUÇÃO Segundo Cavalcanti

Leia mais

Administração de Banco de Dados

Administração de Banco de Dados Administração de Banco de Dados Professora conteudista: Cida Atum Sumário Administração de Banco de Dados Unidade I 1 INTRODUÇÃO A BANCO DE DADOS...1 1.1 Histórico...1 1.2 Definições...2 1.3 Importância

Leia mais

5 Implantação. 5.1. Plano do Piloto

5 Implantação. 5.1. Plano do Piloto 5 Implantação Neste capítulo será abordada a fase de implantação do novo sistema de gerenciamento de conhecimento baseado em Web Semântica. O capítulo 4 (Desenvolvimento) modelou, arquitetou e desenvolveu

Leia mais

PRÁTICAS E FERRAMENTAS PARA OTIMIZAÇÃO DO DESEMPENHO DE BANCO DE DADOS SQL SERVER

PRÁTICAS E FERRAMENTAS PARA OTIMIZAÇÃO DO DESEMPENHO DE BANCO DE DADOS SQL SERVER PRÁTICAS E FERRAMENTAS PARA OTIMIZAÇÃO DO DESEMPENHO DE BANCO DE DADOS SQL SERVER Renan Gonçalves JAYME1 Ana Paula Ambrosio ZANELATO2 RESUMO: O presente artigo tem como objetivo descrever algumas práticas

Leia mais

Banco de Dados, Integração e Qualidade de Dados. Ceça Moraes cecafac@gmail.com

Banco de Dados, Integração e Qualidade de Dados. Ceça Moraes cecafac@gmail.com Banco de Dados, Integração e Qualidade de Dados Ceça Moraes cecafac@gmail.com Sobre a professora CeçaMoraes Doutora em Computação (UFPE) Áreas de atuação Desenvolvimento de Software e Banco de Dados Experiência

Leia mais

Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores

Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores Disciplina - Sistemas Distribuídos Prof. Andrey Halysson Lima Barbosa Aula 12 Computação em Nuvem Sumário Introdução Arquitetura Provedores

Leia mais

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Aula 2 Computação em Nuvem Desafios e Oportunidades A Computação em Nuvem

Leia mais

DATA WAREHOUSE. Introdução

DATA WAREHOUSE. Introdução DATA WAREHOUSE Introdução O grande crescimento do ambiente de negócios, médias e grandes empresas armazenam também um alto volume de informações, onde que juntamente com a tecnologia da informação, a correta

Leia mais

SISTEMA GERENCIADOR DE BANCO DE DADOS

SISTEMA GERENCIADOR DE BANCO DE DADOS BANCO DE DADOS Universidade do Estado de Santa Catarina Centro de Ciências Tecnológicas Departamento de Ciência da Computação Prof. Alexandre Veloso de Matos alexandre.matos@udesc.br SISTEMA GERENCIADOR

Leia mais

Heurísticas para Controle de Execução de Atividades de Workflows Científicos na Nuvem 1

Heurísticas para Controle de Execução de Atividades de Workflows Científicos na Nuvem 1 Heurísticas para Controle de Execução de Atividades de Workflows Científicos na Nuvem 1 Flavio da Silva Costa Orientadora: Marta Mattoso Colaborador: Daniel de Oliveira Nível: Mestrado Programa de Engenharia

Leia mais

Carlos Eduardo Paulino Silva

Carlos Eduardo Paulino Silva CAPTURA DE DADOS DE PROVENIÊNCIA DE WORKFLOWS CIENTÍFICOS EM NUVENS COMPUTACIONAIS Carlos Eduardo Paulino Silva Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia de Sistemas

Leia mais

Modelo de dados do Data Warehouse

Modelo de dados do Data Warehouse Modelo de dados do Data Warehouse Ricardo Andreatto O modelo de dados tem um papel fundamental para o desenvolvimento interativo do data warehouse. Quando os esforços de desenvolvimentos são baseados em

Leia mais

Roteiro 2 Conceitos Gerais

Roteiro 2 Conceitos Gerais Roteiro 2 Conceitos Gerais Objetivos: UC Projeto de Banco de Dados Explorar conceitos gerais de bancos de dados; o Arquitetura de bancos de dados: esquemas, categorias de modelos de dados, linguagens e

Leia mais

Luciana da Silva Almendra Gomes. Proveniência para Workflows de Bioinformática

Luciana da Silva Almendra Gomes. Proveniência para Workflows de Bioinformática Luciana da Silva Almendra Gomes Proveniência para Workflows de Bioinformática Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo Programa de Pós-

Leia mais

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados.

Hoje é inegável que a sobrevivência das organizações depende de dados precisos e atualizados. BANCO DE DADOS Universidade do Estado de Santa Catarina Centro de Ciências Tecnológicas Departamento de Ciência da Computação Prof. Alexandre Veloso de Matos alexandre.matos@udesc.br INTRODUÇÃO Hoje é

Leia mais

Banco de Dados - Senado

Banco de Dados - Senado Banco de Dados - Senado Exercícios OLAP - CESPE Material preparado: Prof. Marcio Vitorino OLAP Material preparado: Prof. Marcio Vitorino Soluções MOLAP promovem maior independência de fornecedores de SGBDs

Leia mais

Conversão de Base de Dados Relacional para Dimensional para Business Intelligence Utilizando Banco de Dados Mysql

Conversão de Base de Dados Relacional para Dimensional para Business Intelligence Utilizando Banco de Dados Mysql Conversão de Base de Dados Relacional para Dimensional para Business Intelligence Utilizando Banco de Dados Mysql Carlos H. Cardoso 1, Roberto D Nebo 1, Luis A. da Silva 1 1 Curso de Tecnologia em Banco

Leia mais

FERRAMENTAS PARA DESENVOLVIMENTO EM C#

FERRAMENTAS PARA DESENVOLVIMENTO EM C# FERRAMENTAS PARA DESENVOLVIMENTO EM C# Camila Sanches Navarro 1,2, Wyllian Fressatti 2 ¹Universidade paranaense (Unipar) Paranavaí PR Brasil sanchesnavarro@gmail.com wyllian@unipar.br Resumo. Este artigo

Leia mais

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado)

UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) UNIVERSIDADE REGIONAL DE BLUMENAU CENTRO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE CIÊNCIAS DA COMPUTAÇÃO (Bacharelado) SISTEMA INTERNO INTEGRADO PARA CONTROLE DE TAREFAS INTERNAS DE UMA EMPRESA DE DESENVOLVIMENTO

Leia mais

Soluções de Acessibilidade. VLibras - Desktop. Manual de Instalação da Ferramenta. Microsoft Windows R. Núcleo de Pesquisa e Extensão / LAViD

Soluções de Acessibilidade. VLibras - Desktop. Manual de Instalação da Ferramenta. Microsoft Windows R. Núcleo de Pesquisa e Extensão / LAViD Soluções de Acessibilidade VLibras - Desktop Manual de Instalação da Ferramenta Microsoft Windows R Núcleo de Pesquisa e Extensão / LAViD 2015 INTRODUÇÃO Objetivo Este manual contém introdução e informações

Leia mais

PROPOSTA DE SOFTWARE DE INSTALAÇÃO PARA UM AMBIENTE INTEGRADO DE GERÊNCIA DE PROJETOS E DE PROCESSOS DE NEGÓCIOS

PROPOSTA DE SOFTWARE DE INSTALAÇÃO PARA UM AMBIENTE INTEGRADO DE GERÊNCIA DE PROJETOS E DE PROCESSOS DE NEGÓCIOS PROPOSTA DE SOFTWARE DE INSTALAÇÃO PARA UM AMBIENTE INTEGRADO DE GERÊNCIA DE PROJETOS E DE PROCESSOS DE NEGÓCIOS Élysson Mendes Rezende Bacharelando em Sistemas de Informação Bolsista de Iniciação Científica

Leia mais

Análise de Desempenho de um SGBD para Aglomerado de Computadores

Análise de Desempenho de um SGBD para Aglomerado de Computadores Análise de Desempenho de um SGBD para Aglomerado de Computadores Diego Luís Kreutz, Gabriela Jacques da Silva, Hélio Antônio Miranda da Silva, João Carlos Damasceno Lima Curso de Ciência da Computação

Leia mais

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br

Data Warehousing. Leonardo da Silva Leandro. CIn.ufpe.br Data Warehousing Leonardo da Silva Leandro Agenda Conceito Elementos básicos de um DW Arquitetura do DW Top-Down Bottom-Up Distribuído Modelo de Dados Estrela Snowflake Aplicação Conceito Em português:

Leia mais

Servidor de OpenLAB Data Store A.02.01 Lista de Preparação do Local. Objetivo do Procedimento. Responsabilidades do cliente

Servidor de OpenLAB Data Store A.02.01 Lista de Preparação do Local. Objetivo do Procedimento. Responsabilidades do cliente Servidor Lista de Preparação de OpenLAB do Data Local Store A.02.01 Objetivo do Procedimento Assegurar que a instalação do Servidor de OpenLAB Data Store pode ser concluída com sucesso por meio de preparação

Leia mais

TEMPTOOL UMA FERRAMENTA PARA A MODELAGEM TEMPORAL DOS DADOS

TEMPTOOL UMA FERRAMENTA PARA A MODELAGEM TEMPORAL DOS DADOS TEMPTOOL UMA FERRAMENTA PARA A MODELAGEM TEMPORAL DOS DADOS Eugênio de O. Simonetto 1, Cristiano R. Moreira, Duncan D. A. Ruiz 2, Luciano C. Ost 1, Glauco B.V.Santos 1 RESUMO O trabalho apresenta uma ferramenta

Leia mais

Uso de interfaces amigáveis para elaboração de consultas a sistemas OLAP

Uso de interfaces amigáveis para elaboração de consultas a sistemas OLAP Uso de interfaces amigáveis para elaboração de consultas a sistemas OLAP Mariana Duprat, Esdi/Uerj/Andre Monat, Esdi/Uerj Palavras-Chave: OLAP interface MDX Resumo Esse artigo elabora a proposta de um

Leia mais

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd.

Para construção dos modelos físicos, será estudado o modelo Relacional como originalmente proposto por Codd. Apresentação Este curso tem como objetivo, oferecer uma noção geral sobre a construção de sistemas de banco de dados. Para isto, é necessário estudar modelos para a construção de projetos lógicos de bancos

Leia mais

LEI DE ACESSO A INFORMAÇÃO DIREITO DO CIDADÃO

LEI DE ACESSO A INFORMAÇÃO DIREITO DO CIDADÃO DESCRIÇÃO DO SIGAI O SIGAI (Sistema Integrado de Gestão do Acesso à Informação) é uma solução de software que foi desenvolvida para automatizar os processos administrativos e operacionais visando a atender

Leia mais

CENTRO UNIVERSITÁRIO UNA DIRETORIA DE EDUCAÇÃO CONTINUADA, PESQUISA E EXTENSÃO CURSO DE PÓS GRADUAÇÃO ENGENHARIA DE SOFTWARE

CENTRO UNIVERSITÁRIO UNA DIRETORIA DE EDUCAÇÃO CONTINUADA, PESQUISA E EXTENSÃO CURSO DE PÓS GRADUAÇÃO ENGENHARIA DE SOFTWARE CENTRO UNIVERSITÁRIO UNA DIRETORIA DE EDUCAÇÃO CONTINUADA, PESQUISA E EXTENSÃO CURSO DE PÓS GRADUAÇÃO ENGENHARIA DE SOFTWARE NoSQL Banco de Dados Não Relacional ALUNO: Heitor Oliveira Silva PROFESSOR ORIENTADOR:

Leia mais

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3.

Aplicação A. Aplicação B. Aplicação C. Aplicação D. Aplicação E. Aplicação F. Aplicação A REL 1 REL 2. Aplicação B REL 3. Sumário Data Warehouse Modelagem Multidimensional. Data Mining BI - Business Inteligence. 1 2 Introdução Aplicações do negócio: constituem as aplicações que dão suporte ao dia a dia do negócio da empresa,

Leia mais

Banco de Dados. Prof. Dr. Rogério Galante Negri

Banco de Dados. Prof. Dr. Rogério Galante Negri Banco de Dados Prof Dr Rogério Galante Negri Tradicionalmente O armazenamento dos dados utilizava arquivos individuais, sem nenhum relacionamento Cada programa utilizava seu próprio sistema de arquivo

Leia mais

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse

Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Uma Arquitetura de Gestão de Dados em Ambiente Data Warehouse Alcione Benacchio (UFPR) E mail: alcione@inf.ufpr.br Maria Salete Marcon Gomes Vaz (UEPG, UFPR) E mail: salete@uepg.br Resumo: O ambiente de

Leia mais

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse

Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse. Fases para um Projeto de Data Warehouse Definição escopo do projeto (departamental, empresarial) Grau de redundância dos dados(ods, data staging) Tipo de usuário alvo (executivos, unidades) Definição do ambiente (relatórios e consultas préestruturadas

Leia mais

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5

Sistemas de Informação James A. O Brien Editora Saraiva Capítulo 5 Para entender bancos de dados, é útil ter em mente que os elementos de dados que os compõem são divididos em níveis hierárquicos. Esses elementos de dados lógicos constituem os conceitos de dados básicos

Leia mais

Data Warehouse Processos e Arquitetura

Data Warehouse Processos e Arquitetura Data Warehouse - definições: Coleção de dados orientada a assunto, integrada, não volátil e variável em relação ao tempo, que tem por objetivo dar apoio aos processos de tomada de decisão (Inmon, 1997)

Leia mais

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo tiagodemelo@gmail.com. http://www.tiagodemelo.info

Bancos de dados distribuídos Prof. Tiago Eugenio de Melo tiagodemelo@gmail.com. http://www.tiagodemelo.info Bancos de dados distribuídos Prof. Tiago Eugenio de Melo tiagodemelo@gmail.com Última atualização: 20.03.2013 Conceitos Banco de dados distribuídos pode ser entendido como uma coleção de múltiplos bds

Leia mais

4 Implementação e Resultados Experimentais

4 Implementação e Resultados Experimentais 4 Implementação e Resultados Experimentais Com o objetivo de fazer a criação automática de visões materializadas, ou seja, prover uma solução on-the-fly para o problema de seleção de visões materializadas,

Leia mais

23/05/12. Computação em Nuvem. Computação em nuvem: gerenciamento de dados. Computação em Nuvem - Características principais

23/05/12. Computação em Nuvem. Computação em nuvem: gerenciamento de dados. Computação em Nuvem - Características principais Computação em Nuvem Computação em nuvem: gerenciamento de dados Computação em nuvem (Cloud Computing) é uma tendência recente de tecnologia cujo objetivo é proporcionar serviços de Tecnologia da Informação

Leia mais

Bem-vindo à apresentação do SAP Business One.

Bem-vindo à apresentação do SAP Business One. Bem-vindo à apresentação do SAP Business One. Neste tópico, responderemos à pergunta: O que é o Business One? Definiremos o SAP Business One e discutiremos as opções e as plataformas disponíveis para executar

Leia mais

Um Simulador para Avaliação da Antecipação de Tarefas em Sistemas Gerenciadores de Workflow

Um Simulador para Avaliação da Antecipação de Tarefas em Sistemas Gerenciadores de Workflow Um Simulador para Avaliação da Antecipação de Tarefas em Sistemas Gerenciadores de Workflow Resumo. A fim de flexibilizar o fluxo de controle e o fluxo de dados em Sistemas Gerenciadores de Workflow (SGWf),

Leia mais

CLOUD COMPUTING. Andrêza Leite. andreza.leite@univasf.edu.br

CLOUD COMPUTING. Andrêza Leite. andreza.leite@univasf.edu.br CLOUD COMPUTING Andrêza Leite andreza.leite@univasf.edu.br Roteiro O que é cloud computing? Classificação O que está 'por traz' da cloud? Exemplos Como montar a sua? O que é cloud computing? Cloud Computing

Leia mais

UNIVERSIDADE ESTADUAL DO CENTRO-OESTE UNICENTRO CURSO DE ESPECIALIZAÇÃO EM MÍDIAS EM EDUCAÇÃO

UNIVERSIDADE ESTADUAL DO CENTRO-OESTE UNICENTRO CURSO DE ESPECIALIZAÇÃO EM MÍDIAS EM EDUCAÇÃO UNIVERSIDADE ESTADUAL DO CENTRO-OESTE UNICENTRO CURSO DE ESPECIALIZAÇÃO EM MÍDIAS EM EDUCAÇÃO Jader dos Santos Teles Cordeiro Orientador Prof. Paulo Guilhermeti PERSISTÊNCIA EM OBJETOS JAVA: UMA ANÁLISE

Leia mais

PROGRAMAÇÃO MVC E ZEND FRAMEWORK

PROGRAMAÇÃO MVC E ZEND FRAMEWORK PROGRAMAÇÃO MVC E ZEND FRAMEWORK MVC PROGRAMMING AND ZEND FRAMEWORK Rodolfo Vinícius Moimas Dias Centro Universitário Filadélfia de Londrina UniFil Rafael Francovig Cavicchioli Centro Universitário Filadélfia

Leia mais

ATIVIDADES PRÁTICAS SUPERVISIONADAS

ATIVIDADES PRÁTICAS SUPERVISIONADAS ATIVIDADES PRÁTICAS SUPERVISIONADAS Ciência da Computação 5ª série Sistemas Operacionais A atividade prática supervisionada (ATPS) é um método de ensinoaprendizagem desenvolvido por meio de um conjunto

Leia mais

Modelagem Multidimensional: Esquema Estrela

Modelagem Multidimensional: Esquema Estrela BANCO DE DADOS DISTRIBUÍDOS e DATAWAREHOUSING http://www.uniriotec.br/~tanaka/tin0036 tanaka@uniriotec.br Modelagem Dimensional Conceitos Básicos Modelagem Multidimensional: Esquema Estrela Proposto por

Leia mais

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011

Banco de Dados. Aula 1 - Prof. Bruno Moreno 16/08/2011 Banco de Dados Aula 1 - Prof. Bruno Moreno 16/08/2011 Roteiro Apresentação do professor e disciplina Definição de Banco de Dados Sistema de BD vs Tradicional Principais características de BD Natureza autodescritiva

Leia mais

SISTEMA DE WORKFLOW PARA MODELAGEM E EXECUÇÃO DE PROCESSOS DE SOFTWARE. Aluno: Roberto Reinert Orientador: Everaldo A. Grahl

SISTEMA DE WORKFLOW PARA MODELAGEM E EXECUÇÃO DE PROCESSOS DE SOFTWARE. Aluno: Roberto Reinert Orientador: Everaldo A. Grahl SISTEMA DE WORKFLOW PARA MODELAGEM E EXECUÇÃO DE PROCESSOS DE SOFTWARE Aluno: Roberto Reinert Orientador: Everaldo A. Grahl Roteiro de apresentação Introdução Objetivos Fundamentação Teórica Workflow Processo

Leia mais

Banco de Dados I. 1. Conceitos de Banco de Dados

Banco de Dados I. 1. Conceitos de Banco de Dados Banco de Dados I 1. Conceitos de Banco de Dados 1.1. Características de um Banco de Dados. 1.2. Vantagens na utilização de um BD. 1.3. Quando usar e não usar um Banco de Dados. 1.4. Modelos, Esquemas e

Leia mais

Sistema de Ordens de Serviço HDA Soluções em Informática

Sistema de Ordens de Serviço HDA Soluções em Informática UNIVERSIDADE CATÓLICA DE PELOTAS CENTRO POLITÉCNICO Curso Superior de Graduação em ANÁLISE E DESENVOLVIMENTO DE SISTEMAS Sistema de Ordens de Serviço HDA Soluções em Informática Por AUGUSTO CARRICONDE

Leia mais

Introdução a Banco de Dados

Introdução a Banco de Dados Introdução a Banco de Dados O modelo relacional Marta Mattoso Sumário Introdução Motivação Serviços de um SGBD O Modelo Relacional As aplicações não convencionais O Modelo Orientado a Objetos Considerações

Leia mais

RELATÓRIO DE ATIVIDADES DISCIPLINA: ARQUITETURAS PARALELAS. Hadoop e QEF: Uma abordagem distribuída para aplicações de Astronomia

RELATÓRIO DE ATIVIDADES DISCIPLINA: ARQUITETURAS PARALELAS. Hadoop e QEF: Uma abordagem distribuída para aplicações de Astronomia UNIVERSIDADE FEDERAL FLUMINENSE INSTITUTO DE COMPUTAÇÃO (IC) RELATÓRIO DE ATIVIDADES DISCIPLINA: ARQUITETURAS PARALELAS Hadoop e QEF: Uma abordagem distribuída para aplicações de Astronomia Henrique Klôh

Leia mais

PORTARIA N Nº 184 Rio de Janeiro, 27 de dezembro de 2012.

PORTARIA N Nº 184 Rio de Janeiro, 27 de dezembro de 2012. PORTARIA N Nº 184 Rio de Janeiro, 27 de dezembro de. ACRESCENTA A ARQUITETURA DE PADRÕES TECNOLÓGICOS DE INTEROPERABILIDADE -, NO SEGMENTO RECURSOS TECNOLÓGICOS, O PADRÃO TECNOLÓGICO SISTEMAS DE GERENCIAMENTO

Leia mais

BANCO DE DADOS. info 3º ano. Prof. Diemesleno Souza Carvalho diemesleno@iftm.edu.br www.diemesleno.com.br

BANCO DE DADOS. info 3º ano. Prof. Diemesleno Souza Carvalho diemesleno@iftm.edu.br www.diemesleno.com.br BANCO DE DADOS info 3º ano Prof. Diemesleno Souza Carvalho diemesleno@iftm.edu.br www.diemesleno.com.br BANCO DE DADOS Unidade 1 - Introdução Dados; Banco de Dados; Base de Dados; Projeto de Banco de Dados.

Leia mais

Documento de Arquitetura

Documento de Arquitetura Documento de Arquitetura A2MEPonto - SISTEMA DE PONTO ELETRÔNICO A2MEPonto - SISTEMA DE PONTO ELETRÔNICO #1 Pág. 1 de 11 HISTÓRICO DE REVISÕES Data Versão Descrição Autor 28/10/2010 1 Elaboração do documento

Leia mais

Introdução a Informática. Prof.: Roberto Franciscatto

Introdução a Informática. Prof.: Roberto Franciscatto Introdução a Informática Prof.: Roberto Franciscatto 6.1 ARQUIVOS E REGISTROS De um modo geral os dados estão organizados em arquivos. Define-se arquivo como um conjunto de informações referentes aos elementos

Leia mais

SciCumulus 2.0: Um Sistema de Gerência de Workflows Científicos para Nuvens Orientado a Fluxo de Dados *

SciCumulus 2.0: Um Sistema de Gerência de Workflows Científicos para Nuvens Orientado a Fluxo de Dados * paper:6 SciCumulus 2.0: Um Sistema de Gerência de Workflows Científicos para Nuvens Orientado a Fluxo de Dados * Vítor Silva 1, Daniel de Oliveira 2 e Marta Mattoso 1 1 COPPE Universidade Federal do Rio

Leia mais

UNIVERSIDADE CATÓLICA DE PELOTAS CENTRO POLITÉCNICO TECNÓLOGO EM ANALISE E DESENVOLVIMENTO DE SISTEMAS

UNIVERSIDADE CATÓLICA DE PELOTAS CENTRO POLITÉCNICO TECNÓLOGO EM ANALISE E DESENVOLVIMENTO DE SISTEMAS UNIVERSIDADE CATÓLICA DE PELOTAS CENTRO POLITÉCNICO TECNÓLOGO EM ANALISE E DESENVOLVIMENTO DE SISTEMAS Sistema de Controle de Viaturas por Pablo Wasculewsky de Matos Orientador: Prof. Me. André Vinicius

Leia mais

CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE

CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE CAPITULO 4 A ARQUITETURA LÓGICA PARA O AMBIENTE A proposta para o ambiente apresentada neste trabalho é baseada no conjunto de requisitos levantados no capítulo anterior. Este levantamento, sugere uma

Leia mais

Guia de Introdução ao Symantec Protection Center. Versão 2.0

Guia de Introdução ao Symantec Protection Center. Versão 2.0 Guia de Introdução ao Symantec Protection Center Versão 2.0 Guia de Introdução ao Symantec Protection Center O software descrito neste documento é fornecido sob um contrato de licença e pode ser usado

Leia mais

SISTEMA GERENCIAL TRATORPLAN

SISTEMA GERENCIAL TRATORPLAN SISTEMA GERENCIAL TRATORPLAN SIGET Fabrício Pereira Santana¹, Jaime William Dias¹, ², Ricardo de Melo Germano¹ ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil fabricioblack@gmail.com germano@unipar.br

Leia mais

Ricardo Gomes Clemente. Uma arquitetura para processamento de eventos de log em tempo real. Dissertação de Mestrado

Ricardo Gomes Clemente. Uma arquitetura para processamento de eventos de log em tempo real. Dissertação de Mestrado 1 Ricardo Gomes Clemente Uma arquitetura para processamento de eventos de log em tempo real Dissertação de Mestrado Dissertação apresentada como requisito parcial para obtenção do título de Mestre pelo

Leia mais

EUCALYPTUS: UMA PLATAFORMA CLOUD COMPUTING PARA

EUCALYPTUS: UMA PLATAFORMA CLOUD COMPUTING PARA EUCALYPTUS: UMA PLATAFORMA CLOUD COMPUTING PARA QUALQUER TIPO DE USUÁRIO Gustavo Henrique Rodrigues Pinto Tomas 317624 AGENDA Introdução: Cloud Computing Modelos de Implementação Modelos de Serviço Eucalyptus

Leia mais

AVALIAÇÃO DE CONSULTAS EXECUTADAS SOBRE BASES DE DADOS DE PROVENIENCIA DISTRIBUÍDAS

AVALIAÇÃO DE CONSULTAS EXECUTADAS SOBRE BASES DE DADOS DE PROVENIENCIA DISTRIBUÍDAS AVALIAÇÃO DE CONSULTAS EXECUTADAS SOBRE BASES DE DADOS DE PROVENIENCIA DISTRIBUÍDAS Edimar Babilon dos Santos Vanessa Marques de Assis Projeto de Graduação apresentado ao Curso de Engenharia de Computação

Leia mais

ANÁLISE DE DESEMPENHO ENTRE SOFTWARES VIRTUALIZADORES

ANÁLISE DE DESEMPENHO ENTRE SOFTWARES VIRTUALIZADORES ANÁLISE DE DESEMPENHO ENTRE SOFTWARES VIRTUALIZADORES Vitor Rodrigues Tanamachi 1, Weber Poli de Oliveira 1, Alexandre Galvani 1. 1 Departamento de Informática Faculdade de Tecnologia de Bauru (FATEC)

Leia mais

Programa do Módulo 2. Processo Unificado: Visão Geral

Programa do Módulo 2. Processo Unificado: Visão Geral 9.1 Programa do Módulo 2 Orientação a Objetos Conceitos Básicos Análise Orientada a Objetos (UML) O Processo Unificado (RUP) Processo Unificado: Visão Geral 9.2 Encaixa-se na definição geral de processo:

Leia mais

Test-Module: uma ferramenta para gerenciamento de testes de software integrada ao FireScrum

Test-Module: uma ferramenta para gerenciamento de testes de software integrada ao FireScrum Test-Module: uma ferramenta para gerenciamento de testes de software integrada ao FireScrum Audrey B. Vasconcelos, Iuri Santos Souza, Ivonei F. da Silva, Keldjan Alves Centro de Informática Universidade

Leia mais

Sistemas de Apoio à Decisão (SAD) - Senado

Sistemas de Apoio à Decisão (SAD) - Senado Sistemas de Apoio à Decisão (SAD) - Senado DW OLAP BI Ilka Kawashita Material preparado :Prof. Marcio Vitorino Sumário OLAP Data Warehouse (DW/ETL) Modelagem Multidimensional Data Mining BI - Business

Leia mais

Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br

Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br Programação com acesso a BD Prof.: Clayton Maciel Costa clayton.maciel@ifrn.edu.br 1 Modelos de Dados, Esquemas e Instâncias 2 Modelos de Dados, Esquemas e Instâncias Modelo de dados: Conjunto de conceitos

Leia mais

REPLICAÇÃO E AUTO DISPONIBILIDADE NO SQL SERVER

REPLICAÇÃO E AUTO DISPONIBILIDADE NO SQL SERVER FACULDADE DE ADMINISTRAÇÃO E NEGÓCIOS DE SERGIPE FANESE NÚCLEO DE PÓS-GRADUAÇÃO E EXTENSÃO NPGE CURSO DE PÓS-GRADUAÇÃO LATO SENSU ESPECIALIZAÇÃO EM BANCO DE DADOS REPLICAÇÃO E AUTO DISPONIBILIDADE NO SQL

Leia mais

Cloud Computing. O modelo no cenário Geoespacial. Technology Session Latin America Geospatial Forum. 15-17 August 2012 Rio de Janeiro

Cloud Computing. O modelo no cenário Geoespacial. Technology Session Latin America Geospatial Forum. 15-17 August 2012 Rio de Janeiro Cloud Computing O modelo no cenário Geoespacial Technology Session Latin America Geospatial Forum 15-17 August 2012 Rio de Janeiro Iara Musse Felix Diretora, Santiago e Cintra Consultoria, Brazil Alguns

Leia mais

Arquitetura de Banco de Dados

Arquitetura de Banco de Dados Arquitetura de Banco de Dados Daniela Barreiro Claro MAT A60 DCC/IM/UFBA Arquitetura de Banco de dados Final de 1972, ANSI/X3/SPARC estabeleceram o relatório final do STUDY GROUP Objetivos do Study Group

Leia mais

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos

Data Warehouses. Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Data Warehouses Alunos: Diego Antônio Cotta Silveira Filipe Augusto Rodrigues Nepomuceno Marcos Bastos Silva Roger Rezende Ribeiro Santos Conceitos Básicos Data Warehouse(DW) Banco de Dados voltado para

Leia mais

Servidores Identica A performance ao extremo agora disponível no Brasil

Servidores Identica A performance ao extremo agora disponível no Brasil Servidores Identica A performance ao extremo agora disponível no Brasil Com nossa marca Identica oferecemos, entre outros, servidores virtualizados que são hospedados e gerenciados pela unidade de negócios

Leia mais

Introdução à Banco de Dados. Nathalia Sautchuk Patrício

Introdução à Banco de Dados. Nathalia Sautchuk Patrício Introdução à Banco de Dados Nathalia Sautchuk Patrício Histórico Início da computação: dados guardados em arquivos de texto Problemas nesse modelo: redundância não-controlada de dados aplicações devem

Leia mais

Processos (Threads,Virtualização e Migração de Código)

Processos (Threads,Virtualização e Migração de Código) Processos (Threads,Virtualização e Migração de Código) Roteiro Processos Threads Virtualização Migração de Código O que é um processo?! Processos são programas em execução. Processo Processo Processo tem

Leia mais

Engenharia de Requisitos

Engenharia de Requisitos Engenharia de Requisitos Introdução a Engenharia de Requisitos Professor: Ricardo Argenton Ramos Aula 08 Slide 1 Objetivos Introduzir a noção de requisitos do sistema e o processo da engenharia de requisitos.

Leia mais

Tópicos Avançados em Banco de Dados Visão Geral de Tópicos Avançados em Banco de Dados I. Prof. Hugo Souza

Tópicos Avançados em Banco de Dados Visão Geral de Tópicos Avançados em Banco de Dados I. Prof. Hugo Souza Tópicos Avançados em Banco de Dados Visão Geral de Tópicos Avançados em Banco de Dados I Prof. Hugo Souza Iniciaremos nossos estudos sobre os tópicos avançados sobre banco de dados recapitulando o histórico

Leia mais

9º Congresso de Pós-Graduação GERENCIAMENTO DE CONSULTAS EM DATA WAREHOUSE DISTRIBUÍDO EM NUVEM

9º Congresso de Pós-Graduação GERENCIAMENTO DE CONSULTAS EM DATA WAREHOUSE DISTRIBUÍDO EM NUVEM 9º Congresso de Pós-Graduação GERENCIAMENTO DE CONSULTAS EM DATA WAREHOUSE DISTRIBUÍDO EM NUVEM Autor(es) ORLANDO PEREIRA SANTANA JUNIOR Orientador(es) MARINA TERESA PIRES VIEIRA 1. Introdução A informação

Leia mais

Data Warehousing Visão Geral do Processo

Data Warehousing Visão Geral do Processo Data Warehousing Visão Geral do Processo Organizações continuamente coletam dados, informações e conhecimento em níveis cada vez maiores,, e os armazenam em sistemas informatizados O número de usuários

Leia mais

COMPARAÇÃO ENTRE OS FRAMEWORKS DE DESENVOLVIMENTO DE SOFTWARE ENTITY FRAMEWORK E NHIBERNATE : ESTUDO DE CASO EM UM SISTEMA

COMPARAÇÃO ENTRE OS FRAMEWORKS DE DESENVOLVIMENTO DE SOFTWARE ENTITY FRAMEWORK E NHIBERNATE : ESTUDO DE CASO EM UM SISTEMA 73 COMPARAÇÃO ENTRE OS FRAMEWORKS DE DESENVOLVIMENTO DE SOFTWARE ENTITY FRAMEWORK E NHIBERNATE : ESTUDO DE CASO EM UM SISTEMA Daniel José Angotti Analista de Negócio, Repom S/A djangotti@gmail.com Carlos

Leia mais

Tecnologia para Sistemas Inteligentes Apontamentos para as aulas sobre. Introdução à Representação e Processamento de Ontologias: Framework O3f

Tecnologia para Sistemas Inteligentes Apontamentos para as aulas sobre. Introdução à Representação e Processamento de Ontologias: Framework O3f Tecnologia para Sistemas Inteligentes Apontamentos para as aulas sobre Introdução à Representação e Processamento de Ontologias: Framework O3f Luís Miguel Botelho Departamento de Ciências e Tecnologias

Leia mais

ORGANIZAÇÃO CURRICULAR

ORGANIZAÇÃO CURRICULAR ORGANIZAÇÃO CURRICULAR O curso Técnico em Informática, em Nível Médio Subseqüente, será organizado de forma semestral, com aulas presenciais, compostos por disciplinas, com conteúdos estabelecidos, tendo

Leia mais

Como usar a nuvem para continuidade dos negócios e recuperação de desastres

Como usar a nuvem para continuidade dos negócios e recuperação de desastres Como usar a nuvem para continuidade dos negócios e recuperação de desastres Há diversos motivos para as empresas de hoje enxergarem o valor de um serviço de nuvem, seja uma nuvem privada oferecida por

Leia mais

Tópicos Avançados de Banco de Dados (Business Intelligence)

Tópicos Avançados de Banco de Dados (Business Intelligence) Tópicos Avançados de Banco de Dados (Business Intelligence) http://www.uniriotec.br/~tanaka/sain tanaka@uniriotec.br Modelagem Dimensional Conceitos Básicos Material baseado em originais de Maria Luiza

Leia mais

GBD. Introdução PROF. ANDREZA S. AREÃO

GBD. Introdução PROF. ANDREZA S. AREÃO GBD Introdução PROF. ANDREZA S. AREÃO Sistema de arquivos X Sistemas de Banco de Dados Sistema de arquivos Sistema de Banco de Dados Aplicativos Dados (arquivos) Aplicativos SGBD Dados (arquivos) O acesso/gerenciamento

Leia mais

Sistemas Gerenciadores de Bancos de Dados

Sistemas Gerenciadores de Bancos de Dados Sistemas Gerenciadores de Bancos de Dados Fernando Castor A partir de slides elaborados por Fernando Fonseca & Robson Fidalgo 1 Sistemas de Arquivos Sistemas de arquivos Principal característica é a replicação

Leia mais

PDS - DATASUS. Processo de Desenvolvimento de Software do DATASUS

PDS - DATASUS. Processo de Desenvolvimento de Software do DATASUS PDS - DATASUS Processo de Desenvolvimento de Software do DATASUS Coordenação Geral de Arquitetura e Engenharia Tecnológica Coordenação de Padronização e Qualidade de Software Gerência de Padrões e Software

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto OLPT x OLAP Roteiro OLTP Datawarehouse OLAP Operações OLAP Exemplo com Mondrian e Jpivot

Leia mais

Treinamento PostgreSQL Cluster de Banco de Dados - Aula 01

Treinamento PostgreSQL Cluster de Banco de Dados - Aula 01 Treinamento PostgreSQL Cluster de Banco de Dados - Aula 01 Eduardo Ferreira dos Santos SparkGroup Treinamento e Capacitação em Tecnologia eduardo.edusantos@gmail.com eduardosan.com 13 de Junho de 2013

Leia mais

Disciplina de Banco de Dados Introdução

Disciplina de Banco de Dados Introdução Disciplina de Banco de Dados Introdução Prof. Elisa Maria Pivetta CAFW - UFSM Banco de Dados: Conceitos A empresa JJ. Gomes tem uma lista com mais ou menos 4.000 nomes de clientes bem como seus dados pessoais.

Leia mais

Balanceamento de Carga

Balanceamento de Carga 40 4. Balanceamento de Carga Pode-se entender por balanceamento de carga uma política a ser adotada para minimizar tanto a ociosidade de utilização de alguns equipamentos quanto a super utilização de outros,

Leia mais

SISTEMA COMPUTACIONAL PARA ANÁLISES DE DADOS EM AGRICULTURA DE PRECISÃO

SISTEMA COMPUTACIONAL PARA ANÁLISES DE DADOS EM AGRICULTURA DE PRECISÃO UNIVERSIDADE FEDERAL RURAL DO RIO DE JANEIRO INSTITUTO DE TECNOLOGIA DEPARTAMENTO DE ENGENHARIA PROJETO SISTEMA COMPUTACIONAL PARA ANÁLISES DE DADOS EM AGRICULTURA DE PRECISÃO ALUNO RICARDO CARDOSO TERZELLA

Leia mais