Gerência de Experimentos Científicos em Nuvens de Computadores: Oportunidades de Pesquisa em Banco de Dados

Tamanho: px
Começar a partir da página:

Download "Gerência de Experimentos Científicos em Nuvens de Computadores: Oportunidades de Pesquisa em Banco de Dados"

Transcrição

1 Gerência de Experimentos Científicos em Nuvens de Computadores: Oportunidades de Pesquisa em Banco de Dados Daniel de Oliveira Marta Mattoso

2 Quem nós somos Professora associada 4 no Programa de Engenharia de Sistemas e Computação da COPPE/UFRJ Bolsista de produtividade em pesquisa do CNPq nível 1C. Publicou mais de 200 artigos completos em revistas e congressos. Foi diretora de publicações da SBC no período de 2005 a Coordena diversos projetos de pesquisa com financiamento do CNPq, Capes, INRIA e FAPERJ Atua principalmente nas áreas de distribuição e paralelismo em bancos de dados, workflows científicos em ambientes de paralelismo e gerência de dados de proveniência. Profa. Marta Mattoso, D.Sc.

3 Quem nós somos Professor adjunto do Instituto de Computação da Universidade Federal Fluminense (UFF) desde Recebeu o grau de Doutor em Ciências pela UFRJ em Publicou mais de 50 artigos em periódicos indexados e em congressos nacionais e internacionais. Seus interesses de pesquisa incluem bancos de dados, computação em nuvem, gerência de workflows científicos, paralelismo de dados, bioinformática e mineração de dados. É membro da ACM, IEEE e SBC. Prof. Daniel de Oliveira, D.Sc.

4 Grupo de Pesquisas Marta Mattoso, D.Sc. COPPE/UFRJ Daniel de Oliveira, D.Sc. IC/UFF Eduardo Ogasawara, D.Sc. CEFET/RJ Pós-doutorandos Kary Ocaña, D.Sc. COPPE/UFRJ Alunos de D.Sc. Jonas Dias Flavio Costa

5 Colaborações Atuais INRIA Patrick Valduriez LNCC Fabio Porto Luiz Gadelha Jr.

6 Roteiro do Tutorial Motivação Workflows Científicos Nuvens de Computadores Proveniência de Dados Máquinas de Workflow para Nuvem Aplicação de Proveniência em e-science Demo

7 e-science A combinação de pesquisa em computação e modelagem matemática que proporciona a aceleração da pesquisa em outras áreas do conhecimento Fonte: www2.bioetanol.org.br/escibioenergy

8 Método Científico Definir problema Buscar trabalhos existentes Definir hipótese Tentar novamente Validar com experimento Analisar resultados Hipótese é verdadeira Hipótese é falsa Reportar resultados

9 Método Científico in silico Ten years ago, the problem was how to obtain data. Nos dias de hoje o gargalo se encontra em determinar quais estratégias computacionais serão utilizadas para que o cientista possa analisar esse grande volume de dados produzido e coletado Dados geralmente são heterogêneos e distribuídos Fonte: www2.bioetanol.org.br/escibioenergy

10 O quarto paradigma The speed at which any given scientific discipline advances will depend on how well its researchers collaborate with one another, and with technologists, in areas of e- Science such as databases, workflow management, visualization, and cloud computing technologies.

11 O quarto paradigma The speed at which any given scientific discipline advances will depend on how well its researchers collaborate with one another, and with technologists, in areas of e- Science such as databases, workflow management, visualization, and cloud computing technologies. O dado não pode mais ser gerenciado separadamente do processo que o gerou!

12 e-science Medicina Astronomia Biologia e-science Física Química Engenharias

13 e-science Medicina Astronomia Banco de Dados Biologia Engenharia de Software e-science Redes Segurança Física HPC Inteligência Artificial Algoritmos Química Engenharias

14 e-science Medicina Astronomia Banco de Dados Biologia Engenharia de Software e-science Redes Segurança Física HPC Inteligência Artificial Algoritmos Química Engenharias

15 e-science no Reino Unido E-Science é vital para a exploração do poderoso aparato científico da próxima geração Telescópios Sensores Satélites Cada um desses aparatos podem gerar vários terabytes de dados diariamente Os usuários podem estar dispersos geograficamente ao redor do globo A e-science deve construir a infraestrutura necessária para este exploração

16 e-science no Brasil São Paulo School of Advanced Science on e-science for Bioenergy Research Grandes Desafios da Computação no Brasil BreSci - Brazilian e-science workshop

17 e-science no Brasil São Paulo School of Advanced Science on e-science for Bioenergy Research Grandes Desafios da Computação no Brasil BreSci - Brazilian e-science workshop

18 e-science Ok, mas por que e-science é importante?

19 Experimento de Motivação DTN compreendem infecções parasitárias, virais e bacterianas que atacam especialmente as populações de baixa renda nas regiões em desenvolvimento da África, Ásia e América Latina 17 DTN em 149 países afetam 1 bilhão de pessoas (1/7 da população mundial) Doença de Chagas Leishmaniose Hanseníase Esquistossomose Infecções por trematódeos transmitidas por alimentos Helmintíases transmitida pelo solo Cisticercose Dengue Dracunculíase Equinococose Oncocercose Raiva Tracoma Úlcera de Buruli Tripanossomíase humana africana A OMS reporta progressos contra a malária como uma prioridade

20 Malária no Mundo

21 Malária no Brasil Fonte: Sistema de Informação de Vigilância Epidemiológica-Malária/Secretaria de Vigilância em Saúde/Ministério da Saúde Mapa de risco da malária por Município de Infecção. Brasil 2011.

22 Cisteíno Proteases em Plasmodium Plasmodium falciparum gera os casos mais graves de malária As drogas antimaláricas apresentam uma crescente resistência Evidências indicam que cisteíno proteases (CP) têm um papel essencial no tratamento médico da malária Projetos de descoberta de drogas alvos fármaco-terapêuticos promissores inibidores antimaláricos papel importante no ciclo de vida do parasita papaína e ubiquitina Plasmodium falciparum

23 Testes para Análise de Cisteíno Proteases Definir problema Buscar trabalhos existentes Cientistas desenvolvem códigos próprios Cientistas usam códigos de terceiros Desenvolvimento de pipelines específicos Definir hipótese Validar com experimento Analisar resultados Tentar novamente Hipótese é verdadeira Hipótese é falsa Reportar resultados

24 1º Passo - Genômica Comparativa Um alinhamento múltiplo de sequência (AMS) identifica regiões de similaridade que podem ser consequência de relações funcionais, estruturais ou evolutivas entre as sequências

25 2º Passo - Filogênia Faz uso extensivo de AMS para a construção de árvores filogenéticas usados para inferir relações evolutivas entre genes homólogos Trypanosoma cruzi Leishmania major Pch Ppa Han Tpa Pvi Dfa Bbo Tan Pyo Pbe Pkn Pfa Dci Ddi Mbr Pca Cro Pau Ahe Lam Pli Ldi Tma Tpy Bba Dvi Fve Tpi Ldo Tpar Ddic Apo Ngr Oda Aca Tgo Ete Csy Cri PyePpu Pso Gte Pin Pra Sfe Gth Rsa Cpar Egr Ram Ehu Tps Osi Ptr Hak Cme Cca Mja Elo Trypanosoma brucei Plasmodium falciparum Pte Tth Tbr Len Ehi Edi Tcr Cpa Cho Tva Lbr Lma Ocaña K.A.C.S., and Dávila A.M.R. Phylogenomics-Based Reconstruction of Protozoan Species Tree. Evolutionary Bioinformatics, vol. 7, pp , GlaLin

26 3º Passo - Evolução Molecular Fornece base para inferências evolutivas e biológicas, e evoluem devido ao crescimento explosivo de dados genômicos e novas abordagens computacionais e estatísticas

27 4º Passo - Modelagem Molecular Construção do modelo de resolução atômico (modelo 3D) da sequência da proteína (alvo) e uma estrutura 3D experimental de proteínas homólogas (molde) Uso de métodos de Genômica Estrutural e.g., Computer-Aided Drug Design (CADD)

28 Pipelines Farmacofilogenômica (A) Genômica Comparativa (B) Filogenia (C) Evolução Molecular (D) Modelagem Molecular Aplicações computacionalmente intensivas

29 Pipelines Farmacofilogenômica (A) Genômica Comparativa (B) Filogenia Como gerenciar todas essas (C) Evolução Molecular execuções? (D) Modelagem Molecular Aplicações computacionalmente intensivas

30 Análise de Cisteíno Proteases Modelada como Workflow Científico Kalign ClustalW MAFFT Muscle ProbCons BD Sequências (e.g. Refseq) MSA 1 Eleição do Modelo Evolutivo 2 Construção da Árvore Filogenética 3 ModelGenerator RAxML Concatenação MSA 4 Modelo Evolutivo Construção da Árvore (matriz) 5 Perl Script BLOSUM62, CPREV, JTT, WAG, RtREV RAxML Fonte: Ocaña K.A.C.S., Oliveira D., Ogasawara E., Dávila A.M.R., Lima A.A.B., and Mattoso M. SciPhy: A Cloud-Based Workflow for Phylogenetic Analysis of Drug Targets in Protozoan Genomes. Springer, pp , 2011.

31 Workflows Científicos Workflows Científicos Workflows científicos são abstrações que representam a cadeia de atividades dentro de um experimento científico Eles são gerenciados por Sistemas de Gerência de Workflows Científicos (SGWfC) Diversas variações do workflows dentro do mesmo experimento Essas variações incluem a alteração de dados de entrada e parâmetros Proveniência é uma questão fundamental

32 Sistemas de Gerência de Workflows Científicos Definem e executam os workflows Proveem execução eficiente Controlam falhas garantindo a integridade Acessam/Armazenam/Consultam dados usando SGBD Rastreiam a proveniência dos dados

33 Analogia com Banco de Dados SGBD SGWfC Dados Tabelas Dados Atividades Planos Metadados Arquivos Parâmetros Processos Escrita Processos Escrita Leitura Log Leitura Proveniência Tabelas Disco Log S.O Arquivos Disco Log Arquivos de Controle Arquivos de Controle

34 Abordagens Existentes para Execução de Workflows Científicos Modelo de execução com paralelismo nativo Ex.: Swift, Pegasus, Triana, SciCumulus Motor sequencial Ex.: Kepler, VisTrails, Taverna Motor sequencial e camada de paralelismo Ex.: VisTrails+Hadoop, Kepler+Hadoop

35 Execução de uma Análise de Cisteíno Execução demanda grande tempo de processamento Cientistas necessitam variar: Parâmetros Métodos Imagens Arquivos de Dados Configurações Protease Como executar essas análises?

36 Execução de uma Análise de Cisteíno Execução demanda grande tempo de processamento Cientistas necessitam variar: Parâmetros Métodos Imagens Arquivos de Dados Configurações Protease Como executar essas análises? Paralelismo!

37 Em que ambiente executar? Clusters Grades Desktop

38 Em que ambiente executar? Clusters podem ser financeiramente custosos Grades demandam um esforço grande de configuração Desktops podem demandar um tempo exageradamente grande para a execução Tempo de execução versus Tempo de Análise dos Dados

39 Alternativa: Análise de Cisteíno Protease em Nuvens Dados de entrada para Realizar análises filogenéticas: Sequências de DNA e RNA de diversos organismos Alinhamento de sequências (MAFFT, ProbCons, ClustalW, Muscle e Kalign) e conversão Produz uma grande quantidade de dados (sequências alinhadas) Geração das árvores filogenéticas (RAxML) Utilizada para a geração do modelo evolutivo (ModelGenerator)

40 Alternativa: Análise de Cisteíno Laboratório Protease em Nuvens Dados de entrada para Realizar análises filogenéticas: Sequências de DNA e RNA de diversos organismos Alinhamento de sequências (MAFFT, Desktop ProbCons, ClustalW, Muscle e Kalign) e conversão Produz uma grande quantidade de dados (sequências alinhadas) Geração das árvores filogenéticas (RAxML) Tiled Wall Nuvem Utilizada para a geração do modelo evolutivo (ModelGenerator)

41 Execução de uma Análise de Cisteíno Protease em Nuvens Utilização da nuvem faz com que cientistas não tenham que comprar equipamentos Execução paralela reduz o tempo de processamento Mas...

42 Problemas na Execução de Workflows em Nuvens

43 Nova Visão: Análise de Cisteíno 3. Geração das árvores filogenéticas (RAxML) Protease em Nuvens Dados de entrada para Realizar análises filogenéticas: Sequências de DNA e RNA de diversos organismos Alinhamento de sequências (MAFFT, ProbCons, ClustalW, Muscle e Kalign) e conversão Qual árvore corresponde a uma determinada sequência de entrada? O programa MAFFT é melhor que o ProbCons? Qual e-value foi escolhido? Produz uma grande quantidade de dados Como recuperar uma execução (sequências que alinhadas)... falhou? Como monitorar uma execução a distância? Utilizada para a geração do modelo evolutivo (ModelGenerator)

44 Execução de uma Análise de de Execução paralela reduz o tempo de processamento Utilização da nuvem faz com que cientistas não tenham que comprar equipamentos Devemos registrar Decisões Parâmetros Métodos Usuários Imagens Arquivos de Dados Configurações Cisteíno Protease Como relacionar todos esses recursos?

45 Importância da Proveniência na Ciência Interpretar e reproduzir dados Verificar se um determinado experimento foi executado seguindo os procedimentos Identificar as entradas e saídas dos experimentos Garantir qualidade dos dados Rastrear quem executou um experimento e quem é responsável pelos resultados Provenance is as (or more) important as the results (Juliana Freire e Susan Davidson, SIGMOD 2008)

46 Desafios na Execução de Workflows em Nuvens Ambiente caixa-preta e em constante mudança Variação de desempenho das máquinas virtuais Mudanças constantes no ambiente Falhas constantes nas máquinas virtuais Diversos tipos de máquinas virtuais passíveis de utilização Qual tipo utilizar? Transferência de dados Como evitar sobrecarga na transferência? Como monitorar os workflows?

47 Questão...considerando os desafios na execução de workflows em nuvem é possível prover capacidade de alto desempenho e a gerência distribuída do workflow científico por meio da adoção de soluções que considerem as características únicas do ambiente, distribuam as atividades e monitorem a execução das mesmas em várias máquinas virtuais?

48 Hipótese Se for adotada uma infraestrutura adaptativa para o escalonamento, despacho, monitoramento e captura de proveniência distribuída das atividades paralelas de um workflow científico então podemos prover a capacidade de alto desempenho, monitoramento e controle que são necessárias aos cientistas.

49 Em que podemos nos inspirar na área de Banco de Dados?

50 Em que podemos nos inspirar na área de Banco de Dados? Representação da consulta por meio de álgebra relacional representação do workflows por meio de álgebra de workflows Otimização do plano de execução de consultas otimização de workflows científicos

51 Em que podemos nos inspirar na área de Banco de Dados? Escalonamento das atividades no ambiente de nuvem de acordo com uma álgebra de workflows Distribuição dos dados de proveniência Monitoramento

52 Roteiro do Tutorial Motivação Workflows Científicos Nuvens de Computadores Proveniência de Dados Máquinas de Workflow para Nuvem Aplicação de Proveniência em e-science Demo

53 Experimento Científico Uma das formas utilizadas pelos cientistas para apoiar a formulação de novas teorias Possui um ciclo de vida com três etapas: Composição Execução Análise

54 Nossa visão do ciclo de vida do experimento científico

55 Nossa visão do ciclo de vida do experimento científico O experimento pode ser composto pela execução de múltiplos workflows científicos

56 Workflow A automação de um processo de negócio, completo ou apenas parte dele, através do qual, documentos, informações ou tarefas são transmitidas de um participante a outro por ações, de acordo com regras procedimentais. (WFMC, 1995) Provê a abstração necessária para descrever uma série de processos estruturados e suas atividades, oferecem um contexto robusto de resolução de problemas e promovem o uso efetivo e otimizado dos recursos computacionais

57 Workflow Uma coleção de atividades organizadas para acompanhar algum experimento (processo de negócio). As atividades ou tarefas são os componentes de software independentes que implementam alguma funcionalidade e são executadas por um ou mais sistemas de softwares. Exemplos de atividades incluem executar um programa, transformar um arquivo ou atualizar um banco de dados.

58 Workflow Um workflow define a ordem de execução dessas atividades ou as condições em que essas atividades serão executadas e a sua eventual sincronização. Os dados de entrada e saída das atividades (variáveis) são definidos como o fluxo de dados do workflow.

59 SGWf e Máquina de Workflow Sistema de gerência de workflows SGWf (WfMS - Workflow Management Systems) Software que fornece toda a infraestrutura para definir, executar e monitorar workflows. Máquina de Workflow Na utilização deste tipo de software é importante para separar a definição do workflow, da máquina (i.e. engine) encarregada de executar o mesmo

60 Especificação do Workflow DAG Contém estruturas do tipo sequenciais, paralelas ou livres. Non-DAG Incluem estruturas de iteração Permitem que os workflow executem tarefas ou sub-workflows de forma repetida.

61 Especificação do Workflow DAG Contém estruturas do tipo sequenciais, paralelas ou livres. Non-DAG Incluem DAGestruturas de iteração Non-DAG Permitem que os workflow executem tarefas ou sub-workflows de forma repetida.

62 Diversidade de Sistemas de Askalon Chiron Kepler Pegasus SciCumulus Swift Taverna VisTrails Gerência de Workflows

63 Diversidade de Sistemas de Askalon Chiron Kepler Pegasus Gerência de Workflows SciCumulus Swift Taverna VisTrails

64 SGWf...um caldeirão de tecnologias Muitos Modelos Computação control flow, data flow, pipelines baseados em scripts Interação interativos, batch Representação de Wf DAG, non-dag Adaptabilidade dinâmicos, estáticos Muitos Ambientes Componentes grid, cluster, nuvem, etc Natureza- open-source, comerciais Escala long running,data streaming, etc Muitas tecnologias. centralizado, distribuído, local, Web

65 Roteiro do Tutorial Motivação Workflows Científicos Nuvens de Computadores Proveniência de Dados Máquinas de Workflow para Nuvem Aplicação de Proveniência em e-science Demo

66 Computação em Nuvem Uma das opções para prover um ambiente de alto desempenho para cientistas é executar seus experimentos em nuvens de computadores Se baseia na ideia de prover recursos (software e hardware) utilizando o ambiente Web para uma gama (virtualmente infinita) de usuários Elasticidade de Recursos Virtualização de Recursos Personalização Disponibilidade

67 Quem já usa Computação em Nuvem? FAPEMIG lança edital para cloud computing 30 de Dezembro de 2011

68 Quem já usa Computação em Nuvem? 68

69 Computação em Nuvem: Definição Diversas definições: não há consenso! Mais de 20 definições em Vaquero (2009) Segundo Ian Foster:...um paradigma de computação em larga escala que possui foco em proporcionar economia de escala, em que um conjunto abstrato, virtualizado, dinamicamente escalável de poder de processamento, armazenamento, plataformas e serviços são disponibilizados sob demanda para clientes externos através da Internet. Vaquero, L. M., Rodero-Merino, L., Caceres, J., and Lindner, M. (2009). A break in the clouds: towards a cloud definition. SIGCOMM Comput. Commun. Rev., 39(1):50 55

70 Paradigmas de Computação/Negócios Computação em Nuvem Hardware - Virtualização Computação em Nuvem - Grades - Computação Utilitária - SOA - Web Web Services Tecnologias de Internet - Computação Autonômica Traduzido de: Voorsluys, W; Broberg, J; Buyya, R; Introduction to Cloud Computing. IN: Cloud Computing. Wiley Gerenciamento de Sistemas

71 Públicas Privadas Híbridas Comunitárias Tipos de Nuvem

72 Públicas Privadas Híbridas Comunitárias Tipos de Nuvem

73 Públicas Privadas Comunitárias Híbridas Tipos de Nuvem

74 Públicas Privadas Comunitárias Híbridas Tipos de Nuvem

75 IaaS PaaS SaaS Taxonomia da Nuvem Fonte: Lamia Youseff, Maria Butrico and Dilma Da Silva Toward a Unified Ontology of Cloud Computing., Grid Computing Environments Workshop, GCE '08

76 Provedor IaaS Infrastructure as a Service Oferece infraestrutura de hardware Normalmente por meio de virtualização Funciona como um aluguel de recursos: Equipamentos de Rede Memória CPU Armazenamento Infraestrutura deve ser escalável Aumentar ou diminuir recursos de acordo com a necessidade do cliente VM Hypervisor Infraestrutura Física

77 IaaS Custo Financeiro

78 IaaS: Exemplos

79 Amazon EC2

80 Amazon EC2

81 Amazon EC2

82 Amazon EC2

83 Amazon EC2

84 Provedor PaaS Platform as a Service Modelo onde se fornece recursos para a construção de aplicações e serviços para a Internet Os recursos incluem: Ferramentas de desenvolvimento Teste Hospedagem Banco de Dados Segurança Controle de versões Ferramentas de Desenvolvimento VM Hypervisor Infraestrutura Física

85 PaaS: Exemplos

86 Provedor SaaS Software as a Service Modelo no qual uma aplicação é armazenada em um servidor Usuários a acessam via Internet Não há a necessidade de dar suporte à aplicação Aplicações Ferramentas de Desenvolvimento VM Hypervisor Infraestrutura Física

87 SaaS: Exemplos

88 Casos de Sucesso Amazon EC2 e S3 (100 instâncias) Conversão de 11 milhões de artigos (4TB) Nasdaq Processamento de vídeos do Big Brother Brasil Evita sobrecarga nos servidores locais

89 Casos na área científica Análise Filogenômica OLIVEIRA, D., Ocaña, K. A. C. S., Ogasawara, E., Dias, J., Goncalves, J., Mattoso, M., (2012), "Cloud-based Phylogenomic Inference of Evolutionary Relationships: A Performance Study". 2nd International Workshop on Cloud Computing and Scientific Applications (CCSA), Ottawa. Estudos Evolutivos Ocaña, K. A. C. S., OLIVEIRA, D. de, Horta, F., Dias, J., Ogasawara, E., Mattoso, M., (2012), "Exploring Molecular Evolution Reconstruction Using a Parallel Cloud-based Scientific Workflow". Brazilian Symposium on Bioinformatics (BSB 2012), Campo Grande, MT. Genômica Comparativa OCANA, K. ; OLIVEIRA, D. ; DIAS, J. ; OGASAWARA, E. ; MATTOSO, M. L. Q.. Optimizing Phylogenetic Analysis Using SciHmm Cloud-based Scientific Workflow. 7 th IEEE e Science conference. IEEE Computer Society, 2011.

90 Roteiro do Tutorial Motivação Workflows Científicos Nuvens de Computadores Proveniência de Dados Máquinas de Workflow para Nuvem Aplicação de Proveniência em e-science Demo

91 O que é proveniência? De acordo com o dicionário Aurélio: s.f. Primeira manifestação; começo, princípio. Procedência; ponto de partida de uma nação, de uma família; naturalidade. Nascimento, proveniência; ascendência. Origem.

92 O que é proveniência? De acordo com o dicionário Aurélio: s.f. Primeira manifestação; começo, princípio. Procedência; ponto de partida de uma nação, de uma família; naturalidade. Nascimento, proveniência; ascendência. Origem.

93 O que é proveniência? De acordo com o dicionário Aurélio: s.f. Primeira manifestação; começo, princípio. Procedência; ponto de partida de uma nação, de uma família; naturalidade. Nascimento, proveniência; ascendência. Origem.

94 Onde a proveniência pode ser aplicada? Publicaçoes Contabilidade Banking Saúde

95 Proveniência nas artes Pesquisa a autoria de obras de arte em acervos de museus ou coleções particulares Dados de proveniência podem incluir restaurações realizadas nas obras Ajudam especialistas a verificar autenticidade de obras Adaptação dos slides de Freire e Davidson SIGMOD 2008

96 Proveniência nas artes Pesquisa a autoria de obras de arte em acervos de museus ou coleções particulares Dados de proveniência podem incluir restaurações realizadas nas obras Ajudam especialistas a verificar autenticidade de obras Adaptação dos slides de Freire e Davidson SIGMOD 2008

97 Proveniência na indústria Garante a procedência do alimento É possível saber em que fazenda, granja etc o alimento foi produzido ou colhido Adaptação dos slides de Freire e Davidson SIGMOD 2008

98 Proveniência na medicina fonte: A epistemologia narrativa e o exercício clínico do diagnóstico, Maria Helena Cabral de Almeida Cardoso, Kenneth Rochel de Camargo Jr., Juan Clinton Llerena Jr., Ciência & Saúde Coletiva Garante o rastreio das mudanças do paciente Cirurgias realizadas, procedimentos realizados, medicamentos prescritos Adaptação dos slides de Freire e Davidson SIGMOD 2008

99 Proveniência na Ciência Reprodução e interpretação de um resultado Compreensão do raciocínio empregado no experimento Verificação se o experimento segui procedimentos específicos Rastreio de responsabilidades Quem fez o que e quando?

100 Proveniência na Ciência Reprodução e interpretação de um resultado Compreensão do raciocínio empregado no experimento Verificação se o experimento segui procedimentos específicos Rastreio de responsabilidades Quem fez o que e quando?

101 Proveniência na Ciência

102 Por que a curadoria de dados científicos é importante em e-science? Faz parte do processo de pesquisa Agrega valores Intrínsecos e Extrínsecos à pesquisa Aumenta o potencial de criar novos conhecimentos a partir de dados préexistentes Preserva o contexto da descoberta científica

103 Qualidade dos dados A proveniência dos dados permite avaliar a qualidade deles para uma aplicação Erros introduzidos por defeitos nos dados tendem a se tornar mais graves quando propagados O nível de detalhe da proveniência determina com que grau a qualidade dos dados pode ser estimada

104 Proveniência em experimentos in silico iii ehwp25ex8.tcoffeestockholm iii ehwp25ex9.tcoffeestockholm Análise de longo prazo Reprodução Qualidade Responsabilidade

105 Formas da proveniência Derivação Representação de um caminho, workflow, roteiro, ou consulta. Associação entre itens (grafos) Geralmente é uma explicação (2W1H =when, who, how) Centrada no processo Anotação Anexado aos items ou coleções de dados ( estruturado ou semi ou texto livre ) Geralmente é uma explicação ( 5W1H = why, when, where, who, what, how) Centrada no dado mass = 200 mass = 200 event = 8 mass = 200 decay = WW mass = 200 plot = 1 mass = 200 decay = bb mass = 200 decay = ZZ mass = 200 decay = WW plot = 1 mass = 200 decay = WW stability = 3 mass = 200 decay = WW stability = 1 mass = 200 decay = WW event = 8 mass = 200 decay = WW stability = 1 LowPt = 20 HighPt = mass = 200 decay = WW stability = 1 event = 8 mass = 200 decay = WW stability = 1 plot = 1 Fonte: Knowledge and Provenance (Goble, 2003)

106 Proveniência em Tempo Real Uso da proveniência em tempo real possibilita análises mais precisas e uma resposta mais rapida durante a execução do experimento As derivações que ocorrem durante a execução do workflow devem estar disponíveis assim que os dados forem produzidos Dados específicos de domínio também são necessários

107 Tipos de proveniência?

108 Taxonomia de Proveniência

109 Taxonomia de Proveniência Classificar a proveniência em termos de o que, quem, onde, como e por quê e ainda que dado pode ser capturado durante as fases do ciclo de vida do experimento

110 Taxonomia de Proveniência Classificar como os dados de proveniência podem ser capturados nos sistemas de proveniência. Composição & Execução Cruz, S.M.S. ; CAMPOS, M. L. M. ; MATTOSO, M. L. Q.. Towards a Taxonomy of Provenance in Scientific Workflow Management Systems. In: IEEE SWF, 2009, Los Angeles.

111 Taxonomia de Proveniência Formas de registro e armazenamento dos dados de proveniência. Execução Cruz, S.M.S. ; CAMPOS, M. L. M. ; MATTOSO, M. L. Q.. Towards a Taxonomy of Provenance in Scientific Workflow Management Systems. In: IEEE SWF, 2009, Los Angeles.

112 Taxonomia de Proveniência Descreve as formas de acesso aos dados e repositórios de proveniência. Análise Cruz, S.M.S. ; CAMPOS, M. L. M. ; MATTOSO, M. L. Q.. Towards a Taxonomy of Provenance in Scientific Workflow Management Systems. In: IEEE SWF, 2009, Los Angeles.

113 Taxonomia de Proveniência Representação da proveniência em termos de assunto e granulosidade. Cruz, S.M.S. ; CAMPOS, M. L. M. ; MATTOSO, M. L. Q.. Towards a Taxonomy of Provenance in Scientific Workflow Management Systems. In: IEEE SWF, 2009, Los Angeles. Ortogonal à todas as fases

114 Representação de proveniência com o PROV Padrão W3C para representação de proveniência Baseado em 3 elementos principais: Entidade (Entity) Agente (Agent) Atividade (Activity) aims the inter-operable interchange of provenance information in heterogeneous environments such as the Web

115 O modelo de dados do PROV Fonte: Sítio W3C PROV

116 Exemplo de utilização do PROV Fonte: Sítio W3C PROV

117 Exemplo de utilização do PROV Fonte: Sítio W3C PROV

118 Relacionamento used Fonte: Sítio W3C PROV

119 Relacionamento wasgeneratedby Fonte: Sítio W3C PROV

120 Relacionamento wasinvalidatedby Fonte: Sítio W3C PROV

121 Relacionamento wasinformedby Fonte: Sítio W3C PROV

122 Relacionamento wasstartedby Fonte: Sítio W3C PROV

123 Relacionamento wasendedby Fonte: Sítio W3C PROV

124 Relacionamento wasderivedfrom Fonte: Sítio W3C PROV

125 Relacionamento actedonbehalfof Fonte: Sítio W3C PROV

126 Relacionamento wasattributedto Fonte: Sítio W3C PROV

127 Relacionamento wasassociatedwith Fonte: Sítio W3C PROV

128 Arquitetura genérica para captura de proveniência SGWfC eventos Aplicações Cliente Máquina Serviço de captura de proveniência Análise Consulta Interface Serviço de Gerência de Proveniência Serviço de Consulta Exploração Repositório ou Sistema de Proveniência Anotação Metadados Tradução Indexação Repositório

129 Mecanismos de Captura Atrelados a máquina de execução de workflows Taverna Kepler VisTrails SciCumulus Desacoplados da máquina de workflows PASS PASOA Karma Centralizados Distribuído Distribuídos

130 Proveniência no Taverna List-structured KEGG gene ids: [ [ mmu:26416 ], [ mmu: ] ] geneids pathway s geneids pathway s [ path:mmu04010 MAPK signaling, path:mmu04370 VEGF signaling ] [ [ path:mmu04210 Apoptosis, path:mmu04010 MAPK signaling,...], [ path:mmu04010 MAPK signaling, path:mmu04620 receptor,...] ]

131 Proveniência no Taverna List-structured KEGG gene ids: [ [ mmu:26416 ], [ mmu: ] ] geneids pathway s geneids pathway s [ path:mmu04010 MAPK signaling, path:mmu04370 VEGF signaling ] [ [ path:mmu04210 Apoptosis, path:mmu04010 MAPK signaling,...], [ path:mmu04010 MAPK signaling, path:mmu04620 Toll-like receptor,...] ]

132 Proveniência no VisTrails Árvore de Versões Workflows

133 Proveniência no VisTrails Árvore de Versões Workflows Dados

134 Proveniência no VisTrails Árvore de Versões Workflows Usuário marta danielcmo danielcmo kary kary

135 Proveniência no Kepler

136 Proveniência no Chiron/SciCumulus 02/10/2013 Defesa de Tese - Daniel C. M. de Oliveira 138

137 Proveniência no Chiron/SciCumulus Específico para nuvens Este tipo de informação pode ser usado para fins além da reprodução e validação

138 Proveniência no Chiron/SciCumulus

139 Consultas de Proveniência no SciCumulus Recuperar, por ordem crescente de identificador dos workflows as atividades relacionadas a cada workflow e as cloud activities associadas a cada atividade SELECT w.tag, w.description a.tag, t.workspace from hworkflow w, hactivity a, hactivation t where w.wkfid = a.wkfid and a.actid = t.actid order by w.wkfid

140 Consultas de Proveniência no SciCumulus Recuperar, por ordem crescente de execuções dos workflows, as datas de início e término, tags dos workflows, bem como o nome de todas as atividades associadas e que não contenham nenhuma cloud activity que executou com erro. SELECT w.tag, a.tag, t.exitstatus, t.processor, t.workspace, t.status, t.endtime, t.starttime, extract ('epoch' from (t.endtime-t.starttime)) ',' as duration from hworkflow w, hactivity a, hactivation t where w.wkfid = a.wkfid and a.actid = t.actid and not exists (select * from hactivation a2 where a2.actid = a.actid and a2.exitstatus <> 0) order by w.wkfid

141 Karma Mecanismo de Captura: cada serviço envia dados de proveniência a um serviço central Modelo de Dados: Retrospectiva grafo representado em XML Prospectiva BPEL Minimiza sobrecarga de captura Desacoplado da máquina de workflow

142 PASS Mecanismo de Captura: cada serviço envia dados de proveniência a um serviço central

143 Proveniência em tempo real Por que dados de proveniência em tempo real são importantes? Proveniência Especialmente em ambientes de nuvem

144 PROV-Wf Extensão do PROV para representação de proveniência em workflows científicos Relaciona elementos do modelo estendido com os elementos do PROV por meio de estereótipos da UML Proposto no workshop BigProv do EDBT/ICDT 2013

145 PROV-Wf

146 PROV-Wf

147 Mapeamento no PROV-Wf VisTrails SciCumulus PROV-Wf VisTrail.ID Workflow.ExecTag Execute Workflow.ID VisTrail.Name Workflow.Tag Workflow. Name Module.Name Activity.Tag WActivity. Name Module.ID Activation.ID Execute Activity.ID Parameter.Alias Field.Name Field.Name Parameter.Type Field.Type Field.Type Parameter.Val Value.Val Value.Val

148 Uso do PROV-Wf SELECT f1.name, v1.value, f2.name, v2.value FROM workflow w, activity a, executeactivity ea, relationschema rs, relation r, field f1, field f2, Value v1, Value v2 WHERE a.wkf_id = w.id AND ea.act_id = a.id AND r.rel_id = rs.id AND r.ea_id = ea.id AND f1.rel_id = rs.id AND f2.rel_id = rs.id AND v1.uf_id = f1.id AND v2.uf_id = f2.id AND rs.name = Relation MSA AND f1.name = BIO_SEQ AND f2.name = TAXON AND a.name = %PARAM_ACT_NAME% AND w.tag = %PARAM_WF_NAME%

149 Roteiro do Tutorial Motivação Workflows Científicos Nuvens de Computadores Proveniência de Dados Máquinas de Workflow para Nuvem Aplicação de Proveniência em e-science Demo

150 Máquinas baseadas em Hadoop Framework para execução de aplicações em grandes clusters (virtuais ou não) Fornece funcionalidades tanto de confiabilidade e movimentação de dados. Implementa o paradigma computacional chamado map / reduce Cada aplicação é dividida em muitos pequenos fragmentos, cada um dos quais podem ser executadas ou reexecutado em qualquer nó no cluster.

151 Hadoop Desacoplado do conceito de workflow Escalonamento não leva em consideração a estrutura do workflow Não captura proveniência de forma nativa Complementos para captura são necessários

152 Arquitetura do Hadoop

153 Nephele Arcabouço para processamento paralelo em nuvens Aloca e desaloca máquinas virtuais dependendo do comportamento do Job Não possui proveniência associada Paralelização explícita Tarefas são designadas como parallelizable

154 Nephele

155 Pegasus Financiado pela NSF/OCI em colaboração com o grupo do escalonador CONDOR de UW Madison Distribui atividades em paralelo em ambientes distribuídos Captura os dados de proveniência Escalabilidade Big Data (kb to TB) Quantidade de tarefas ( tarefas)

156 Pegasus Re-executa tarefas que falharam automaticamente Pode executar nos mais diversos ambientes Laptop campus cluster grid nuvem

157 Pegasus Fonte: pegasus.isi.edu/presentations/

158 SciCumulus Uma máquina para execução de workflows para nuvem que tem como objetivo conectar o SGWfC com o ambiente de nuvem para oferecer apoio à execução de workflows científicos Middleware Hydra Motor de execução Chiron OLIVEIRA, D.; OGASAWARA, E.; BAIAO, F.; MATTOSO, M. L. Q.. SciCumulus: A Lightweight Cloud Middleware to Explore Many Task Computing Paradigm in Scientific Workflows. In: The 3rd IEEE CLOUD 2010, Miami. Proc. of the 3rd IEEE CLOUD, p

159 Arquitetura

160 especificação do workflow validação, verificação e publicação dos resultados descoberta composição transferência de dados para a nuvem análise Dados de Proveniência configuração Configuração do cluster virtual download de dados da nuvem execução redimensionamento 162 monitoramento da execução na nuvem execução distribuída e paralela do workflow

161 Modelo Algébrico O SciCumulus segue o modelo algébrico proposto por Ogasawara et al. (2011) Atividades consomem relações Cada relação é composta de tuplas e atributos (parâmetros das atividades) Execuções de atividades consomem tuplas Os operadores da álgebra Invocam programas: Map (1:1) SplitMap (1:n) Reduce (n:1) Filter (1:0-1) OGASAWARA, E. ; DIAS, J. ; OLIVEIRA, D. ; PORTO, F. ; VALDURIEZ, P. ; MATTOSO, M. L. Q.. An Algebraic Approach for Data-Centric Scientific Workflows. Proceedings of the VLDB Endownment, v. 4, p , 2011.

162 Relações como o modelo de dados para consumo e produção Relações são definidas como um conjunto de tuplas de tipos primitivos (inteiro, string, etc) ou tipos complexos (e.g. ponteiros para arquivos) Exemplo: R(R) RID CaseStudy sdat ddat 1 U-125 U-125S.DAT U-125D.DAT 1 U-127 U-127S.DAT U-127D.DAT 2 U-129 U-129S.DAT U-129D.DAT R = (RID: Integer, CaseStudy: String; SDat: FileRef, DDat: FileRef)

163 Split Map (SplitMap) T SplitMap(Y, a, R) R RID RdZip 1 Project1.zip 2 Project2.zip T SlipMap(extractRD, RdZip, R) T RID Study sdat ddat 1 U-125 U-125S.DAT U-125D.DAT 1 U-127 U-127S.DAT U-127D.DAT 2 U-129 U-129S.DAT U-129D.DAT

164 Reduce Activity (Reduce) T Reduce(Y, g A, R) R RID Study SsSai DdSai MEnv 1 U-125 U-125Ss.SAI U-125Dd.SAI U-125.ENV 1 U-127 U-127Ss.SAI U-127Dd.SAI U-127.ENV 2 U-129 U-129Ss.SAI U-129Dd.SAI U-129.ENV T Reduce(CompressRD, { RID }, R) T RID RdResultZip 1 ProjectResult1.zip 2 ProjectResult2.zip

165 SRQuery Activity T SRQuery(qry, R) R RID Study SsSai Curvature 1 U-125 U-125Ss.SAI U-126 U-126Ss.SAI U-127 U-127Ss.SAI 1.2 T SRQuery(π RID, Study, SsSai, Curvature (σ Curvature>1 (R)), R) T RID Study SsSai Curvature 1 U-125 U-125Ss.SAI U-127 U-127Ss.SAI 1.2

166 Execução baseada em relações Relação de entrada R ID Doc 1 gene13.hmmin 2 gene27.hmmin n genen.hmmin Operador T Map( M, R ) Instrumentação #./exp file gene13.hmmin Relação de Saída T ID Doc eval 1 gene13.hmout 5 2 gene27.hmout 6 n genen.hmout v eval Nuvem Resultados Invocação do Programa Extrator de Dados

167 Estratégias de Execução First Tuple First (FTF) First Activity First (FAF) x 1 x 2 x 3 Y 3 x 7 x 8 Y 1 Y 2 Y 4 x 4 x 5 x 6 x 9 FTF: {<x 1, x 4 >, <x 2, x 5 >, <x 3, x 6 >} FAF: {<x 1 >,<x 2 >,<x 3 >, <x 4 >,<x 5 >,<x 6 >}

168 Workflow como uma expressão da álgebra Workflow Expressões algébricas (1) ExtractRD T 1 SplitMap(ExtractRD, R 1 ) T 2 Map(PSRiser, T 1 ) (2) PSRiser T 3 Map(SRiser, T 2 ) T 4 Map(PDRiser, T 3 ) (3) (4) (5) SRiser PDRiser DRiser (7) Canalysis Tanalysis (6) (8) Merge (9) CompressRD T 5 Map(DRiser, T 4 ) T 6 Filter(Tanalysis, T 5 ) T 7 Filter(Canalysis, T 5 ) T 8 SRQuery(T 6 T 7, {T 6, T 7 }) T 9 Reduce(CompressRD, T 8 )

169 Detalhes de Implementação Java Versão 6 Update 15 HSQLDB Drivers JDBC MPJ arcabouço de paralelismo em Java PostgreSQL versão Código disponibilizado em: https://sourceforge.net/projects/scicumulus/

170 Representação dos Workflows <?xml version="1.0" standalone="no"?> <SciCumulus> <database name="scicumulus_adaptive" server="mp4-4.dyndns.info" port="5432" username="scicumulus" password="************" /> <SciCumulusWorkflow tag="filogenia" description="this is a test using anflex." exectag="experimento Kary/200 organismos - Adaptive" expdir="/root/exp"> <SciCumulusActivity tag="mafft" description="mafft" type="map" templatedir="/root/exp/template_mafft" activation="experiment.cmd"> <Relation reltype="input" name="a" filename="parameter.txt" /> <Field name="name" type="string" /> <Field name="fasta_file" type="string" /> <Relation reltype="output" name="c" filename="output_mafft.txt" /> <Field name="name" type="string" NAME;FASTA_FILE /> <Field name="num_seq" type="string" G1;ORTHOMCL2033 /> G2;ORTHOMCL1895 <Field name="fasta_file" type="string" /> <File filename="experiment.cmd" instrumented="true" /> </SciCumulusActivity> </SciCumulusWorkflow> </SciCumulus> G3;ORTHOMCL2034 G4;ORTHOMCL1896 G5;ORTHOMCL2035 G6;ORTHOMCL1897 G7;ORTHOMCL2036 G8;ORTHOMCL1898 G9;ORTHOMCL2037 G10;ORTHOMCL1899

171 Representação dos Workflows

172 Componente extrator de dados Como extrair dados de diferentes formatos (e.g. binário, Fasta, HDF5, etc.)? Componente extrator (baseado na álgebra) Invoca um programa externo (definido pelo usuário) que analisa os arquivos produzidos e extrai os metadados de interesse Encapsula regras de extração que são dependents de domínio Relações possuem dados da execução com dados do domínio 174

173 Extração de dados de domínio <SciCumulus> <database name="scicumulus" server="mp4-5b.dyndns.info" port="5432"/> <SciCumulusWorkflow tag="scievol" description="mer" exectag="scievol" expdir="/scievol/"> <SciCumulusActivity tag="msa" activation="./experiment.cmd" extractor="./extract_msa.cmd" > <Relation reltype="input" name="rel_in_1" filename="input_step_1.txt"/> <Relation reltype="output" name="rel_out_1" filename="output_step_1.txt"/> <File filename="experiment.cmd" instrumented="true"/> </SciCumulusActivity> </SciCumulusWorkflow> </SciCumulus> k file 1 gene13.hmmin k file e-value score fasta_id fasta_description taxonomy is_valid k file 1 gene13.hmmout./experiment.cmd Tp 1 Tp 2 a b./extract_msa.cmd 1 gene13.hmmout 3e phosphogluconate dehydrogenase Monosiga brevicollis True Tp 3 c./extract_msa.cmd Provenance Repository

174 Extração de Dados de Domínio Query: i e4sg6xc1v [M=483] E-value score Sequence Description Nome do arquivo e hypothetical protein [Monosiga brevicollis] 3.5e phosphogluconate dehydrogenase [Dictyostelium discoideum] 1.5e phosphogluconate dehydrogenase [Naegleria gruberi] 2.5e phosphogluconate dehydrogenase [Paulinella chromatophora] 2.6e phosphogluconate dehydrogenase [Thalassiosira pseudonana] 5.9e G6PDH/6PGDH fusion protein [Phaeodactylum tricornutum] 8.3e phosphogluconate dehydrogenase [Plasmodium knowlesi] 2.2e phosphogluconate dehydrogenase, put. [Plasmodium falciparum] 1.4e phosphogluconate dehydrogenase [Plasmodium berghei] 4.2e phosphogluconate dehydrogenase [Theileria annulata] 1.8e phosphogluconate dehydrogenase G6PDH [Theileria parva] 1.2e predicted protein [Thalassiosira pseudonana] 3.5e hypothetical protein [Plasmodium chabaudi] 8.4e phosphogluconate dehydrogenase [Trypanosoma cruzi] Valor produzido por ferramentas do workflow Obtido em serviços Web de terceiros (NCBI)

175 Consulta utilizando dados de domínio Quais sequencias dadas como entrada não fazem parte de um gene específico? SELECT S.NCBI_Ref_Sequence FROM Task T, Hits H, MSA_CONVERTED M2, MSA M1, SEQUENCE_GROUP SG, SEQUENCE S, ORGANISM O, SPECIE SP, GENUS G WHERE T.taskid = H.taskid AND H.msacid = M2.msacid AND M2.msaid = M1.msaid AND M1.sgid = SG.sgid AND SG.sqid = S.sqid AND S.orgid = O.orgid AND O.spid = SP.spid and SP.genid = G.genid AND T.exitStatus = 0 /* No error */ AND G.genus = PLASMODIUM

176 Roteiro do Tutorial Motivação Workflows Científicos Nuvens de Computadores Proveniência de Dados Máquina de Execução SciCumulus Aplicação de Proveniência em e-science na Nuvem Demo

177 especificação do workflow validação, verificação e publicação dos resultados descoberta composição transferência de dados para a nuvem análise Dados de Proveniência configuração Configuração do cluster virtual download de dados da nuvem execução redimensionamento 179 monitoramento da execução na nuvem execução distribuída e paralela do workflow

178 validação, verificação e publicação dos resultados descoberta composição especificação do workflow Apoio nas diversas fases! transferência de dados para a nuvem análise Dados de Proveniência configuração Configuração do cluster virtual download de dados da nuvem execução redimensionamento 180 monitoramento da execução na nuvem execução distribuída e paralela do workflow

179 O uso da proveniência Monitoramento Recuperação de Falhas Escalonamento de Atividades Otimização Dimensionamento

180 Dimensionamento do Ambiente Recursos são instanciados sob demanda Vários tipos de máquinas virtuais passíveis de uso Capacidade de armazenamento CPU Memória Largura de banda Variação de provedor para provedor

181 Dimensionamento do Ambiente Recursos são instanciados sob demanda Vários tipos Qual de tipo máquinas utilizar? virtuais passíveis de uso Quantas máquinas instanciar? Capacidade de armazenamento CPU Memória Largura de banda Força bruta? Variação de provedor para provedor

182 Dimensionamento do Ambiente

183 Dimensionamento do Ambiente

184 Dimensionamento do Ambiente Dimensionamento leva em consideração características do workflow Histórico de execução é utilizado Proveniência retrospectiva Características do ambiente Redução do tempo de execução e dos custos Evita o super e o sub dimensionamento!

185 Quais dados são importantes?

186 SciCumulus-ECM Baseado em algoritmos genéticos Alimenta o algoritmo com os dados históricos de proveniência Com uma base de proveniência de tamanho médio (aprox. 100 execuções de workflows) o algoritmo apresenta uma convergência rápida Utilização do arcabouço JGAP

187 Número de núcleos virtuais utilizados Análise da Execução Adaptativa Otimizando a Quantidade de Máquinas Virtuais 400 arquivos multi-fasta % de diferença de tempo de execução Cenário com foco no tempo de execução 2 0 Tempo de Execução (seg) Adaptativo sem SciCumulus-ECM Adaptativo com SciCumulus-ECM Orçamento limite de US$ 75,00 189

188 Processo de otimização de workflows Expressões algébricas iniciais Geração do espaço de busca Regras de transformação Expressões algébricas equivalentes Avaliação de estratégia de busca Modelo de custo sim Procurar mais? não expressão algébrica ótima

189 Transformações algébricas (i - workflow - perspectiva de relações) Map Filter R S T (ii - workflow otimizado) Filter Map R T S Garantia do esquema das atividades Similar a otimização de consultas na álgebra relacional Antecipação do Filtro Antecipação da seleção

190 Escalonamento Adaptativo O ambiente de nuvem possui instabilidades Falhas nas VMs Aplicação de atualizações Reinicializações Heterogeneidade das VMs O escalonamento deve levar essas características em consideração

191 Escalonamento Adaptativo ƒ(a i, VM j ) = 1 (Tempo de Execução + Tempo de Transferência) + 2 Custo de Confiabilidade + 3 ( Vh [Tempo de Execução + Tempo de Transferência] + Vt Quantidade de Dados Transferidos) A a i escolhida é aquela que satisfaz f(a i, VM j ) = min VM j VM {ƒ(a i, VM j )}

192 Escalonamento Adaptativo ƒ(a i, VM j ) = 1 (Tempo de Execução + Tempo de Transferência) + 2 Custo de Confiabilidade + 3 ( Vh [Tempo de Execução + Tempo de Transferência] + Vt Quantidade de Dados Transferidos) A a i escolhida é aquela que satisfaz f(a i, VM j ) = min VM j VM {ƒ(a i, VM j )}

193 Execução Adaptativa sem variação na quantidade de VMs Pico de melhora de 37,9% 1 = 0,9 2 = 0,05 3 = 0,05 17,73 horas 15,24 horas 1,5 horas

194 0 1303,2 2606,4 3909,6 5212, ,2 9122, , , , , , , , , , , , , , , Número de núcleos virtuais utilizados Execução Adaptativa variação na quantidade de VMs Tempo de Execução (seg) Adaptativo sem Proveniência Adaptativo com Proveniência Ideal

195 Monitoramento Execuções podem durar semanas ou meses Monitoramento in situ é inviável Utilização de redes sociais e computação móvel

196 SciLightning Serviço de monitoramento de execução de workflows científicos em paralelo 3 componentes principais: SciLightning Monitor SciLightning Social SciLightning Mobile Todo o monitoramento é baseado nos dados de proveniência gerados pelo SciCumulus PINTAS, J. ; OLIVEIRA, D. ; OCANA, K. ; DIAS, J. ; MATTOSO, M. L. Q.. Monitoramento em Tempo Real de Workflows Científicos Executados em Paralelo em Ambientes Distribuídos. In: VI e-science Workshop (em conjunto com CSBC 2012), 2012, Curitiba. Anais do VI e-science Workshop (em conjunto com CSBC 2012). Porto Alegre : Sociedade Brasileira de Computação, 2012.

197 SGWfC Repositório de Proveniência <<Definição>> <<Proveniência>> [Coordenador] <<Notificação>> <<Notificação>> [Usuário] <<Evento>> <<Regras>> Cartucho Social Monitor Regras Mobile <<Proveniência> <<Notificação>> Google Cloud Messaging for Android <<Notificação>> [Usuário]

198 SciLightning Recebimento de aviso assíncrono Detalhamento da notificação

199 Recuperação de Falhas Falha de VMs é um problema constante O provedor garante a reposição de uma VM, mas não de seu contexto O cientista não deve re-executar atividades que já foram executadas anteriormente Proveniência fornece esse tipo de informação de contexto da execução

200 SciMultaneous Serviço de re-execução de atividades Explora características da nuvem como elasticidade por meio de duas heurísticas H1: Redundância de atividades H2: Monitoramento contínuo COSTA, F. ; OLIVEIRA, D. ; OCANA, K. ; OGASAWARA, E. ; MATTOSO, M. L. Q.. Enabling Re-Executions of Parallel Scientific Workflows Using Runtime Provenance Data. In: 4th International Provenance and Annotation Workshop, 2012, Santa Barbara, CA. Proceedings of the 4th International Provenance and Annotation Workshop. Heildelberg : Springer Verlag, 2012.

201 Consulta de Proveniência Recuperar, por ordem crescente de execuções dos workflows, as datas de início e término, tags dos workflows, bem como o nome de todas as atividades associadas e que contenham alguma execução com erro. SELECT w.tag, a.tag, t.exitstatus, t.processor, t.workspace, t.status, t.endtime, t.starttime, extract ('epoch' from (t.endtime-t.starttime)) ',' as duration from hworkflow w, hactivity a, hactivation t where w.wkfid = a.wkfid and a.actid = t.actid and not exists (select * from hactivation a2 where a2.actid = a.actid and a2.exitstatus <> 0) order by w.wkfid

202 SciMultaneous

203 Visualização A visualização dos dados dos experimentos é uma tarefa fundamental de análise Grande volume de dados Necessidade de associar metadados a imagens e vídeos produzidos Necessidade de utilização de ambientes de visualização como tiled walls displays

204 PROV-Vis

205 PROV-Vis Dados de Proveniência

206 Roteiro do Tutorial Motivação Workflows Científicos Nuvens de Computadores Proveniência de Dados Máquina de Execução SciCumulus Aplicação de Proveniência em e-science Demo

207 Demo SciCumulus Utilização do ambiente Amazon EC2 Necessário que o usuário possua uma conta Imagem pública: ami-6e1a8907 Linux CentOS 5.5 SciCumulus java -jar scicumulus-core.jar 0 /root/expsciphy/machines.conf niodev MPI 2 /root/expsciphy/scicumulus.xml

208 Download

209 Configuração do Workflow

210 Configuração do Workflow Definição do Workflow

211 Configuração do Workflow Definição dos templates das atividades

212 Configuração do Workflow

213 Representação dos Workflows <?xml version="1.0" standalone="no"?> <SciCumulus> <database name="scicumulus_adaptive" server="mp4-4.dyndns.info" port="5432" username="scicumulus" password="************" /> <SciCumulusWorkflow tag="filogenia" description="this is a test using anflex." exectag="experimento Kary/200 organismos - Adaptive" expdir="/root/exp"> <SciCumulusActivity tag="mafft" description="mafft" type="map" templatedir="/root/exp/template_mafft" activation="experiment.cmd"> <Relation reltype="input" name="a" filename="parameter.txt" /> <Field name="name" type="string" /> <Field name="fasta_file" type="string" /> <Relation reltype="output" name="c" filename="output_mafft.txt" /> <Field name="name" type="string" NAME;FASTA_FILE /> <Field name="num_seq" type="string" G1;ORTHOMCL2033 /> G2;ORTHOMCL1895 <Field name="fasta_file" type="string" /> <File filename="experiment.cmd" instrumented="true" /> </SciCumulusActivity> </SciCumulusWorkflow> </SciCumulus> G3;ORTHOMCL2034 G4;ORTHOMCL1896 G5;ORTHOMCL2035 G6;ORTHOMCL1897 G7;ORTHOMCL2036 G8;ORTHOMCL1898 G9;ORTHOMCL2037 G10;ORTHOMCL1899

214 Configuração do Workflow

215 Configuração do Workflow

216 Configuração do Workflow

217 Quer saber mais sobre banco de Não perca! dados e nuvens? Análise em Big Data e um Estudo de Caso utilizando Ambientes de Computação em Nuvem Ticiana L. C. da Silva, Flávio R. C. Sousa, José Antônio F. de Macêdo e Javam C. Machado Quinta-feira 03 de outubro 09:00 Sala Imperial

218 Agradecimentos

SciCumulus 2.0: Um Sistema de Gerência de Workflows Científicos para Nuvens Orientado a Fluxo de Dados *

SciCumulus 2.0: Um Sistema de Gerência de Workflows Científicos para Nuvens Orientado a Fluxo de Dados * paper:6 SciCumulus 2.0: Um Sistema de Gerência de Workflows Científicos para Nuvens Orientado a Fluxo de Dados * Vítor Silva 1, Daniel de Oliveira 2 e Marta Mattoso 1 1 COPPE Universidade Federal do Rio

Leia mais

Distribuição de Bases de Dados de Proveniência na Nuvem *

Distribuição de Bases de Dados de Proveniência na Nuvem * Distribuição de Bases de Dados de Proveniência na Nuvem * Edimar Santos 1, Vanessa Assis 1, Flavio Costa 1, Daniel de Oliveira 2 e Marta Mattoso 1 1 Programa de Engenharia de Sistemas e Computação COPPE

Leia mais

Monitoramento em Tempo Real de Workflows Científicos Executados em Paralelo em Ambientes Distribuídos *

Monitoramento em Tempo Real de Workflows Científicos Executados em Paralelo em Ambientes Distribuídos * Monitoramento em Tempo Real de Workflows Científicos Executados em Paralelo em Ambientes Distribuídos * Julliano Pintas, Daniel de Oliveira, Kary Ocaña, Jonas Dias, Marta Mattoso Programa de Engenharia

Leia mais

Heurísticas para Controle de Execução de Atividades de Workflows Científicos na Nuvem 1

Heurísticas para Controle de Execução de Atividades de Workflows Científicos na Nuvem 1 Heurísticas para Controle de Execução de Atividades de Workflows Científicos na Nuvem 1 Flavio da Silva Costa Orientadora: Marta Mattoso Colaborador: Daniel de Oliveira Nível: Mestrado Programa de Engenharia

Leia mais

23/05/12. Computação em Nuvem. Computação em nuvem: gerenciamento de dados. Computação em Nuvem - Características principais

23/05/12. Computação em Nuvem. Computação em nuvem: gerenciamento de dados. Computação em Nuvem - Características principais Computação em Nuvem Computação em nuvem: gerenciamento de dados Computação em nuvem (Cloud Computing) é uma tendência recente de tecnologia cujo objetivo é proporcionar serviços de Tecnologia da Informação

Leia mais

Gerenciamento e Interoperabilidade de Redes

Gerenciamento e Interoperabilidade de Redes EN-3610 Gerenciamento e Interoperabilidade de Redes Computação em Nuvem Introdução Centralização do processamento Surgimento da Teleinformática Década de 60 Execução de programas localmente Computadores

Leia mais

Carlos Eduardo Paulino Silva

Carlos Eduardo Paulino Silva CAPTURA DE DADOS DE PROVENIÊNCIA DE WORKFLOWS CIENTÍFICOS EM NUVENS COMPUTACIONAIS Carlos Eduardo Paulino Silva Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia de Sistemas

Leia mais

DAS6607 - Inteligência Artificial Aplicada à Controle de Processos e Automação Industrial

DAS6607 - Inteligência Artificial Aplicada à Controle de Processos e Automação Industrial DAS6607 - Inteligência Artificial Aplicada à Controle de Processos e Automação Industrial Aluno: André Faria Ruaro Professores: Jomi F. Hubner e Ricardo J. Rabelo 29/11/2013 1. Introdução e Motivação 2.

Leia mais

Computação em Nuvem & OpenStack

Computação em Nuvem & OpenStack Computação em Nuvem & OpenStack Grupo de Pesquisa em Software e Hardware Livre Ação Computação em Nuvem: Charles Christian Miers André Rover de Campos Glauber Cassiano Batista Joinville Roteiro Definições

Leia mais

SimiFlow: Uma Arquitetura para Agrupamento de Workflows por Similaridade

SimiFlow: Uma Arquitetura para Agrupamento de Workflows por Similaridade SimiFlow: Uma Arquitetura para Agrupamento de Workflows por Similaridade Vítor Silva, Fernando Chirigati, Kely Maia, Eduardo Ogasawara, Daniel de Oliveira, Vanessa Braganholo, Leonardo Murta, Marta Mattoso

Leia mais

Paralelização de Tarefas de Mineração de Dados Utilizando Workflows Científicos 1

Paralelização de Tarefas de Mineração de Dados Utilizando Workflows Científicos 1 Paralelização de Tarefas de Mineração de Dados Utilizando Workflows Científicos 1 Carlos Eduardo Barbosa, Eduardo Ogasawara, Daniel de Oliveira, Marta Mattoso PESC COPPE Universidade Federal do Rio de

Leia mais

Linhas de Experimentos: Reutilização e Gerência de Configuração em Workflows científicos

Linhas de Experimentos: Reutilização e Gerência de Configuração em Workflows científicos Linhas de Experimentos: Reutilização e Gerência de Configuração em Workflows científicos Eduardo Ogasawara Leonardo Murta Cláudia Werner Marta Mattoso 1 Sumário Introdução Análise de SGWfC pela perspectiva

Leia mais

Características Básicas de Sistemas Distribuídos

Características Básicas de Sistemas Distribuídos Motivação Crescente dependência dos usuários aos sistemas: necessidade de partilhar dados e recursos entre utilizadores; porque os recursos estão naturalmente em máquinas diferentes. Demanda computacional

Leia mais

Computação em Grid e em Nuvem

Computação em Grid e em Nuvem Computação em Grid e em Nuvem Computação em Nuvem Molos 1 Definição Um grid computacional é uma coleção recursos computacionais e comunicação utilizados para execução aplicações Usuário vê o grid como

Leia mais

Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores

Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores Faculdade Integrada do Ceará FIC Graduação em Redes de Computadores Disciplina - Sistemas Distribuídos Prof. Andrey Halysson Lima Barbosa Aula 12 Computação em Nuvem Sumário Introdução Arquitetura Provedores

Leia mais

The Eucalyptus Open- source Cloud-computing System. Janaina Siqueira Lara Wilpert Marcelo Scheidt Renata Silva

The Eucalyptus Open- source Cloud-computing System. Janaina Siqueira Lara Wilpert Marcelo Scheidt Renata Silva The Eucalyptus Open- source Cloud-computing System Janaina Siqueira Lara Wilpert Marcelo Scheidt Renata Silva Sumário Introdução Trabalhos Correlatos Eucalyptus Design Conclusões Visão Geral Introdução:

Leia mais

Arquitetura e Sistema de Monitoramento para

Arquitetura e Sistema de Monitoramento para Arquitetura e Sistema de Monitoramento para 1 Computação em Nuvem Privada Mestranda: Shirlei A. de Chaves Orientador: Prof. Dr. Carlos Becker Westphall Colaborador: Rafael B. Uriarte Introdução Computação

Leia mais

UMA ABORDAGEM PARA ALTERAÇÃO NA DEFINIÇÃO DE ATIVIDADES DE WORKFLOWS CIENTÍFICOS EM TEMPO DE EXECUÇÃO. Igor de Araujo dos Santos

UMA ABORDAGEM PARA ALTERAÇÃO NA DEFINIÇÃO DE ATIVIDADES DE WORKFLOWS CIENTÍFICOS EM TEMPO DE EXECUÇÃO. Igor de Araujo dos Santos UMA ABORDAGEM PARA ALTERAÇÃO NA DEFINIÇÃO DE ATIVIDADES DE WORKFLOWS CIENTÍFICOS EM TEMPO DE EXECUÇÃO Igor de Araujo dos Santos Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia

Leia mais

Panorama de Aplicações de Alto Desempenho em Nuvem

Panorama de Aplicações de Alto Desempenho em Nuvem EXTRAÇÃO DE DADOS NO CONTEXTO DE UMA REDE SOCIAL DE CONSUMO Panorama de Aplicações de Alto Desempenho em Nuvem Jonathan Patrick Rosso, Claudio Schepke jonathan.p.rosso@gmail.com, claudioschepke@unipampa.edu.br

Leia mais

Gerenciamento de Workflows Científicos em Bioinformática

Gerenciamento de Workflows Científicos em Bioinformática Gerenciamento de Workflows Científicos em Bioinformática Agosto de 2007 Estudante: Orientador: Co-orientadora: Luciano Antonio Digiampietri João Carlos Setubal Claudia Bauzer Medeiros Roteiro Introdução

Leia mais

SciProvMiner: Arquitetura para Captura de Proveniência de dados de Workflows Científicos utilizando o Modelo OPM

SciProvMiner: Arquitetura para Captura de Proveniência de dados de Workflows Científicos utilizando o Modelo OPM SciProvMiner: Arquitetura para Captura de Proveniência de dados de Workflows Científicos utilizando o Modelo OPM Tatiane O. M. Alves Regina M. M. Braga Departamento de Ciência da Computação Universidade

Leia mais

Tipos de Sistemas Distribuídos (Cluster e Grid)

Tipos de Sistemas Distribuídos (Cluster e Grid) Tipos de Sistemas Distribuídos (Cluster e Grid) Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência

Leia mais

Levantamento sobre Computação em Nuvens

Levantamento sobre Computação em Nuvens Levantamento sobre Computação em Nuvens Mozart Lemos de Siqueira Doutor em Ciência da Computação Centro Universitário Ritter dos Reis Sistemas de Informação: Ciência e Tecnologia Aplicadas mozarts@uniritter.edu.br

Leia mais

CLOUD COMPUTING. Andrêza Leite. andreza.leite@univasf.edu.br

CLOUD COMPUTING. Andrêza Leite. andreza.leite@univasf.edu.br CLOUD COMPUTING Andrêza Leite andreza.leite@univasf.edu.br Roteiro O que é cloud computing? Classificação O que está 'por traz' da cloud? Exemplos Como montar a sua? O que é cloud computing? Cloud Computing

Leia mais

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2

Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Curso Tecnológico de Redes de Computadores 5º período Disciplina: Tecnologia WEB Professor: José Maurício S. Pinheiro V. 2009-2 Aula 1 Conceitos da Computação em Nuvem A computação em nuvem ou cloud computing

Leia mais

Captura de Metadados de Proveniência para Workflows Científicos em Nuvens Computacionais

Captura de Metadados de Proveniência para Workflows Científicos em Nuvens Computacionais Captura de Metadados de Proveniência para Workflows Científicos em Nuvens Computacionais Carlos Paulino, Daniel de Oliveira, Sérgio Manuel Serra da Cruz, Maria Luiza Machado Campos, Marta Mattoso Universidade

Leia mais

Segurança da Informação

Segurança da Informação INF 108 Segurança da Informação Computação em Nuvem Prof. João Henrique Kleinschmidt Introdução Centralização do processamento Surgimento da Teleinformática Década de 60 Execução de programas localmente

Leia mais

Avaliação dos Dados de Domínio de Análises Filogenéticas por Meio de Workflows Científicos e Mineração de Dados

Avaliação dos Dados de Domínio de Análises Filogenéticas por Meio de Workflows Científicos e Mineração de Dados Avaliação dos Dados de Domínio de Análises Filogenéticas por Meio de Workflows Científicos e Mineração de Dados Lygia Marina Mendes da Costa Projeto de Graduação apresentado ao Curso de Engenharia de Computação

Leia mais

MODELAGEM DE UM DATA WAREHOUSE DE DADOS DE PROVENIÊNCIA EM UM AMBIENTE DISTRIBUÍDO PARA OTIMIZAR EXPERIMENTOS CIENTÍFICOS

MODELAGEM DE UM DATA WAREHOUSE DE DADOS DE PROVENIÊNCIA EM UM AMBIENTE DISTRIBUÍDO PARA OTIMIZAR EXPERIMENTOS CIENTÍFICOS MODELAGEM DE UM DATA WAREHOUSE DE DADOS DE PROVENIÊNCIA EM UM AMBIENTE DISTRIBUÍDO PARA OTIMIZAR EXPERIMENTOS CIENTÍFICOS Vinícius Neves Motta Projeto de Graduação apresentado ao Curso de Engenharia de

Leia mais

EUCALYPTUS: UMA PLATAFORMA CLOUD COMPUTING PARA

EUCALYPTUS: UMA PLATAFORMA CLOUD COMPUTING PARA EUCALYPTUS: UMA PLATAFORMA CLOUD COMPUTING PARA QUALQUER TIPO DE USUÁRIO Gustavo Henrique Rodrigues Pinto Tomas 317624 AGENDA Introdução: Cloud Computing Modelos de Implementação Modelos de Serviço Eucalyptus

Leia mais

CloudNet: dynamic pooling of cloud resources by live WAN migration of virtual machines

CloudNet: dynamic pooling of cloud resources by live WAN migration of virtual machines CloudNet: dynamic pooling of cloud resources by live WAN migration of virtual machines Timothy Wood, Prashant Shenoy, K.K. Ramakrishnan, Jacobus Van der Merwe VEE '11 Proceedings of the 7th ACM SIGPLAN/SIGOPS

Leia mais

Expandindo uma Arquitetura para HPC em Nuvens Computacionais Utilizando Conceitos de Computação

Expandindo uma Arquitetura para HPC em Nuvens Computacionais Utilizando Conceitos de Computação Expandindo uma Arquitetura para HPC em Nuvens Computacionais Utilizando Conceitos de Computação Autonômica Emanuel F. Coutinho 1, Gabriel A. L. Paillard 1 Leonardo O. Moreira 1, Ernesto Trajano de Lima

Leia mais

Extendendo Grids com gerenciamento de recursos de Cloud para computação científica

Extendendo Grids com gerenciamento de recursos de Cloud para computação científica Extendendo Grids com gerenciamento de recursos de Cloud para computação científica 1. Introdução Bruno Barcarollo Gauer 1 1 Universidade Federal do Paraná (UFPR) Curitiba PR Brazil bbg09@inf.ufpr.br A

Leia mais

SciCumulus-ECM: Um Serviço de Custos para a Execução de Workflows Científicos em Nuvens Computacionais 1

SciCumulus-ECM: Um Serviço de Custos para a Execução de Workflows Científicos em Nuvens Computacionais 1 SciCumulus-ECM: Um Serviço de Custos para a Execução de Workflows Científicos em Nuvens Computacionais 1 Vitor Viana 1, Daniel de Oliveira 1, Eduardo Ogasawara 1,2, Marta Mattoso 1 1 Universidade Federal

Leia mais

IMPLANTAÇÃO DE UM AMBIENTE DE ALTA DISPONIBILIDADE DE REDE E MONITORAÇÃO DINÂMICA DE INFRAESTRUTURA EM SERVIDORES WEB.

IMPLANTAÇÃO DE UM AMBIENTE DE ALTA DISPONIBILIDADE DE REDE E MONITORAÇÃO DINÂMICA DE INFRAESTRUTURA EM SERVIDORES WEB. IMPLANTAÇÃO DE UM AMBIENTE DE ALTA DISPONIBILIDADE DE REDE E MONITORAÇÃO DINÂMICA DE INFRAESTRUTURA EM SERVIDORES WEB. Marllus de Melo Lustosa (bolsista do PIBIC/UFPI), Luiz Cláudio Demes da Mata Sousa

Leia mais

CloudSimDB: Um Simulador para o Provisionamento de Máquinas Virtuais para o Processamento de Aplicações Centradas em Banco de Dados *

CloudSimDB: Um Simulador para o Provisionamento de Máquinas Virtuais para o Processamento de Aplicações Centradas em Banco de Dados * CloudSimDB: Um Simulador para o Provisionamento de Máquinas Virtuais para o Processamento de Aplicações Centradas em Banco de Dados * Humberto Lima, Felipe Aragão, Jonas Lima, Flávio R.C. Sousa, José Maria

Leia mais

Fernando Seabra Chirigati. Universidade Federal do Rio de Janeiro EEL879 - Redes de Computadores II Professores Luís Henrique Costa e Otto Duarte

Fernando Seabra Chirigati. Universidade Federal do Rio de Janeiro EEL879 - Redes de Computadores II Professores Luís Henrique Costa e Otto Duarte Fernando Seabra Chirigati Universidade Federal do Rio de Janeiro EEL879 - Redes de Computadores II Professores Luís Henrique Costa e Otto Duarte Introdução Grid x Nuvem Componentes Arquitetura Vantagens

Leia mais

PROV-VIS: VISUALIZAÇÃO DE DADOS DE EXPERIMENTOS EM LARGA ESCALA POR MEIO DE PROVENIÊNCIA

PROV-VIS: VISUALIZAÇÃO DE DADOS DE EXPERIMENTOS EM LARGA ESCALA POR MEIO DE PROVENIÊNCIA PROV-VIS: VISUALIZAÇÃO DE DADOS DE EXPERIMENTOS EM LARGA ESCALA POR MEIO DE PROVENIÊNCIA Felipe Figueira Horta Projeto de Graduação apresentado ao Curso de Engenharia de Computação e Informação da Escola

Leia mais

Proposta para Grupo de Trabalho. GT-Computação em Nuvem para Ciência: Armazenamento de Dados. Roberto Samarone dos Santos Araujo

Proposta para Grupo de Trabalho. GT-Computação em Nuvem para Ciência: Armazenamento de Dados. Roberto Samarone dos Santos Araujo Proposta para Grupo de Trabalho GT-Computação em Nuvem para Ciência: Armazenamento de Dados Roberto Samarone dos Santos Araujo Agosto/2011 1 Título GT-Computação em Nuvem para Ciência: Armazenamento de

Leia mais

RELATÓRIO DE ATIVIDADES DISCIPLINA: ARQUITETURAS PARALELAS. Hadoop e QEF: Uma abordagem distribuída para aplicações de Astronomia

RELATÓRIO DE ATIVIDADES DISCIPLINA: ARQUITETURAS PARALELAS. Hadoop e QEF: Uma abordagem distribuída para aplicações de Astronomia UNIVERSIDADE FEDERAL FLUMINENSE INSTITUTO DE COMPUTAÇÃO (IC) RELATÓRIO DE ATIVIDADES DISCIPLINA: ARQUITETURAS PARALELAS Hadoop e QEF: Uma abordagem distribuída para aplicações de Astronomia Henrique Klôh

Leia mais

CONCEITOS E APLICAÇÕES DA COMPUTAÇÃO EM NUVEM

CONCEITOS E APLICAÇÕES DA COMPUTAÇÃO EM NUVEM CONCEITOS E APLICAÇÕES DA COMPUTAÇÃO EM NUVEM Rogério Schueroff Vandresen¹, Willian Barbosa Magalhães¹ ¹Universidade Paranaense(UNIPAR) Paranavaí-PR-Brasil rogeriovandresen@gmail.com, wmagalhaes@unipar.br

Leia mais

4 Solução Proposta. 4.1 Escopo Proposto

4 Solução Proposta. 4.1 Escopo Proposto 30 4 Solução Proposta 4.1 Escopo Proposto Neste trabalho propomos um arcabouço genérico que permite implementar leques de serviços baseados na Simulação de Monte Carlo, utilizando o ambiente de computação

Leia mais

Cloud Computing. Andrêza Leite. andreza.lba@gmail.com

Cloud Computing. Andrêza Leite. andreza.lba@gmail.com Cloud Computing Andrêza Leite andreza.lba@gmail.com Roteiro O que é cloud computing? Classificação O que está 'por traz' da cloud? Exemplos Como montar a sua? O que é cloud computing? Cloud Computing O

Leia mais

Avaliação de dependabilidade em infraestruturas Eucalyptus geograficamente distribuídas

Avaliação de dependabilidade em infraestruturas Eucalyptus geograficamente distribuídas Avaliação de dependabilidade em infraestruturas Eucalyptus geograficamente distribuídas Jonathan Brilhante(jlgapb@cin.ufpe), Bruno Silva(bs@cin.ufpe) e Paulo Maciel(prmm@cin.ufpe) Agenda 1. 2. 3. 4. 5.

Leia mais

Grades Computacionais: Uma Introdução Prática

Grades Computacionais: Uma Introdução Prática Grades Computacionais: Uma Introdução Prática Raphael Y. de Camargo Ricardo Andrade Departamento de Ciência da Computação Instituto de Matemática e Estatística Universidade de São Paulo, Brasil São Paulo,

Leia mais

UMA ABORDAGEM DE APOIO À EXECUÇÃO PARALELA DE WORKFLOWS CIENTÍFICOS EM NUVENS DE COMPUTADORES. Daniel Cardoso Moraes de Oliveira

UMA ABORDAGEM DE APOIO À EXECUÇÃO PARALELA DE WORKFLOWS CIENTÍFICOS EM NUVENS DE COMPUTADORES. Daniel Cardoso Moraes de Oliveira UMA ABORDAGEM DE APOIO À EXECUÇÃO PARALELA DE WORKFLOWS CIENTÍFICOS EM NUVENS DE COMPUTADORES Daniel Cardoso Moraes de Oliveira Tese de Doutorado apresentada ao Programa de Pós-graduação em Engenharia

Leia mais

CLOUD COMPUTING PEDRO MORHY BORGES LEAL. MAC0412 - Organização de Computadores Prof. Alfredo Goldman 7 de dezembro de 2010

CLOUD COMPUTING PEDRO MORHY BORGES LEAL. MAC0412 - Organização de Computadores Prof. Alfredo Goldman 7 de dezembro de 2010 CLOUD COMPUTING PEDRO MORHY BORGES LEAL MAC0412 - Organização de Computadores Prof. Alfredo Goldman 7 de dezembro de 2010 0 CLOUD COMPUTING 1 1. Introdução Com o grande avanço da tecnologia de processadores,

Leia mais

Cloud Computing. O modelo no cenário Geoespacial. Technology Session Latin America Geospatial Forum. 15-17 August 2012 Rio de Janeiro

Cloud Computing. O modelo no cenário Geoespacial. Technology Session Latin America Geospatial Forum. 15-17 August 2012 Rio de Janeiro Cloud Computing O modelo no cenário Geoespacial Technology Session Latin America Geospatial Forum 15-17 August 2012 Rio de Janeiro Iara Musse Felix Diretora, Santiago e Cintra Consultoria, Brazil Alguns

Leia mais

Uso de SGBDs NoSQL na Gerência da Proveniência Distribuída em Workflows Científicos

Uso de SGBDs NoSQL na Gerência da Proveniência Distribuída em Workflows Científicos Uso de SGBDs NoSQL na Gerência da Proveniência Distribuída em Workflows Científicos Guilherme R. Ferreira, Carlos Filipe Jr. e Daniel de Oliveira Instituto de Computação Universidade Federal Fluminense

Leia mais

Acelere a sua jornada à nuvem

Acelere a sua jornada à nuvem Boletim técnico Acelere a sua jornada à nuvem Arquitetura de nuvem convergente da HP Índice Uma nova computação para a empresa... 2 Evolua a sua estratégia de TI para incluir serviços da nuvem... 2 A nova

Leia mais

XML e Banco de Dados. Prof. Daniela Barreiro Claro DCC/IM/UFBA

XML e Banco de Dados. Prof. Daniela Barreiro Claro DCC/IM/UFBA XML e Banco de Dados DCC/IM/UFBA Banco de Dados na Web Armazenamento de dados na Web HTML muito utilizada para formatar e estruturar documentos na Web Não é adequada para especificar dados estruturados

Leia mais

Planejamento Estratégico de TI. Felipe Pontes felipe.pontes@gmail.com

Planejamento Estratégico de TI. Felipe Pontes felipe.pontes@gmail.com Planejamento Estratégico de TI Felipe Pontes felipe.pontes@gmail.com VPN Virtual Private Network Permite acesso aos recursos computacionais da empresa via Internet de forma segura Conexão criptografada

Leia mais

2 Preliminares. 2.1. Estado da Arte. 2.1.1. Workflows Científicos

2 Preliminares. 2.1. Estado da Arte. 2.1.1. Workflows Científicos 2 Preliminares 2.1. Estado da Arte 2.1.1. Workflows Científicos As primeiras definições de workflow surgiram como uma forma de descrever processos realizados em escritório, que configuram uma sequência

Leia mais

2 Computação na Nuvem

2 Computação na Nuvem 18 2 Computação na Nuvem 2.1 Definição A ideia essencial da computação na nuvem é permitir um novo modelo onde o consumo de recursos computacionais, e.g., armazenamento, processamento, banda entrada e

Leia mais

SISTEMAS DISTRIBUÍDOS

SISTEMAS DISTRIBUÍDOS SISTEMAS DISTRIBUÍDOS Cluster, Grid e computação em nuvem Slide 8 Nielsen C. Damasceno Introdução Inicialmente, os ambientes distribuídos eram formados através de um cluster. Com o avanço das tecnologias

Leia mais

Projeto de Arquitetura

Projeto de Arquitetura Projeto de Arquitetura Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 11 Slide 1 Objetivos Apresentar projeto de arquitetura e discutir sua importância Explicar as decisões de projeto

Leia mais

UNIVERSIDADE FEDERAL DE SANTA CATARINA

UNIVERSIDADE FEDERAL DE SANTA CATARINA UNIVERSIDADE FEDERAL DE SANTA CATARINA Uso Eficiente De Energia Para Cloud Computing Através De Simulações Rafael Rodrigues de Freitas Florianópolis SC 2011/2 UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO

Leia mais

Computação em Nuvem. (Cloud Computing) Pesquisa & Desenvolvimento

Computação em Nuvem. (Cloud Computing) Pesquisa & Desenvolvimento Computação em Nuvem (Cloud Computing) Pesquisa & Desenvolvimento Santo André: 20 de fevereiro de 2013 Características de um bom Data Center Bom Desempenho Escalabilidade Alta Disponibilidade Economia Gerência

Leia mais

CA Nimsoft Monitor para servidores

CA Nimsoft Monitor para servidores DOCUMENTAÇÃO TÉCNICA Setembro de 2012 CA Nimsoft Monitor para servidores agility made possible CA Nimsoft para monitoramento de servidores sumário CA Nimsoft Monitor para servidores 3 visão geral da solução

Leia mais

PEER DATA MANAGEMENT SYSTEM

PEER DATA MANAGEMENT SYSTEM PEER DATA MANAGEMENT SYSTEM INTRODUÇÃO, INFRA-ESTRUTURA E MAPEAMENTO DE ESQUEMAS AGENDA Data Management System Peer Data Management System P2P Infra-estrutura Funcionamento do PDMS Mapeamento de Esquemas

Leia mais

Estratégias em Tecnologia da Informação

Estratégias em Tecnologia da Informação Estratégias em Tecnologia da Informação Capítulo 08 Alternativas de Investimento em TI Fábricas de software, Softwarehouses, Virtualização, Computação em Nuvem Datacenter Material de apoio 2 Esclarecimentos

Leia mais

Constate todo o potencial de aplicações Java virtualizadas

Constate todo o potencial de aplicações Java virtualizadas Um White Paper da Oracle Abril de 2010 Constate todo o potencial de aplicações Java virtualizadas Oracle WebLogic Server Virtual Edition Oracle Virtual Assembly Builder O Oracle WebLogic Server Virtual

Leia mais

Novas tecnologias otimizando a avaliação de bens

Novas tecnologias otimizando a avaliação de bens Novas tecnologias otimizando a avaliação de bens Avaliando Imóveis Urbanos em 2 minutos Antônio Pelli Neto Eng. Civil e Mecânico INTRODUÇÃO Agenda: Conceitos básicos sobre Avaliando nas Nuvens Porque somente

Leia mais

The Eucalyptus Open-source Cloud-computing System

The Eucalyptus Open-source Cloud-computing System The Eucalyptus Open-source Cloud-computing System O sistema Open Source de nuvens computacionais Eucalyptus Daniel Nurmi, Rich Wolski, Chris Grzegorczyk, Graziano Obertelli, Sunil Soman, Lamia Youseff,

Leia mais

Xen e a Arte da Virtualização

Xen e a Arte da Virtualização Xen e a Arte da Virtualização Paul Barham, Boris Dragovic, Keir Fraser, Steven Hand, Tim Harris, Alex Ho, Rolf Neugebauer, Ian Pratt, Andrew Warfield University of Cambridge Computer Laboratory Microsoft

Leia mais

Por Antonio Couto. Autor: Antonio Couto Enterprise Architect

Por Antonio Couto. Autor: Antonio Couto Enterprise Architect Cloud Computing e HP Converged Infrastructure Para fazer uso de uma private cloud, é necessário crescer em maturidade na direção de uma infraestrutura convergente. Por Antonio Couto O que é Cloud Computing?

Leia mais

Treinamento PostgreSQL Cluster de Banco de Dados - Aula 01

Treinamento PostgreSQL Cluster de Banco de Dados - Aula 01 Treinamento PostgreSQL Cluster de Banco de Dados - Aula 01 Eduardo Ferreira dos Santos SparkGroup Treinamento e Capacitação em Tecnologia eduardo.edusantos@gmail.com eduardosan.com 13 de Junho de 2013

Leia mais

A computação na nuvem é um novo modelo de computação que permite ao usuário final acessar uma grande quantidade de aplicações e serviços em qualquer

A computação na nuvem é um novo modelo de computação que permite ao usuário final acessar uma grande quantidade de aplicações e serviços em qualquer A computação na nuvem é um novo modelo de computação que permite ao usuário final acessar uma grande quantidade de aplicações e serviços em qualquer lugar e independente da plataforma, bastando para isso

Leia mais

O que é Grid Computing

O que é Grid Computing Grid Computing Agenda O que é Grid Computing Grid vs Cluster Benefícios Tipos de Grid Aplicações Ferramentas e padrões Exemplos no mundo Exemplos no Brasil Grid no mundo dos negócios Futuro O que é Grid

Leia mais

EMC UNIFIED INFRASTRUCTURE MANAGER

EMC UNIFIED INFRASTRUCTURE MANAGER EMC UNIFIED INFRASTRUCTURE MANAGER Facilite a transição para uma infraestrutura em nuvem privada ou híbrida nos Vblock Systems Crie um ambiente único e virtualizado Provisione como uma só infraestrutura

Leia mais

Houston, we have a cloud! Um estudo das aplicações da Computação Forense em uma das tecnologias mais evidentes da atualidade.

Houston, we have a cloud! Um estudo das aplicações da Computação Forense em uma das tecnologias mais evidentes da atualidade. Houston, we have a cloud! Um estudo das aplicações da Computação Forense em uma das tecnologias mais evidentes da atualidade. André Guaraldo (101487) Giuliano R. Pinheiro (108759) Oscar Esgalha (108231)

Leia mais

COMPUTAÇÃO EM NUVEM. Michele Marques Costa 1,2, Julio César2 ¹Universidade paranaense (Unipar)

COMPUTAÇÃO EM NUVEM. Michele Marques Costa 1,2, Julio César2 ¹Universidade paranaense (Unipar) COMPUTAÇÃO EM NUVEM Michele Marques Costa 1,2, Julio César2 ¹Universidade paranaense (Unipar) Paranavaí PR Brasil Mih_nai@hotmail.com juliocesar@unipar.br Resumo. Este artigo contém a definição e citação

Leia mais

Transparência em Experimentos Científicos Apoiados Em Proveniência: Uma Perspectiva para Workflows Científicos Transparentes

Transparência em Experimentos Científicos Apoiados Em Proveniência: Uma Perspectiva para Workflows Científicos Transparentes Transparência em Experimentos Científicos Apoiados Em Proveniência: Uma Perspectiva para Workflows Científicos Transparentes André Luiz de Castro Leal 1, Sergio Manuel Serra da Cruz 1,2,3 1 ICE/DEMAT Universidade

Leia mais

ANÁLISE COMPARATIVA DE PLATAFORMAS DE COMPUTAÇÃO EM NUVEM

ANÁLISE COMPARATIVA DE PLATAFORMAS DE COMPUTAÇÃO EM NUVEM ANÁLISE COMPARATIVA DE PLATAFORMAS DE COMPUTAÇÃO EM NUVEM Igor dos Passos Granado¹, Ricardo de Melo Germano¹, Claudete Werner¹, Gabriel Costa Silva² ¹Universidade Paranaense (Unipar) Paranavai PR Brasil

Leia mais

Cloud Computing O novo paradigma de Custeio. Anderson Baldin Figueiredo Consultor

Cloud Computing O novo paradigma de Custeio. Anderson Baldin Figueiredo Consultor Cloud Computing O novo paradigma de Custeio Anderson Baldin Figueiredo Consultor O momento da 3ª. Plataforma $$$$$ $ Conceituando Cloud Computing Mas o que significa cloud computing mesmo? Cloud = Evolução

Leia mais

OCEL001 Comércio Eletrônico Módulo 9_1: Clusters. Prof. Charles Christian Miers. e-mail: charles.miers@udesc.br

OCEL001 Comércio Eletrônico Módulo 9_1: Clusters. Prof. Charles Christian Miers. e-mail: charles.miers@udesc.br OCEL001 Comércio Eletrônico Módulo 9_1: Clusters Prof. Charles Christian Miers e-mail: charles.miers@udesc.br Redundância e Alta Disponibilidade Redundância: Duplicação de um elemento da infraestrutura

Leia mais

Cloud Computing. Edy Hayashida E-mail: edy.hayashida@uol.com.br

Cloud Computing. Edy Hayashida E-mail: edy.hayashida@uol.com.br Cloud Computing Edy Hayashida E-mail: edy.hayashida@uol.com.br Facebook 750 milhões de usuários 42% de todos os usuários do Facebook estão localizado na América, 27% na Ásia e 25% na Europa 4% na África

Leia mais

otimizando níveis de serviço em implantações na nuvem pública

otimizando níveis de serviço em implantações na nuvem pública DOCUMENTAÇÃO TÉCNICA otimizando níveis de serviço em implantações na nuvem pública chaves para o gerenciamento de serviços efetivo agility made possible sumário resumo executivo 3 Introdução: modelos de

Leia mais

SISTEMAS DE BANCO DE DADOS. Prof. Adriano Pereira Maranhão

SISTEMAS DE BANCO DE DADOS. Prof. Adriano Pereira Maranhão SISTEMAS DE BANCO DE DADOS Prof. Adriano Pereira Maranhão 1 REVISÃO BANCO DE DADOS I O que é banco de dados? Ou seja afinal o que é um SGBD? REVISÃO BD I REVISÃO DE BD I Um Sistema de Gerenciamento de

Leia mais

Inovação Social Com Big Data. Marcelo Sales CTO HDS América Latina

Inovação Social Com Big Data. Marcelo Sales CTO HDS América Latina Inovação Social Com Big Data Marcelo Sales CTO HDS América Latina POR QUE ESTAMOS FALANDO DE BIG DATA? BIG QUIZ Qual é o número de hits quando se pesquisa no Google pelo termo BIG DATA? BIG QUIZ RESPOSTA

Leia mais

BANCO DE DADOS DISTRIBUIDO PARA CONSULTA DE TEMPERATURA E UMIDADE UTILIZANDO ARDUINO E ANDROID

BANCO DE DADOS DISTRIBUIDO PARA CONSULTA DE TEMPERATURA E UMIDADE UTILIZANDO ARDUINO E ANDROID BANCO DE DADOS DISTRIBUIDO PARA CONSULTA DE TEMPERATURA E UMIDADE UTILIZANDO ARDUINO E ANDROID Douglas Bento Scriptore¹, José de Moura Júnior² ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil. douglasscriptore@gmail.com

Leia mais

1 http://www.google.com

1 http://www.google.com 1 Introdução A computação em grade se caracteriza pelo uso de recursos computacionais distribuídos em várias redes. Os diversos nós contribuem com capacidade de processamento, armazenamento de dados ou

Leia mais

Interoperabilidade entre Bancos de Dados Relacionais e Bancos de Dados NoSQL

Interoperabilidade entre Bancos de Dados Relacionais e Bancos de Dados NoSQL Minicurso: Interoperabilidade entre Bancos de Dados Relacionais e Bancos de Dados NoSQL Geomar A. Schreiner Ronaldo S. Mello Departamento de Informática e Estatística (INE) Programa de Pós-Graduação em

Leia mais

Usando Modelos Para Apoiar a Especificação e Verificação de Requisitos de Ubiquidade

Usando Modelos Para Apoiar a Especificação e Verificação de Requisitos de Ubiquidade Usando Modelos Para Apoiar a Especificação e Verificação de Requisitos de Ubiquidade Leonardo Mota, Jobson Massollar, Guilherme Horta Travassos Federal University of Rio de Janeiro/COPPE/PESC Caixa Postal

Leia mais

ADAPTANDO UMA APLICAÇÃO PARA CLOUD: UMA ANÁLISE ENTRE OS ESFORÇOS UTILIZADOS

ADAPTANDO UMA APLICAÇÃO PARA CLOUD: UMA ANÁLISE ENTRE OS ESFORÇOS UTILIZADOS ADAPTANDO UMA APLICAÇÃO PARA CLOUD: UMA ANÁLISE ENTRE OS ESFORÇOS UTILIZADOS Cleverson Nascimento de Mello¹, Claudete Werner¹, Gabriel Costa Silva² ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil

Leia mais

Universidade Agostinho Neto Faculdade de Ciências Departamento de Ciências da Computação

Universidade Agostinho Neto Faculdade de Ciências Departamento de Ciências da Computação Universidade Agostinho Neto Faculdade de Ciências Departamento de Ciências da Computação Nº 96080 - Adário de Assunção Fonseca Muatelembe Nº 96118 - Castelo Pedro dos Santos Nº 96170 - Feliciano José Pascoal

Leia mais

Nathalie Portugal Vargas

Nathalie Portugal Vargas Nathalie Portugal Vargas 1 Introdução Trabalhos Relacionados Recuperação da Informação com redes ART1 Mineração de Dados com Redes SOM RNA na extração da Informação Filtragem de Informação com Redes Hopfield

Leia mais

UMA PROPOSTA PARA COMPARAÇÃO DE PROVEDORES DE COMPUTAÇÃO EM NUVEM DESDE UMA PERSPECTIVA DE INTEGRAÇÃO DE APLICAÇÕES 1

UMA PROPOSTA PARA COMPARAÇÃO DE PROVEDORES DE COMPUTAÇÃO EM NUVEM DESDE UMA PERSPECTIVA DE INTEGRAÇÃO DE APLICAÇÕES 1 UMA PROPOSTA PARA COMPARAÇÃO DE PROVEDORES DE COMPUTAÇÃO EM NUVEM DESDE UMA PERSPECTIVA DE INTEGRAÇÃO DE APLICAÇÕES 1 Igor G. Haugg 2, Rafael Z. Frantz 3, Fabricia Roos-Frantz 4, Sandro Sawicki 5. 1 Pesquisa

Leia mais

4 Conversor EDTV Raw. 4.1 Arquitetura

4 Conversor EDTV Raw. 4.1 Arquitetura 4 Conversor EDTV Raw O conversor EDTV Raw é o programa que lê um documento escrito no perfil NCL EDTV e gera um documento Raw equivalente, i.e. que define a mesma apresentação. Este capítulo, apresenta

Leia mais

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados:

Dado: Fatos conhecidos que podem ser registrados e têm um significado implícito. Banco de Dados: MC536 Introdução Sumário Conceitos preliminares Funcionalidades Características principais Usuários Vantagens do uso de BDs Tendências mais recentes em SGBDs Algumas desvantagens Modelos de dados Classificação

Leia mais

Reconhecimento de Dados Biométricos em Larga Escala

Reconhecimento de Dados Biométricos em Larga Escala Reconhecimento de Dados Biométricos em Larga Escala Profa. Fabíola Gonçalves Pereira Greve DCC - UFBA Departamento de Ciência da Computação Grupo de Algoritmos e Computação Distribuída http:// Equipe Profa.

Leia mais

Prof. Luiz Fernando Bittencourt MC714. Sistemas Distribuídos 2 semestre, 2013

Prof. Luiz Fernando Bittencourt MC714. Sistemas Distribuídos 2 semestre, 2013 MC714 Sistemas Distribuídos 2 semestre, 2013 Virtualização - motivação Consolidação de servidores. Consolidação de aplicações. Sandboxing. Múltiplos ambientes de execução. Hardware virtual. Executar múltiplos

Leia mais

Computação em Nuvem com Openstack

Computação em Nuvem com Openstack Allan Krueger Glauber C. Batista Charles Christian Miers Membros Colméia Grupo de Pesquisa em Software e Hardware Livre Computação em Nuvem com Openstack Roteiro Geral OpenStack 2 OpenStack 3 Openstack

Leia mais

GVGO Grupo 3. Perguntas & Respostas. Peer-to-Peer & Cloud Computing. Peer to Peer

GVGO Grupo 3. Perguntas & Respostas. Peer-to-Peer & Cloud Computing. Peer to Peer Perguntas & Respostas Peer to Peer GVGO Grupo 3 Peer-to-Peer & Cloud Computing 1. O BitTorrent (rede P2P desestruturada) utiliza um tracker centralizado para cada swarm. Cite três propriedades que as redes

Leia mais

Engenharia de Software I

Engenharia de Software I Engenharia de Software I Rogério Eduardo Garcia (rogerio@fct.unesp.br) Bacharelado em Ciência da Computação Aula 05 Material preparado por Fernanda Madeiral Delfim Tópicos Aula 5 Contextualização UML Astah

Leia mais

Gerência de Configuração de Software. Msc. Ernani Sales Implementador Oficial MPS.BR ernani@webapsee.com

Gerência de Configuração de Software. Msc. Ernani Sales Implementador Oficial MPS.BR ernani@webapsee.com Gerência de Configuração de Software Msc. Ernani Sales Implementador Oficial MPS.BR ernani@webapsee.com Introdução O que é GCS? Terminologia Agenda Modelos, Padrões e Normas Processo de GCS Padrão IEEE

Leia mais

Cisco Intelligent Automation for Cloud

Cisco Intelligent Automation for Cloud Dados técnicos do produto Cisco Intelligent Automation for Cloud Os primeiros a adotarem serviços com base em nuvem buscavam uma economia de custo maior que a virtualização e abstração de servidores podiam

Leia mais

Soluções para criar a sua própria nuvem

Soluções para criar a sua própria nuvem Soluções para criar a sua própria nuvem Maicon de Vargas Pereira 1 Faculdade de Tecnologia Senac Pelotas Rua Gonçalves Chaves, 602 Pelotas RS Brasil Caixa Postal 96.015-560 Curso Superior de Tecnologia

Leia mais

Microsoft Nosso Comprometimento Mais de 9 bilhões em P&D/ano

Microsoft Nosso Comprometimento Mais de 9 bilhões em P&D/ano Microsoft Nosso Comprometimento Mais de 9 bilhões em P&D/ano Windows e Web Dynamics Comunicação e Produtividade Servidores Infraestrutura Empresarial Busca e Anúncios Mobilidade Entretenimento e TV PRODUTIVIDADE

Leia mais

O que é Cloud Computing?

O que é Cloud Computing? O que é Cloud Computing? Referência The Economics Of The Cloud, Microsoft, Nov. 2010 Virtualização, Brasport, Manoel Veras, Fev. 2011. 2 Arquitetura de TI A arquitetura de TI é um mapa ou plano de alto

Leia mais