Estudo de implementação de um cluster utilizando apache hadoop. Giovanni Furlanetto

Tamanho: px
Começar a partir da página:

Download "Estudo de implementação de um cluster utilizando apache hadoop. Giovanni Furlanetto"

Transcrição

1 Estudo de implementação de um cluster utilizando apache hadoop Giovanni Furlanetto

2 Sumário Introdução Metodologia de Pesquisa Revisão Bibliográfica Resultados Conclusão Referências

3 Introdução Considerando o crescimento de dados na internet alguns serviços e sistemas não oferecem a disponibilidade de um gerenciamento de dados adequado. Uma solução proposta é a utilização da ferramenta Apache Hadoop, é uma aplicação econômica de código aberto, de alto desempenho que utiliza o conceito de sistemas distribuídos, a Google é um exemplo segundo Augusto (2010, p.7) Indiscutivelmente, o Google é o principal e o maior serviço de busca da Internet, com cerca de 14 bilhões de paginas Web indexadas. Além de números expressivos, o Google se destaca por ter publicado uma serie de trabalhos sobre sua infraestrutura interna e sistemas, em especial sobre sua estrutura inicial[...] O Apache Hadoop é uma aplicação que oferece alguns serviços e os dois principais são MapReduce responsável pelo processamento distribuído e o Hadoop Distributed File System (HDFS) para armazenamento também em forma distribuída. Com o intuito de aprofundar o conhecimento sobre a ferramenta foi estipulado o objetivo de realizar a instalação e utilização da aplicação Apache Hadoop. Este trabalho está organizado em capítulos, onde no primeiro capitulo é descrito de forma sucinta o contexto e objetivo do trabalho, no segundo capitulo é referenciado as metodologias de pesquisa utilizada, no terceiro capitulo é feita uma revisão para a fundamentação da pesquisa, no quarto capitulo é descrito os resultados obtidos e quinto capitulo a conclusão do trabalho.

4 Metodologia de Pesquisa Foi utilizado conteúdos da internet, livros e artigos de periódicos, de natureza pura e com uma abordagem qualitativa com o intuito de aprofundar o conhecimento sobre a ferramenta Apache Hadoop. Foram utilizados computadores do Instituto Federal de Educação, Ciências, e Tecnologia de São Paulo no Campus de Presidente Epitácio para realizar testes da aplicação Hadoop, primeiramente utilizando testes de processamento e depois armazenamento.

5 Revisão Bibliográfica A Google tem um sistema muito robusto para pesquisas com uma alta variedade de paginas segundo Augusto(2010, p.23): Poucos ousariam negar que o Google é o maior sistema de busca da atualidade. Seu buscador indexa e armazena alguns bilhões de páginas, praticamente toda a superfície da Web (mas apenas uma pequena parte da Web profunda, mais difícil de se obter por depender de acesso privado ou por não ser referenciada por outras páginas). Em menos de 10 anos, o Google deixou de ser um projeto universitário para se tornar em um negócio de mais de US$150 bilhões de dólares e um dos alicerces da Internet. Dessa forma, por mais que a equipe do Google esporadicamente publique artigos descrevendo o funcionamento do seu buscador, sempre devemos considerar que não estamos

6 Revisão Bibliográfica lidando com versões completas dessas soluções, afinal esse é o grande mapa da mina. Se na primeira versão em 1998 as buscas demoravam entre 1 e 10 segundos, hoje em dia é difícil elas ultrapassarem alguns décimos de segundos. A aplicação do Apache Hadoop utiliza os conceitos de um sistema distribuído igual no sistema da Google com alguns milhares nós de processamento que fazem toda diferença para uma empresa. Grandes empresas da web já utilizam o conceito de sistemas distribuídos segundo Silva(2011, p.1) Grandes sistemas, como Google, Facebook, Twitter entre outros, possuem bases de dados na ordem de petabytes. A solução utilizada para manter a escalabilidade destes sistemas é o processamento distribuído de dados em larga escala.

7 Resultados É econômico sendo uma aplicação open source, confiável, o que o torna perfeito para rodar aplicações com grande volume de dados em um conjunto de computadores, o seu desempenho de armazenamento é capaz de trabalhar com petabytes com facilidade, A aplicação trabalha utilizando o conceito de sistemas distribuídos e muito eficiente para processamento e armazenamento de grandes dados, tornando uma ferramenta viável para utilização para processamento e armazenamento de grandes dados.

8 Conclusão Apesar de existirem várias formas de realizar atividades de grande porte o apache hadoop não se faz pequeno pra essa questão tendo como auxiliar os usuários que necessitam de grande processamento. Atualmente está sendo muito utilizado para processamentos gráficos e armazenamentos de grande porte servidores distribuídos e farm render (sitio de renderização).

9 Referências AUGUSTO L.D.C; Arquitetura e implementação de um sistema distribuído de recuperação de informação. São Paulo, Fevereiro de Disponível em:< Acesso em 2 set GHEMAWAT S., GOBIOFF H., LEUNG S.; Artigos relevantes de Sistemas Distribuídos relacionados à Cloud Computing Disponível em: < Acesso em 4 set GOLDMAN A., KON F., JUNIOR F.P., POLATO I., PEREIRA R.F.; Apache Hadoop: conceitos teóricos e práticos, evolução e novas possibilidades Disponível em:< Acesso em 2 set SILVA A. B.; Apache Hadoop Disponível em:< Acesso em 15 nov

PrIntCloud. Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13

PrIntCloud. Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13 PrIntCloud Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13 Roteiro 1. Fundamentação Teórica A.- Cloud Computing B.- Hadoop C.- MapReduce D.- NoSql 2. Proposta

Leia mais

Informática Parte 10 Prof. Márcio Hunecke

Informática Parte 10 Prof. Márcio Hunecke Escriturário Informática Parte 10 Prof. Márcio Hunecke Informática CONCEITOS DE MAPREDUCE E HDFS/HADOOP/YARN 2.7.4 Big Data O termo Big Data refere-se a um grande conjunto de dados armazenados e baseia-se

Leia mais

BIG DATA. Jorge Rady de Almeida Jr. Escola Politécnica da U SP

BIG DATA. Jorge Rady de Almeida Jr. Escola Politécnica da U SP BIG DATA Jorge Rady de Almeida Jr. jorgerady@usp.br Escola Politécnica da U SP BIG DATA - MOTIVAÇÃO Aumento da geração e armazenamento digital de dados Aumento da capacidade de processamento em geral:

Leia mais

AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP

AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Dr. Paulo Romero Martins Maciel INTRODUÇÃO Nem sempre os dados

Leia mais

Big Data Open Source com Hadoop

Big Data Open Source com Hadoop Big Data Open Source com Hadoop Palestrante: Marcio Junior Vieira marcio@ambientelivre.com.br Realização: Marcio Junior Vieira 14 anos de experiência em informática, vivência em desenvolvimento e análise

Leia mais

Bruno Antunes da Silva UFSCar - Sorocaba

Bruno Antunes da Silva UFSCar - Sorocaba Bruno Antunes da Silva UFSCar - Sorocaba Introdução HDFS Arquitetura Leitura e escrita Distribuição de nós Controle de réplicas Balancer MapReduce Conclusão Aplicações web com grandes quantidades de dados

Leia mais

Big Data. O que é Big Data! Como surgiu isso! Para que serve?!

Big Data. O que é Big Data! Como surgiu isso! Para que serve?! Big Data O que é Big Data! Como surgiu isso! Para que serve?! Da teoria a prática:! 1! Dá mesmo para! fazer algo prático! com o! Big Data?! Como tudo! começou?!! Qual o! Problema?! PERCEBEU:! Informações

Leia mais

Principais Motivos para Usar o MySQL

Principais Motivos para Usar o MySQL Principais Motivos para Usar o MySQL O Banco de Dados de Código Aberto mais Popular do Mundo MySQL é o "M" na pilha comprovada LAMP de código aberto (Linux, Apache, MySQL PHP/Perl/Python) usada pelos sites

Leia mais

Técnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência

Técnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência 12º CONTECSI Conferência Internacional sobre Sistemas de Informação e Gestão de Tecnologia Técnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência Alcides Carlos de Araújo

Leia mais

BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES?

BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES? 1 BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES? Deyvirson Mendonça SUMÁRIO Definição Os Vs do Big Data Desafios Hadoop BD e Big Data PARA COMEÇAR O QUE SÃO DADOS? Informações diversas, que podem ser organizadas

Leia mais

Informática Parte 11 Prof. Márcio Hunecke

Informática Parte 11 Prof. Márcio Hunecke Escriturário Informática Parte 11 Prof. Márcio Hunecke Informática FERRAMENTAS DE INGESTÃO DE DADOS (SQOOP 1.4.6, FLUME 1.7.0, NIFI 1.3.0 E KAFKA 0.11.0) Visão geral sobre os quatro componentes Fazem

Leia mais

Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop

Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Paulo Romero Martins Maciel prmm@cin.ufpe.br Dados,

Leia mais

Introdução a Computação em Nuvem

Introdução a Computação em Nuvem Introdução a Computação em Nuvem Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia

Leia mais

Introdução a Computação em Nuvem

Introdução a Computação em Nuvem Introdução a Computação em Nuvem Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia

Leia mais

A NOVA EXPERIÊNCIA ANALÍTICA

A NOVA EXPERIÊNCIA ANALÍTICA A NOVA EXPERIÊNCIA ANALÍTICA USANDO MELHOR O HADOOP COMO PEÇA DO QUEBRA-CABEÇA DO BIG DATA Rafael Aielo Gerente de Soluções AGENDA Era Big Data Hadoop O que é e como funciona SAS e Hadoop ERA BIG DATA

Leia mais

Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000. Uma Nota Técnica da Dell

Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000. Uma Nota Técnica da Dell Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000 Uma Nota Técnica da Dell Esta nota técnica serve apenas para fins informativos e pode conter erros de digitação e erros técnicos.

Leia mais

Computação em nuvem (Cloud Computing)

Computação em nuvem (Cloud Computing) Computação em nuvem (Cloud Computing) Disciplina: Gestão da Tecnologia de Sistemas Professor: Thiago Silva Prates Computação em nuvem O termo computação em nuvem refere-se a modelo de capacitação na qual

Leia mais

Capítulo 7: SPARQL Processamento de consulta em nuvem

Capítulo 7: SPARQL Processamento de consulta em nuvem Capítulo 7: SPARQL Processamento de consulta em nuvem 01/11/2016 Acadêmico: Maicou Moor Cândido de Lima Professora: Carmem Satie Hara Introdução Neste capítulo concentra-se em recentes propostas de técnicas

Leia mais

Introdução a Big Data. Juciander L. Moreira Wallace Brito

Introdução a Big Data. Juciander L. Moreira Wallace Brito Introdução a Big Data Juciander L. Moreira Wallace Brito 1 Sumário 1. 2. 3. 4. 5. 6. Introdução Os 3 Vs de Big Data Definição de Big Data Mitos sobre Big Data Aplicações Iniciando um projeto de Big Data

Leia mais

Introdução Ferramentas Unix MapReduce Outras Ferramentas. Batch Processing. Fabiola Santore. Universidade Federal do Paraná

Introdução Ferramentas Unix MapReduce Outras Ferramentas. Batch Processing. Fabiola Santore. Universidade Federal do Paraná Fabiola Santore Universidade Federal do Paraná Sumário 1. Introdução 2. Ferramentas Unix 2.1 Análise de log 2.2 Filosofia Unix 3. MapReduce 3.1 Procedimento 3.2 Reduce: Joins e Agrupamento 3.3 Análise

Leia mais

QUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ;

QUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ; QUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ; LEIA O MATERIAL ANTES DE FAZER O EXEMPLO DIDÁTICO. AS QUESTÕES ABAIXO PODEM SER RESPONDIDAS, USANDO, PREFERENCIALMENTE, SUA PRÓPRIAS

Leia mais

ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES I AULA 02: INTRODUÇÃO

ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES I AULA 02: INTRODUÇÃO ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES I AULA 02: INTRODUÇÃO Prof. Max Santana Rolemberg Farias max.santana@univasf.edu.br Colegiado de Engenharia de Computação DO QUE É COMPOSTO UM SISTEMA COMPUTACIONAL?

Leia mais

Introdução à Programação Aula 01. Prof. Max Santana Rolemberg Farias Colegiado de Engenharia de Computação

Introdução à Programação Aula 01. Prof. Max Santana Rolemberg Farias Colegiado de Engenharia de Computação Introdução à Programação Aula 01 Prof. Max Santana Rolemberg Farias max.santana@univasf.edu.br Colegiado de Engenharia de Computação QUAL O OBJETIVO DA DISCIPLINA? Objetivo Tornar vocês (alunos) capazes

Leia mais

EasyAzure. EasyAzure. Guia do programa. Ingram Micro Brasil. Versão 1.7

EasyAzure. EasyAzure. Guia do programa. Ingram Micro Brasil. Versão 1.7 EasyAzure Guia do programa Versão 1.7 Email: cloud.br@ingrammicro.com Telefone: 55 (11) 2078-4280 Endereço: Av. Piracema, 1341 - Tamboré - Barueri - SP Brasil 1 EasyAzure São pacotes prontos com as soluções

Leia mais

Framework para Deduplicação de Dados com Apache Spark

Framework para Deduplicação de Dados com Apache Spark Framework para Deduplicação de Dados com Apache Spark César Magrin - magrin@inf.ufpr.br Disciplina: Metodologia Científica - CI860 Professor: Alexandre Direne Sumário 1. Qualidade de Dados 2. Deduplicação

Leia mais

PÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan

PÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan PÓS-GRADUAÇÃO LATO SENSU Curso: Banco de Dados Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan Unidade 1.3 2016 Big Data Big Data - Contexto Globalização Modelo

Leia mais

COMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações

COMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações COMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações Jaqueline Joice Brito Slides em colaboração com Lucas de Carvalho Scabora Sumário Computação em Nuvem Definição

Leia mais

BUSINESS INTELLIGENCE E DATA WAREHOUSE. Big Data Conceitos, Técnicas, Ferramentas e Arquitetura. tutorpro.com.br cetax.com.br

BUSINESS INTELLIGENCE E DATA WAREHOUSE. Big Data Conceitos, Técnicas, Ferramentas e Arquitetura. tutorpro.com.br cetax.com.br BUSINESS INTELLIGENCE E DATA WAREHOUSE Big Data Conceitos, Técnicas, Ferramentas e Arquitetura tutorpro.com.br cetax.com.br Quem somos 2 3 Objetivos do Curso de Big Data 4 Alinhamento das expectativas

Leia mais

Escalonamento Adaptativo para o Apache Hadoop

Escalonamento Adaptativo para o Apache Hadoop Escalonamento Adaptativo para o Apache Hadoop 1 Andrea Schwertner Charão 1 {cassales,andrea}@inf.ufsm.br 1 Departamento de Linguagens e Sistemas de Computação Centro de Tecnologia Universidade Federal

Leia mais

Apache Hadoop É hoje que vai instalar o seu primeiro cluster?

Apache Hadoop É hoje que vai instalar o seu primeiro cluster? Apache Hadoop É hoje que vai instalar o seu primeiro cluster? Date : 16 de Março de 2016 Como processar grandes quantidades de dados de forma rápida e a baixo custo? A resposta é Hadoop! Esta framework

Leia mais

CASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO

CASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO Patrocínio, MG, outubro de 2016 ENCONTRO DE PESQUISA & EXTENSÃO, 3., 2016, Patrocínio. Anais... Patrocínio: IFTM, 2016. CASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO Moises Wesley de Souza

Leia mais

Sistemas Distribuídos Aula 8

Sistemas Distribuídos Aula 8 Sistemas Distribuídos Aula 8 Aula passada Limitação dos semáforos Monitores Variáveis de condição Semântica de signal Aula de hoje Arquitetura de sistemas Arquitetura de sistemas distribuídos Cliente/servidor

Leia mais

INTERNET DAS COISAS NAS NUVENS

INTERNET DAS COISAS NAS NUVENS INTERNET DAS COISAS NAS NUVENS por Tito Ocampos Abner Carvalho Cleiton Amorim Hugo Brito Agenda Introdução Computação em nuvem + Internet das Coisas Infraestrutura como Serviço Plataforma como Serviço

Leia mais

São Paulo. August,

São Paulo. August, São Paulo August, 28 2018 O futuro do armazenamento dos dados não estruturados Com o Dell EMC Isilon e o ECS Allan Gomes Souza Sr. Systems Engineer, Dell EMC A transformação digital está revolucionando

Leia mais

Tolerância a falha. Edy Hayashida

Tolerância a falha. Edy Hayashida Tolerância a falha Edy Hayashida E-mail: edy.hayashida@uol.com.br Introdução Um objetivo importante do projeto de sistemas distribuídos é construir o sistema de modo tal que ele possa se recuperar automaticamente

Leia mais

Ilustrações Ágatha Kretli

Ilustrações Ágatha Kretli Ilustrações Ágatha Kretli 34 caderno especial DESMISTIFICANDO O APRENDIZADO DE MÁQUINA POR FELIPE CRUZ, AGOSTINHO VILLELA E HUGO TADEU Durante uma palestra sobre aprendizado de máquina e inteligência artificial,

Leia mais

Apache Spark I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA

Apache Spark I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA Apache Spark CARLOS EDUARDO MART INS RELVAS I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA Apache Hadoop Mudou a forma de armazenamento e processamento de dados em um cluster de computadores, trazendo

Leia mais

Componente de aplicação. Figura 1 - Elementos funcionais de uma aplicação sendo executados de forma distribuída

Componente de aplicação. Figura 1 - Elementos funcionais de uma aplicação sendo executados de forma distribuída 11 1 Introdução Recentes avanços em redes de computadores impulsionaram a busca e o desenvolvimento de meios para facilitar e acelerar o desenvolvimento de aplicações em sistemas distribuídos, tornando

Leia mais

FACULDADE MULTIVIX CURSO DE ENGENHARIA DE PRODUÇÃO 2º PERÍODO MARIANA DE OLIVEIRA BERGAMIN MONIQUE MATIELLO GOMES THANIELE ALMEIDA ALVES

FACULDADE MULTIVIX CURSO DE ENGENHARIA DE PRODUÇÃO 2º PERÍODO MARIANA DE OLIVEIRA BERGAMIN MONIQUE MATIELLO GOMES THANIELE ALMEIDA ALVES FACULDADE MULTIVIX CURSO DE ENGENHARIA DE PRODUÇÃO 2º PERÍODO MARIANA DE OLIVEIRA BERGAMIN MONIQUE MATIELLO GOMES THANIELE ALMEIDA ALVES COMPUTAÇÃO EM NUVEM CACHOEIRO DE ITAPEMIRIM 2015 MARIANA DE OLIVEIRA

Leia mais

CICN Centro de Inovação em Computação em Nuvem Segurança de Dados em Nuvem. Apresentação para:

CICN Centro de Inovação em Computação em Nuvem Segurança de Dados em Nuvem. Apresentação para: CICN Centro de Inovação em Computação em Nuvem Segurança de Dados em Nuvem Apresentação para: Sumário CICN Centro de Inovação na Computação em Nuveml Computação em Nuvem Segurança de Dados na Nuvem Ficha

Leia mais

slide Pearson Prentice Hall. Todos os direitos reservados.

slide Pearson Prentice Hall. Todos os direitos reservados. Sistema de Arquivos slide 1 Sistemas de arquivos Condições essenciais para armazenamento de informações por um longo prazo: Deve ser possível armazenar uma grande quantidade de informação A informação

Leia mais

Infraestrutura computacional para suporte de aplicações de big data na área da Saúde

Infraestrutura computacional para suporte de aplicações de big data na área da Saúde Infraestrutura computacional para suporte de aplicações de big data na área da Saúde Maurício Barreto Davide Rasella Marcos Barreto Centro Interdisciplinar em Ciências e Tecnologia da Informação Infraestrutura

Leia mais

Web Crawlers Open Source. Heitor de Souza Ganzeli Analista de Projetos do nic.br

Web Crawlers Open Source. Heitor de Souza Ganzeli Analista de Projetos do nic.br Web Open Source Heitor de Souza Ganzeli Analista de Projetos do nic.br O Comitê Gestor da Internet no Brasil (CGI.br) foi criado pela Portaria Interministerial nº 147, de 31 de maio de 1995, alterada pelo

Leia mais

UNIVERSIDADE PRESBITERIANA MACKENZIE

UNIVERSIDADE PRESBITERIANA MACKENZIE 1. Identificação do Curso a. Curso de Especialização em: Ciência de Dados (BIG DATA ANALYTICS) b. Área: Computação c. Área temática (tema): BIG DATA d. Linha de Pesquisa: Computação e Sistemas de Informação

Leia mais

O VALOR DO BACKUP NA NUVEM. Fernando Henrique Feitosa

O VALOR DO BACKUP NA NUVEM. Fernando Henrique Feitosa 1 O VALOR DO BACKUP NA NUVEM Fernando Henrique Feitosa fernando.feitosa@dbacorp.com.br 2 DESCRIÇÃO Esse artigo tem como objetivo principal explanar de forma gerencial qual visão devemos adotar ao escolher

Leia mais

CURTA DURAÇÃO ANÁLISE DE BIG DATA. CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini

CURTA DURAÇÃO ANÁLISE DE BIG DATA. CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini CURTA DURAÇÃO ANÁLISE DE BIG DATA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini OBJETIVO O volume crescente de informação disponível nas

Leia mais

Administração de Serviços de Redes. Introdução a Clusters. Prof. Dayvidson Bezerra Contato:

Administração de Serviços de Redes. Introdução a Clusters. Prof. Dayvidson Bezerra Contato: Administração de Serviços de Redes Introdução a Clusters Prof. Dayvidson Bezerra Contato: dayvidsonbezerra@gmail.com Definição Cluster é um termo amplamente utilizado, significa computadores independentes

Leia mais

Desmistificando a computação em nuvem para as empresas de seguros

Desmistificando a computação em nuvem para as empresas de seguros 34 Desmistificando a computação em nuvem para as empresas de seguros KELVIN CLETO GONÇALVES Atualmente, com o avanço da tecnologia e a possibilidade de ter acesso à internet através de uma série de dispositivos,

Leia mais

Otimizando os recursos do OJS na publicação de artigos. Ronnie Fagundes de Brito - IBICT

Otimizando os recursos do OJS na publicação de artigos. Ronnie Fagundes de Brito - IBICT Otimizando os recursos do OJS na publicação de artigos Ronnie Fagundes de Brito - IBICT O uso de software de apoio à editoração em sistemas de publicação da informação científica e tecnológica oferece

Leia mais

Armazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil

Armazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil 1 Armazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil Acadêmico: Matheus Magnusson Bolo Disciplina: Segurança Computacional 2 Contexto WGID IV Workshop de Gestão de

Leia mais

Cloud Computing. Prof. Marcio R. G. de Vazzi Analista De sistemas Especialista em Gestão Mestrando em Educação

Cloud Computing. Prof. Marcio R. G. de Vazzi Analista De sistemas Especialista em Gestão Mestrando em Educação Cloud Computing Prof. Marcio R. G. de Vazzi Analista De sistemas Especialista em Gestão Mestrando em Educação www.vazzi.com.br profmarcio@vazzi.com.br Your Logo Estrutura da palestra Estrutura da T.I.

Leia mais

Big Data: Uma revolução a favor dos negócios

Big Data: Uma revolução a favor dos negócios Big Data: Uma revolução a favor dos negócios QUEM SOMOS Empresa especializada em Big Data e Analytics. Profissionais com larga experiência na gestão de bureaus de crédito, analytics e uso inteligente da

Leia mais

BIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt

BIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt BIG DATA: UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com 70% 60% 50% 40% 30% 20%

Leia mais

Algoritmos de Junção Estrela em MapReduce

Algoritmos de Junção Estrela em MapReduce Algoritmos de Junção Estrela em MapReduce Jaqueline Joice Brito 09 de junho de 2015 1 Modelo Relacional Dados armazenados em um conjunto de tabelas Amplamente utilizado Junção Recuperação de dados de duas

Leia mais

Gerenciamento de Conteúdo Web CMS Joomla. Luiz C B Martins

Gerenciamento de Conteúdo Web CMS Joomla. Luiz C B Martins Gerenciamento de Conteúdo Web CMS Joomla Luiz C B Martins luizmartins@unb.br Objetivo do Curso Usar as ferramentas e os conceitos básicos da plataforma Joomla para gerenciar e atualizar páginas na internet

Leia mais

SOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE

SOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE SOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE PRINCÍPIOS BÁSICOS EMC ISILON Use a primeira e única solução NAS scale-out do setor com suporte nativo ao Hadoop Reduza os custos e acelere os resultados

Leia mais

Uma introdução ao Apache Hama

Uma introdução ao Apache Hama Uma introdução ao Apache Hama O modelo BSP nas nuvens Thiago Kenji Okada 1 1 Departamento de Ciências da Computação (DCC) Instituto de Matemática e Estatística (IME) Universidade de São Paulo (USP) MAC5742

Leia mais

Tipos de Clusters. Introdução. Introdução 21/03/12

Tipos de Clusters. Introdução. Introdução 21/03/12 Tipos de Clusters Prof. Msc. André Luiz Nasserala Pires nassserala@gmail.com! Cluster pode ser definido como um sistema onde dois ou mais computadores trabalham de maneira conjunta para realizar processamento

Leia mais

Boas Práticas em Sistemas Web muito além do HTML...

Boas Práticas em Sistemas Web muito além do HTML... Boas Práticas em Sistemas Web muito além do HTML... Adriano C. Machado Pereira (adrianoc@dcc.ufmg.br) De que Web estamos falando? De que Web estamos falando? A Web foi concebida para ser uma biblioteca

Leia mais

Sistemas Distribuídos. Edy Hayashida

Sistemas Distribuídos. Edy Hayashida Sistemas Distribuídos Edy Hayashida E-mail: edy.hayashida@uol.com.br Evolução 1960s 1980s Processamento de dados 1990s Sistemas de Informação Futuro Tecnologia da Informação Tecnologia dos Negócios 2 30

Leia mais

LanUn1vers1ty 6421: CONFIGURANDO E SOLUCIONANDO PROBLEMAS EM UMA INFRAESTRUTURA DE REDES WINDOWS SERVER 2008

LanUn1vers1ty 6421: CONFIGURANDO E SOLUCIONANDO PROBLEMAS EM UMA INFRAESTRUTURA DE REDES WINDOWS SERVER 2008 6421: CONFIGURANDO E SOLUCIONANDO PROBLEMAS EM UMA INFRAESTRUTURA DE REDES WINDOWS SERVER 2008 Objetivo: Este curso proporciona aos alunos o conhecimento e as habilidades necessárias para configurar e

Leia mais

Carlos Eduardo de Carvalho Dantas

Carlos Eduardo de Carvalho Dantas Cloud Computing Carlos Eduardo de Carvalho Dantas (carloseduardocarvalhodantas@gmail.com) Nós somos o que repetidamente fazemos. Excelência, então, não é um ato, mas um hábito. Aristóteles. Conectividade

Leia mais

Computação em Grid e em Nuvem

Computação em Grid e em Nuvem Computação em Grid e em Nuvem Grids Computacionais Características Infraestrutura Produtos Exemplos Computação em Nuvem Características Modelos Infraestrutura Exemplos 1 Grids Computacionais Definição

Leia mais

Sistemas Distribuídos

Sistemas Distribuídos Sistemas Distribuídos Unitri Prof: Carlos Eduardo de Carvalho Dantas Conceitos Sistema Distribuído é um conjunto de computadores independentes que se apresenta a seus usuários como um sistema único e coerente.

Leia mais

Avanços e Perspectivas do Projeto Integrade na UFMA

Avanços e Perspectivas do Projeto Integrade na UFMA Avanços e Perspectivas do Projeto Integrade na UFMA Francisco José da Silva e Silva Universidade Federal do Maranhão - UFMA Departamento de Informática Laboratório de Sistemas Distribuídos - LSD Agosto

Leia mais

Universidade Federal de Pernambuco

Universidade Federal de Pernambuco Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2017.1 Uma biblioteca Multi-Tenant para Flask Proposta de Trabalho de Graduação Aluno: Bruno Resende Pinheiro

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e

Leia mais

As Redes Sociais e a Sociedade da Informação: Pokémon GO como Case

As Redes Sociais e a Sociedade da Informação: Pokémon GO como Case As Redes Sociais e a Sociedade da Informação: Pokémon GO como Case Professor: Rômulo César Dias de Andrade. E-mail: romulocesar@faculdadeguararapes.edu.br www.romulocesar.com.br PROFESSOR... NOME: RÔMULO

Leia mais

Informática. Cloud Computing e Storage. Professor Márcio Hunecke.

Informática. Cloud Computing e Storage. Professor Márcio Hunecke. Informática Cloud Computing e Storage Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática COMPUTAÇÃO EM NUVEM Cloud Computing ou Computação em Nuvem pode ser definido como um modelo no

Leia mais

White paper. EMC Isilon: uma plataforma de armazenamento dimensionável. Abril de 2014

White paper. EMC Isilon: uma plataforma de armazenamento dimensionável. Abril de 2014 White paper EMC Isilon: uma plataforma de armazenamento dimensionável para Big Data Por Nik Rouda, analista sênior, e Terri McClure, analista sênior Abril de 2014 Este white paper do ESG foi autorizado

Leia mais

Marketing de. Conteúdo. Plano de Estudo

Marketing de. Conteúdo. Plano de Estudo Marketing de Conteúdo Plano de Estudo Descrição do programa O programa está construído tecnicamente, desde uma perspectiva educativa e com os mais recentes desenvolvimentos e padrões do mercado digital.

Leia mais

Pipelines ETL. Aplicação de conceitos de DW para a construção de pipelines de extração, transformação e carregamento de dados.

Pipelines ETL. Aplicação de conceitos de DW para a construção de pipelines de extração, transformação e carregamento de dados. Pipelines ETL Aplicação de conceitos de DW para a construção de pipelines de extração, transformação e carregamento de dados Carlos Baqueta Contextualização Contextualização Quem sou eu? (momento filosófico)

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro Prof. Daniela Barreiro Claro Volume de dados muito grande Principais problemas em relacao aos SGBD Relacionais é conciliar o tipo de modelo com a demanda da escalabilidade. Exemplo -Facebook Um crescimento

Leia mais

USO PROFISSIONAL DE COMPUTADORES

USO PROFISSIONAL DE COMPUTADORES USO PROFISSIONAL DE COMPUTADORES PROF. ME. HÉLIO ESPERIDIÃO SISTEMA OCTADECIMAL Sistema Octal é um sistema de numeração cuja base é 8, ou seja, utiliza 8 símbolos para a representação de quantidade. No

Leia mais

CLOUD COMPUTING: O USO DA PLATAFORMA AWS E ARMAZENAMENTO NO AMAZON S3.

CLOUD COMPUTING: O USO DA PLATAFORMA AWS E ARMAZENAMENTO NO AMAZON S3. CLOUD COMPUTING: O USO DA PLATAFORMA AWS E ARMAZENAMENTO NO AMAZON S3. Michele Marques Costa 1,2, WillianFressati 2 ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil marquesmih04@gmail.com wyllianfressati@unipar.br

Leia mais

por parte dos usuários dos sistemas de computação se tornou menos necessária e a popularidade desse tipo de linguagem diminuiu. Mais recentemente, a

por parte dos usuários dos sistemas de computação se tornou menos necessária e a popularidade desse tipo de linguagem diminuiu. Mais recentemente, a 1 Introdução Middleware é um termo cunhado no final da década de 60 (Naur e Randell, 1968), que é freqüentemente empregado para designar uma camada de software que oferece uma infra-estrutura para construção

Leia mais

MBA ANALYTICS EM BIG DATA

MBA ANALYTICS EM BIG DATA MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação

Leia mais

Uma conversa que não pára: o Pinguim, o Morcego e o Elefante

Uma conversa que não pára: o Pinguim, o Morcego e o Elefante Uma conversa que não pára: o Pinguim, o Morcego e o Elefante Uma solução de backup de alta disponibilidade para DataCenter Allan Rodrigo de Lima CCE/USP VIII GeINFO Agenda Soluções em produção Motivação

Leia mais

UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA

UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA 1 UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA JUAN CASSIUS CARNEIRO PEREIRA PEDRO M. NETO GOOGLE CLOUD PONTA GROSSA 2017 2 JUAN CASSIUS

Leia mais

Desenvolvimento de Aplicações Distribuídas

Desenvolvimento de Aplicações Distribuídas SOA e Web Services Pontifícia Universidade Católica de Minas Gerais Instituto de Ciências Exatas e Informática DAD (2019/01) Tópicos Apresentação da disciplina Introdução Desafios e características Arquitetura

Leia mais

Uso de Map Reduce no Processamento de Joins Sobre Dados Espaciais em Árvores R-Tree Distribuídas

Uso de Map Reduce no Processamento de Joins Sobre Dados Espaciais em Árvores R-Tree Distribuídas Uso de Map Reduce no Processamento de Joins Sobre Dados Espaciais em Árvores R-Tree Distribuídas Thiago Borges de Oliveira Vagner José do Sacramento Rodrigues Instituto de Informática Universidade Federal

Leia mais

Sistemas de arquivos distribuídos. ECO036 - Sistemas Paralelos e Distribuídos

Sistemas de arquivos distribuídos. ECO036 - Sistemas Paralelos e Distribuídos Sistemas de arquivos distribuídos ECO036 - Sistemas Paralelos e Distribuídos Sistemas de arquivos distribuídos - Daniel Nogueira 20938 - Felipe Castro Simões 21525 Sumário 1. Introdução 2. Sistemas de

Leia mais

RESUMO DA PROGRAMAÇÃO - Minicursos

RESUMO DA PROGRAMAÇÃO - Minicursos RESUMO DA PROGRAMAÇÃO - Minicursos Quarta-feira 15/05 Nome do Minicurso: Introdução ao desenvolvimento na plataforma.net (C#) Parte 01 Sala: Laboratório 04 Nome do Minicurso: Implantação de aplicações

Leia mais

Palavras-chave: (banco de dados; prontuário médico; paciente); deve vir logo abaixo do resumo

Palavras-chave: (banco de dados; prontuário médico; paciente); deve vir logo abaixo do resumo BANCO DE DADOS PARA UM PRONTUÁRIO MÉDICO ELETRÔNICO Nome dos autores: Igor Barreto Rodrigues¹; Patrick Letouze Moreira² 1 Aluno do Curso de Ciência da Computação; Campus de Palmas; e-mail: igor.cientista@uft.edu.br

Leia mais

Big Data. A Nova Onda

Big Data. A Nova Onda Big Data A Nova Onda Ricardo Rezende 18 anos em TI; 12 anos como DBA Oracle; Infrastructure Principal @ Accenture Enkitec Group; Oracle Certified Professional; IBM Certified Database Associate; Mestrando

Leia mais

Engenharia de Software

Engenharia de Software Arquitetura de Sistemas Distribuídos Cap. 12 Sommerville 8 ed. Introdução: É um software que usa várias máquinas para executar suas tarefas. Praticamente todos os sistemas baseado em grandes computadores

Leia mais

Conceitos de Sistemas Distribuídos

Conceitos de Sistemas Distribuídos Conceitos de Sistemas Distribuídos Roteiro Definição de Sistemas Distribuídos (SD) Evolução Histórica Exemplos (SD) Modelos (Vantagens x Desvantagens) 2 O que é um Sistema Distribuído? Definição Coleção

Leia mais

Hadoop - HDFS. Universidade Federal de Goiás Ciência da Computação

Hadoop - HDFS. Universidade Federal de Goiás Ciência da Computação Hadoop - HDFS Universidade Federal de Goiás Ciência da Computação O que é Hadoop? Um framework para lidar com aplicações distribuídas que fazem uso massivo de dados Originalmente construído para a distribuição

Leia mais

PROGRAMAÇÃO PARA INTERNET RICA RICH INTERNET APPLICATIONS

PROGRAMAÇÃO PARA INTERNET RICA RICH INTERNET APPLICATIONS PROGRAMAÇÃO PARA INTERNET RICA RICH INTERNET APPLICATIONS Prof. Dr. Daniel Caetano 2011-2 Visão Geral 1 2 3 4 5 Conceito das RIA Desafios Atuais Características das RIA Considerações e Benefícios Situação

Leia mais

Alessandro Jannuzi Open Source Lead

Alessandro Jannuzi Open Source Lead Microsoft + Open Source Inovação e Eficiência Operacional em um Mundo mais Integrado Alessandro Jannuzi Open Source Lead Microsoft + Open Source Tweet Cnet, Q&A Tweet Industry Leaders The Seattle Times

Leia mais

HadoopDB. Edson Ie Serviço Federal de Processamento de Dados - SERPRO

HadoopDB. Edson Ie Serviço Federal de Processamento de Dados - SERPRO HadoopDB Edson Ie Serviço Federal de Processamento de Dados - SERPRO Motivação Grandes massas de dados precisam ser processadas em clusters: 1 nó: 100TB@59MB/s = 23 dias Cluster com 1000 nós 33 min!!!

Leia mais

Seminário apresentado em 29/06/2017 Disciplina: Sistemas Distribuídos Professora: Noemi Rodriguez Aluno: Ricardo Dias

Seminário apresentado em 29/06/2017 Disciplina: Sistemas Distribuídos Professora: Noemi Rodriguez Aluno: Ricardo Dias Seminário apresentado em 29/06/2017 Disciplina: Sistemas Distribuídos Professora: Noemi Rodriguez Aluno: Ricardo Dias Visão Geral Alta disponibilidade & tolerante a falhas Banco de dados distribuído de

Leia mais

Haddop, MapReduce e Spark

Haddop, MapReduce e Spark Haddop, MapReduce e Spark Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Conceitos Básicos 2. MapReduce 3. Spark 4. Transformações Básicas 5. Ações Básicas 1 Conceitos Básicos Hadoop

Leia mais

COMPUTAÇÃO PARALELA E DISTRIBUÍDA

COMPUTAÇÃO PARALELA E DISTRIBUÍDA COMPUTAÇÃO PARALELA E DISTRIBUÍDA Aluno: Alessandro Faletti Orientadora: Noemi Rodriguez Introdução O objetivo inicial no projeto era aplicar a possibilidade de processamento em paralelo no sistema CSBase

Leia mais

Sistemas de Informação (SI) Infraestrutra de Tecnologia da Informação (TI): Software

Sistemas de Informação (SI) Infraestrutra de Tecnologia da Informação (TI): Software Sistemas de Informação (SI) Infraestrutra de Tecnologia da Informação (TI): Software Prof.ª Dr.ª Symone Gomes Soares Alcalá Universidade Federal de Goiás (UFG) Regional Goiânia (RG) Faculdade de Ciências

Leia mais

Evolução Histórica das Redes de Computadores

Evolução Histórica das Redes de Computadores Evolução Histórica das Redes de Computadores Redes de Computadores Charles Tim Batista Garrocho Instituto Federal de Minas Gerais IFMG Campus Ouro Branco https://garrocho.github.io charles.garrocho@ifmg.edu.br

Leia mais