Estudo de implementação de um cluster utilizando apache hadoop. Giovanni Furlanetto
|
|
- Neuza Azenha Leveck
- 6 Há anos
- Visualizações:
Transcrição
1 Estudo de implementação de um cluster utilizando apache hadoop Giovanni Furlanetto
2 Sumário Introdução Metodologia de Pesquisa Revisão Bibliográfica Resultados Conclusão Referências
3 Introdução Considerando o crescimento de dados na internet alguns serviços e sistemas não oferecem a disponibilidade de um gerenciamento de dados adequado. Uma solução proposta é a utilização da ferramenta Apache Hadoop, é uma aplicação econômica de código aberto, de alto desempenho que utiliza o conceito de sistemas distribuídos, a Google é um exemplo segundo Augusto (2010, p.7) Indiscutivelmente, o Google é o principal e o maior serviço de busca da Internet, com cerca de 14 bilhões de paginas Web indexadas. Além de números expressivos, o Google se destaca por ter publicado uma serie de trabalhos sobre sua infraestrutura interna e sistemas, em especial sobre sua estrutura inicial[...] O Apache Hadoop é uma aplicação que oferece alguns serviços e os dois principais são MapReduce responsável pelo processamento distribuído e o Hadoop Distributed File System (HDFS) para armazenamento também em forma distribuída. Com o intuito de aprofundar o conhecimento sobre a ferramenta foi estipulado o objetivo de realizar a instalação e utilização da aplicação Apache Hadoop. Este trabalho está organizado em capítulos, onde no primeiro capitulo é descrito de forma sucinta o contexto e objetivo do trabalho, no segundo capitulo é referenciado as metodologias de pesquisa utilizada, no terceiro capitulo é feita uma revisão para a fundamentação da pesquisa, no quarto capitulo é descrito os resultados obtidos e quinto capitulo a conclusão do trabalho.
4 Metodologia de Pesquisa Foi utilizado conteúdos da internet, livros e artigos de periódicos, de natureza pura e com uma abordagem qualitativa com o intuito de aprofundar o conhecimento sobre a ferramenta Apache Hadoop. Foram utilizados computadores do Instituto Federal de Educação, Ciências, e Tecnologia de São Paulo no Campus de Presidente Epitácio para realizar testes da aplicação Hadoop, primeiramente utilizando testes de processamento e depois armazenamento.
5 Revisão Bibliográfica A Google tem um sistema muito robusto para pesquisas com uma alta variedade de paginas segundo Augusto(2010, p.23): Poucos ousariam negar que o Google é o maior sistema de busca da atualidade. Seu buscador indexa e armazena alguns bilhões de páginas, praticamente toda a superfície da Web (mas apenas uma pequena parte da Web profunda, mais difícil de se obter por depender de acesso privado ou por não ser referenciada por outras páginas). Em menos de 10 anos, o Google deixou de ser um projeto universitário para se tornar em um negócio de mais de US$150 bilhões de dólares e um dos alicerces da Internet. Dessa forma, por mais que a equipe do Google esporadicamente publique artigos descrevendo o funcionamento do seu buscador, sempre devemos considerar que não estamos
6 Revisão Bibliográfica lidando com versões completas dessas soluções, afinal esse é o grande mapa da mina. Se na primeira versão em 1998 as buscas demoravam entre 1 e 10 segundos, hoje em dia é difícil elas ultrapassarem alguns décimos de segundos. A aplicação do Apache Hadoop utiliza os conceitos de um sistema distribuído igual no sistema da Google com alguns milhares nós de processamento que fazem toda diferença para uma empresa. Grandes empresas da web já utilizam o conceito de sistemas distribuídos segundo Silva(2011, p.1) Grandes sistemas, como Google, Facebook, Twitter entre outros, possuem bases de dados na ordem de petabytes. A solução utilizada para manter a escalabilidade destes sistemas é o processamento distribuído de dados em larga escala.
7 Resultados É econômico sendo uma aplicação open source, confiável, o que o torna perfeito para rodar aplicações com grande volume de dados em um conjunto de computadores, o seu desempenho de armazenamento é capaz de trabalhar com petabytes com facilidade, A aplicação trabalha utilizando o conceito de sistemas distribuídos e muito eficiente para processamento e armazenamento de grandes dados, tornando uma ferramenta viável para utilização para processamento e armazenamento de grandes dados.
8 Conclusão Apesar de existirem várias formas de realizar atividades de grande porte o apache hadoop não se faz pequeno pra essa questão tendo como auxiliar os usuários que necessitam de grande processamento. Atualmente está sendo muito utilizado para processamentos gráficos e armazenamentos de grande porte servidores distribuídos e farm render (sitio de renderização).
9 Referências AUGUSTO L.D.C; Arquitetura e implementação de um sistema distribuído de recuperação de informação. São Paulo, Fevereiro de Disponível em:< Acesso em 2 set GHEMAWAT S., GOBIOFF H., LEUNG S.; Artigos relevantes de Sistemas Distribuídos relacionados à Cloud Computing Disponível em: < Acesso em 4 set GOLDMAN A., KON F., JUNIOR F.P., POLATO I., PEREIRA R.F.; Apache Hadoop: conceitos teóricos e práticos, evolução e novas possibilidades Disponível em:< Acesso em 2 set SILVA A. B.; Apache Hadoop Disponível em:< Acesso em 15 nov
PrIntCloud. Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13
PrIntCloud Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13 Roteiro 1. Fundamentação Teórica A.- Cloud Computing B.- Hadoop C.- MapReduce D.- NoSql 2. Proposta
Leia maisInformática Parte 10 Prof. Márcio Hunecke
Escriturário Informática Parte 10 Prof. Márcio Hunecke Informática CONCEITOS DE MAPREDUCE E HDFS/HADOOP/YARN 2.7.4 Big Data O termo Big Data refere-se a um grande conjunto de dados armazenados e baseia-se
Leia maisBIG DATA. Jorge Rady de Almeida Jr. Escola Politécnica da U SP
BIG DATA Jorge Rady de Almeida Jr. jorgerady@usp.br Escola Politécnica da U SP BIG DATA - MOTIVAÇÃO Aumento da geração e armazenamento digital de dados Aumento da capacidade de processamento em geral:
Leia maisAVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP
AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Dr. Paulo Romero Martins Maciel INTRODUÇÃO Nem sempre os dados
Leia maisBig Data Open Source com Hadoop
Big Data Open Source com Hadoop Palestrante: Marcio Junior Vieira marcio@ambientelivre.com.br Realização: Marcio Junior Vieira 14 anos de experiência em informática, vivência em desenvolvimento e análise
Leia maisBruno Antunes da Silva UFSCar - Sorocaba
Bruno Antunes da Silva UFSCar - Sorocaba Introdução HDFS Arquitetura Leitura e escrita Distribuição de nós Controle de réplicas Balancer MapReduce Conclusão Aplicações web com grandes quantidades de dados
Leia maisBig Data. O que é Big Data! Como surgiu isso! Para que serve?!
Big Data O que é Big Data! Como surgiu isso! Para que serve?! Da teoria a prática:! 1! Dá mesmo para! fazer algo prático! com o! Big Data?! Como tudo! começou?!! Qual o! Problema?! PERCEBEU:! Informações
Leia maisPrincipais Motivos para Usar o MySQL
Principais Motivos para Usar o MySQL O Banco de Dados de Código Aberto mais Popular do Mundo MySQL é o "M" na pilha comprovada LAMP de código aberto (Linux, Apache, MySQL PHP/Perl/Python) usada pelos sites
Leia maisTécnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência
12º CONTECSI Conferência Internacional sobre Sistemas de Informação e Gestão de Tecnologia Técnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência Alcides Carlos de Araújo
Leia maisBIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES?
1 BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES? Deyvirson Mendonça SUMÁRIO Definição Os Vs do Big Data Desafios Hadoop BD e Big Data PARA COMEÇAR O QUE SÃO DADOS? Informações diversas, que podem ser organizadas
Leia maisInformática Parte 11 Prof. Márcio Hunecke
Escriturário Informática Parte 11 Prof. Márcio Hunecke Informática FERRAMENTAS DE INGESTÃO DE DADOS (SQOOP 1.4.6, FLUME 1.7.0, NIFI 1.3.0 E KAFKA 0.11.0) Visão geral sobre os quatro componentes Fazem
Leia maisAvaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop
Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Paulo Romero Martins Maciel prmm@cin.ufpe.br Dados,
Leia maisIntrodução a Computação em Nuvem
Introdução a Computação em Nuvem Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia
Leia maisIntrodução a Computação em Nuvem
Introdução a Computação em Nuvem Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia
Leia maisA NOVA EXPERIÊNCIA ANALÍTICA
A NOVA EXPERIÊNCIA ANALÍTICA USANDO MELHOR O HADOOP COMO PEÇA DO QUEBRA-CABEÇA DO BIG DATA Rafael Aielo Gerente de Soluções AGENDA Era Big Data Hadoop O que é e como funciona SAS e Hadoop ERA BIG DATA
Leia maisArquitetura de núcleo distribuído utilizando o sistema de switch central Z9000. Uma Nota Técnica da Dell
Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000 Uma Nota Técnica da Dell Esta nota técnica serve apenas para fins informativos e pode conter erros de digitação e erros técnicos.
Leia maisComputação em nuvem (Cloud Computing)
Computação em nuvem (Cloud Computing) Disciplina: Gestão da Tecnologia de Sistemas Professor: Thiago Silva Prates Computação em nuvem O termo computação em nuvem refere-se a modelo de capacitação na qual
Leia maisCapítulo 7: SPARQL Processamento de consulta em nuvem
Capítulo 7: SPARQL Processamento de consulta em nuvem 01/11/2016 Acadêmico: Maicou Moor Cândido de Lima Professora: Carmem Satie Hara Introdução Neste capítulo concentra-se em recentes propostas de técnicas
Leia maisIntrodução a Big Data. Juciander L. Moreira Wallace Brito
Introdução a Big Data Juciander L. Moreira Wallace Brito 1 Sumário 1. 2. 3. 4. 5. 6. Introdução Os 3 Vs de Big Data Definição de Big Data Mitos sobre Big Data Aplicações Iniciando um projeto de Big Data
Leia maisIntrodução Ferramentas Unix MapReduce Outras Ferramentas. Batch Processing. Fabiola Santore. Universidade Federal do Paraná
Fabiola Santore Universidade Federal do Paraná Sumário 1. Introdução 2. Ferramentas Unix 2.1 Análise de log 2.2 Filosofia Unix 3. MapReduce 3.1 Procedimento 3.2 Reduce: Joins e Agrupamento 3.3 Análise
Leia maisQUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ;
QUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ; LEIA O MATERIAL ANTES DE FAZER O EXEMPLO DIDÁTICO. AS QUESTÕES ABAIXO PODEM SER RESPONDIDAS, USANDO, PREFERENCIALMENTE, SUA PRÓPRIAS
Leia maisORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES I AULA 02: INTRODUÇÃO
ORGANIZAÇÃO E ARQUITETURA DE COMPUTADORES I AULA 02: INTRODUÇÃO Prof. Max Santana Rolemberg Farias max.santana@univasf.edu.br Colegiado de Engenharia de Computação DO QUE É COMPOSTO UM SISTEMA COMPUTACIONAL?
Leia maisIntrodução à Programação Aula 01. Prof. Max Santana Rolemberg Farias Colegiado de Engenharia de Computação
Introdução à Programação Aula 01 Prof. Max Santana Rolemberg Farias max.santana@univasf.edu.br Colegiado de Engenharia de Computação QUAL O OBJETIVO DA DISCIPLINA? Objetivo Tornar vocês (alunos) capazes
Leia maisEasyAzure. EasyAzure. Guia do programa. Ingram Micro Brasil. Versão 1.7
EasyAzure Guia do programa Versão 1.7 Email: cloud.br@ingrammicro.com Telefone: 55 (11) 2078-4280 Endereço: Av. Piracema, 1341 - Tamboré - Barueri - SP Brasil 1 EasyAzure São pacotes prontos com as soluções
Leia maisFramework para Deduplicação de Dados com Apache Spark
Framework para Deduplicação de Dados com Apache Spark César Magrin - magrin@inf.ufpr.br Disciplina: Metodologia Científica - CI860 Professor: Alexandre Direne Sumário 1. Qualidade de Dados 2. Deduplicação
Leia maisPÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan
PÓS-GRADUAÇÃO LATO SENSU Curso: Banco de Dados Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan Unidade 1.3 2016 Big Data Big Data - Contexto Globalização Modelo
Leia maisCOMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações
COMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações Jaqueline Joice Brito Slides em colaboração com Lucas de Carvalho Scabora Sumário Computação em Nuvem Definição
Leia maisBUSINESS INTELLIGENCE E DATA WAREHOUSE. Big Data Conceitos, Técnicas, Ferramentas e Arquitetura. tutorpro.com.br cetax.com.br
BUSINESS INTELLIGENCE E DATA WAREHOUSE Big Data Conceitos, Técnicas, Ferramentas e Arquitetura tutorpro.com.br cetax.com.br Quem somos 2 3 Objetivos do Curso de Big Data 4 Alinhamento das expectativas
Leia maisEscalonamento Adaptativo para o Apache Hadoop
Escalonamento Adaptativo para o Apache Hadoop 1 Andrea Schwertner Charão 1 {cassales,andrea}@inf.ufsm.br 1 Departamento de Linguagens e Sistemas de Computação Centro de Tecnologia Universidade Federal
Leia maisApache Hadoop É hoje que vai instalar o seu primeiro cluster?
Apache Hadoop É hoje que vai instalar o seu primeiro cluster? Date : 16 de Março de 2016 Como processar grandes quantidades de dados de forma rápida e a baixo custo? A resposta é Hadoop! Esta framework
Leia maisCASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO
Patrocínio, MG, outubro de 2016 ENCONTRO DE PESQUISA & EXTENSÃO, 3., 2016, Patrocínio. Anais... Patrocínio: IFTM, 2016. CASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO Moises Wesley de Souza
Leia maisSistemas Distribuídos Aula 8
Sistemas Distribuídos Aula 8 Aula passada Limitação dos semáforos Monitores Variáveis de condição Semântica de signal Aula de hoje Arquitetura de sistemas Arquitetura de sistemas distribuídos Cliente/servidor
Leia maisINTERNET DAS COISAS NAS NUVENS
INTERNET DAS COISAS NAS NUVENS por Tito Ocampos Abner Carvalho Cleiton Amorim Hugo Brito Agenda Introdução Computação em nuvem + Internet das Coisas Infraestrutura como Serviço Plataforma como Serviço
Leia maisSão Paulo. August,
São Paulo August, 28 2018 O futuro do armazenamento dos dados não estruturados Com o Dell EMC Isilon e o ECS Allan Gomes Souza Sr. Systems Engineer, Dell EMC A transformação digital está revolucionando
Leia maisTolerância a falha. Edy Hayashida
Tolerância a falha Edy Hayashida E-mail: edy.hayashida@uol.com.br Introdução Um objetivo importante do projeto de sistemas distribuídos é construir o sistema de modo tal que ele possa se recuperar automaticamente
Leia maisIlustrações Ágatha Kretli
Ilustrações Ágatha Kretli 34 caderno especial DESMISTIFICANDO O APRENDIZADO DE MÁQUINA POR FELIPE CRUZ, AGOSTINHO VILLELA E HUGO TADEU Durante uma palestra sobre aprendizado de máquina e inteligência artificial,
Leia maisApache Spark I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA
Apache Spark CARLOS EDUARDO MART INS RELVAS I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA Apache Hadoop Mudou a forma de armazenamento e processamento de dados em um cluster de computadores, trazendo
Leia maisComponente de aplicação. Figura 1 - Elementos funcionais de uma aplicação sendo executados de forma distribuída
11 1 Introdução Recentes avanços em redes de computadores impulsionaram a busca e o desenvolvimento de meios para facilitar e acelerar o desenvolvimento de aplicações em sistemas distribuídos, tornando
Leia maisFACULDADE MULTIVIX CURSO DE ENGENHARIA DE PRODUÇÃO 2º PERÍODO MARIANA DE OLIVEIRA BERGAMIN MONIQUE MATIELLO GOMES THANIELE ALMEIDA ALVES
FACULDADE MULTIVIX CURSO DE ENGENHARIA DE PRODUÇÃO 2º PERÍODO MARIANA DE OLIVEIRA BERGAMIN MONIQUE MATIELLO GOMES THANIELE ALMEIDA ALVES COMPUTAÇÃO EM NUVEM CACHOEIRO DE ITAPEMIRIM 2015 MARIANA DE OLIVEIRA
Leia maisCICN Centro de Inovação em Computação em Nuvem Segurança de Dados em Nuvem. Apresentação para:
CICN Centro de Inovação em Computação em Nuvem Segurança de Dados em Nuvem Apresentação para: Sumário CICN Centro de Inovação na Computação em Nuveml Computação em Nuvem Segurança de Dados na Nuvem Ficha
Leia maisslide Pearson Prentice Hall. Todos os direitos reservados.
Sistema de Arquivos slide 1 Sistemas de arquivos Condições essenciais para armazenamento de informações por um longo prazo: Deve ser possível armazenar uma grande quantidade de informação A informação
Leia maisInfraestrutura computacional para suporte de aplicações de big data na área da Saúde
Infraestrutura computacional para suporte de aplicações de big data na área da Saúde Maurício Barreto Davide Rasella Marcos Barreto Centro Interdisciplinar em Ciências e Tecnologia da Informação Infraestrutura
Leia maisWeb Crawlers Open Source. Heitor de Souza Ganzeli Analista de Projetos do nic.br
Web Open Source Heitor de Souza Ganzeli Analista de Projetos do nic.br O Comitê Gestor da Internet no Brasil (CGI.br) foi criado pela Portaria Interministerial nº 147, de 31 de maio de 1995, alterada pelo
Leia maisUNIVERSIDADE PRESBITERIANA MACKENZIE
1. Identificação do Curso a. Curso de Especialização em: Ciência de Dados (BIG DATA ANALYTICS) b. Área: Computação c. Área temática (tema): BIG DATA d. Linha de Pesquisa: Computação e Sistemas de Informação
Leia maisO VALOR DO BACKUP NA NUVEM. Fernando Henrique Feitosa
1 O VALOR DO BACKUP NA NUVEM Fernando Henrique Feitosa fernando.feitosa@dbacorp.com.br 2 DESCRIÇÃO Esse artigo tem como objetivo principal explanar de forma gerencial qual visão devemos adotar ao escolher
Leia maisCURTA DURAÇÃO ANÁLISE DE BIG DATA. CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini
CURTA DURAÇÃO ANÁLISE DE BIG DATA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini OBJETIVO O volume crescente de informação disponível nas
Leia maisAdministração de Serviços de Redes. Introdução a Clusters. Prof. Dayvidson Bezerra Contato:
Administração de Serviços de Redes Introdução a Clusters Prof. Dayvidson Bezerra Contato: dayvidsonbezerra@gmail.com Definição Cluster é um termo amplamente utilizado, significa computadores independentes
Leia maisDesmistificando a computação em nuvem para as empresas de seguros
34 Desmistificando a computação em nuvem para as empresas de seguros KELVIN CLETO GONÇALVES Atualmente, com o avanço da tecnologia e a possibilidade de ter acesso à internet através de uma série de dispositivos,
Leia maisOtimizando os recursos do OJS na publicação de artigos. Ronnie Fagundes de Brito - IBICT
Otimizando os recursos do OJS na publicação de artigos Ronnie Fagundes de Brito - IBICT O uso de software de apoio à editoração em sistemas de publicação da informação científica e tecnológica oferece
Leia maisArmazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil
1 Armazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil Acadêmico: Matheus Magnusson Bolo Disciplina: Segurança Computacional 2 Contexto WGID IV Workshop de Gestão de
Leia maisCloud Computing. Prof. Marcio R. G. de Vazzi Analista De sistemas Especialista em Gestão Mestrando em Educação
Cloud Computing Prof. Marcio R. G. de Vazzi Analista De sistemas Especialista em Gestão Mestrando em Educação www.vazzi.com.br profmarcio@vazzi.com.br Your Logo Estrutura da palestra Estrutura da T.I.
Leia maisBig Data: Uma revolução a favor dos negócios
Big Data: Uma revolução a favor dos negócios QUEM SOMOS Empresa especializada em Big Data e Analytics. Profissionais com larga experiência na gestão de bureaus de crédito, analytics e uso inteligente da
Leia maisBIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt
BIG DATA: UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com 70% 60% 50% 40% 30% 20%
Leia maisAlgoritmos de Junção Estrela em MapReduce
Algoritmos de Junção Estrela em MapReduce Jaqueline Joice Brito 09 de junho de 2015 1 Modelo Relacional Dados armazenados em um conjunto de tabelas Amplamente utilizado Junção Recuperação de dados de duas
Leia maisGerenciamento de Conteúdo Web CMS Joomla. Luiz C B Martins
Gerenciamento de Conteúdo Web CMS Joomla Luiz C B Martins luizmartins@unb.br Objetivo do Curso Usar as ferramentas e os conceitos básicos da plataforma Joomla para gerenciar e atualizar páginas na internet
Leia maisSOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE
SOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE PRINCÍPIOS BÁSICOS EMC ISILON Use a primeira e única solução NAS scale-out do setor com suporte nativo ao Hadoop Reduza os custos e acelere os resultados
Leia maisUma introdução ao Apache Hama
Uma introdução ao Apache Hama O modelo BSP nas nuvens Thiago Kenji Okada 1 1 Departamento de Ciências da Computação (DCC) Instituto de Matemática e Estatística (IME) Universidade de São Paulo (USP) MAC5742
Leia maisTipos de Clusters. Introdução. Introdução 21/03/12
Tipos de Clusters Prof. Msc. André Luiz Nasserala Pires nassserala@gmail.com! Cluster pode ser definido como um sistema onde dois ou mais computadores trabalham de maneira conjunta para realizar processamento
Leia maisBoas Práticas em Sistemas Web muito além do HTML...
Boas Práticas em Sistemas Web muito além do HTML... Adriano C. Machado Pereira (adrianoc@dcc.ufmg.br) De que Web estamos falando? De que Web estamos falando? A Web foi concebida para ser uma biblioteca
Leia maisSistemas Distribuídos. Edy Hayashida
Sistemas Distribuídos Edy Hayashida E-mail: edy.hayashida@uol.com.br Evolução 1960s 1980s Processamento de dados 1990s Sistemas de Informação Futuro Tecnologia da Informação Tecnologia dos Negócios 2 30
Leia maisLanUn1vers1ty 6421: CONFIGURANDO E SOLUCIONANDO PROBLEMAS EM UMA INFRAESTRUTURA DE REDES WINDOWS SERVER 2008
6421: CONFIGURANDO E SOLUCIONANDO PROBLEMAS EM UMA INFRAESTRUTURA DE REDES WINDOWS SERVER 2008 Objetivo: Este curso proporciona aos alunos o conhecimento e as habilidades necessárias para configurar e
Leia maisCarlos Eduardo de Carvalho Dantas
Cloud Computing Carlos Eduardo de Carvalho Dantas (carloseduardocarvalhodantas@gmail.com) Nós somos o que repetidamente fazemos. Excelência, então, não é um ato, mas um hábito. Aristóteles. Conectividade
Leia maisComputação em Grid e em Nuvem
Computação em Grid e em Nuvem Grids Computacionais Características Infraestrutura Produtos Exemplos Computação em Nuvem Características Modelos Infraestrutura Exemplos 1 Grids Computacionais Definição
Leia maisSistemas Distribuídos
Sistemas Distribuídos Unitri Prof: Carlos Eduardo de Carvalho Dantas Conceitos Sistema Distribuído é um conjunto de computadores independentes que se apresenta a seus usuários como um sistema único e coerente.
Leia maisAvanços e Perspectivas do Projeto Integrade na UFMA
Avanços e Perspectivas do Projeto Integrade na UFMA Francisco José da Silva e Silva Universidade Federal do Maranhão - UFMA Departamento de Informática Laboratório de Sistemas Distribuídos - LSD Agosto
Leia maisUniversidade Federal de Pernambuco
Universidade Federal de Pernambuco Graduação em Ciência da Computação Centro de Informática 2017.1 Uma biblioteca Multi-Tenant para Flask Proposta de Trabalho de Graduação Aluno: Bruno Resende Pinheiro
Leia maisPÓS-GRADUAÇÃO ANÁLISE DE BIG DATA
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e
Leia maisAs Redes Sociais e a Sociedade da Informação: Pokémon GO como Case
As Redes Sociais e a Sociedade da Informação: Pokémon GO como Case Professor: Rômulo César Dias de Andrade. E-mail: romulocesar@faculdadeguararapes.edu.br www.romulocesar.com.br PROFESSOR... NOME: RÔMULO
Leia maisInformática. Cloud Computing e Storage. Professor Márcio Hunecke.
Informática Cloud Computing e Storage Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática COMPUTAÇÃO EM NUVEM Cloud Computing ou Computação em Nuvem pode ser definido como um modelo no
Leia maisWhite paper. EMC Isilon: uma plataforma de armazenamento dimensionável. Abril de 2014
White paper EMC Isilon: uma plataforma de armazenamento dimensionável para Big Data Por Nik Rouda, analista sênior, e Terri McClure, analista sênior Abril de 2014 Este white paper do ESG foi autorizado
Leia maisMarketing de. Conteúdo. Plano de Estudo
Marketing de Conteúdo Plano de Estudo Descrição do programa O programa está construído tecnicamente, desde uma perspectiva educativa e com os mais recentes desenvolvimentos e padrões do mercado digital.
Leia maisPipelines ETL. Aplicação de conceitos de DW para a construção de pipelines de extração, transformação e carregamento de dados.
Pipelines ETL Aplicação de conceitos de DW para a construção de pipelines de extração, transformação e carregamento de dados Carlos Baqueta Contextualização Contextualização Quem sou eu? (momento filosófico)
Leia maisProf. Daniela Barreiro Claro
Prof. Daniela Barreiro Claro Volume de dados muito grande Principais problemas em relacao aos SGBD Relacionais é conciliar o tipo de modelo com a demanda da escalabilidade. Exemplo -Facebook Um crescimento
Leia maisUSO PROFISSIONAL DE COMPUTADORES
USO PROFISSIONAL DE COMPUTADORES PROF. ME. HÉLIO ESPERIDIÃO SISTEMA OCTADECIMAL Sistema Octal é um sistema de numeração cuja base é 8, ou seja, utiliza 8 símbolos para a representação de quantidade. No
Leia maisCLOUD COMPUTING: O USO DA PLATAFORMA AWS E ARMAZENAMENTO NO AMAZON S3.
CLOUD COMPUTING: O USO DA PLATAFORMA AWS E ARMAZENAMENTO NO AMAZON S3. Michele Marques Costa 1,2, WillianFressati 2 ¹Universidade Paranaense (Unipar) Paranavaí PR Brasil marquesmih04@gmail.com wyllianfressati@unipar.br
Leia maispor parte dos usuários dos sistemas de computação se tornou menos necessária e a popularidade desse tipo de linguagem diminuiu. Mais recentemente, a
1 Introdução Middleware é um termo cunhado no final da década de 60 (Naur e Randell, 1968), que é freqüentemente empregado para designar uma camada de software que oferece uma infra-estrutura para construção
Leia maisMBA ANALYTICS EM BIG DATA
MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação
Leia maisUma conversa que não pára: o Pinguim, o Morcego e o Elefante
Uma conversa que não pára: o Pinguim, o Morcego e o Elefante Uma solução de backup de alta disponibilidade para DataCenter Allan Rodrigo de Lima CCE/USP VIII GeINFO Agenda Soluções em produção Motivação
Leia maisUNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA
1 UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA JUAN CASSIUS CARNEIRO PEREIRA PEDRO M. NETO GOOGLE CLOUD PONTA GROSSA 2017 2 JUAN CASSIUS
Leia maisDesenvolvimento de Aplicações Distribuídas
SOA e Web Services Pontifícia Universidade Católica de Minas Gerais Instituto de Ciências Exatas e Informática DAD (2019/01) Tópicos Apresentação da disciplina Introdução Desafios e características Arquitetura
Leia maisUso de Map Reduce no Processamento de Joins Sobre Dados Espaciais em Árvores R-Tree Distribuídas
Uso de Map Reduce no Processamento de Joins Sobre Dados Espaciais em Árvores R-Tree Distribuídas Thiago Borges de Oliveira Vagner José do Sacramento Rodrigues Instituto de Informática Universidade Federal
Leia maisSistemas de arquivos distribuídos. ECO036 - Sistemas Paralelos e Distribuídos
Sistemas de arquivos distribuídos ECO036 - Sistemas Paralelos e Distribuídos Sistemas de arquivos distribuídos - Daniel Nogueira 20938 - Felipe Castro Simões 21525 Sumário 1. Introdução 2. Sistemas de
Leia maisRESUMO DA PROGRAMAÇÃO - Minicursos
RESUMO DA PROGRAMAÇÃO - Minicursos Quarta-feira 15/05 Nome do Minicurso: Introdução ao desenvolvimento na plataforma.net (C#) Parte 01 Sala: Laboratório 04 Nome do Minicurso: Implantação de aplicações
Leia maisPalavras-chave: (banco de dados; prontuário médico; paciente); deve vir logo abaixo do resumo
BANCO DE DADOS PARA UM PRONTUÁRIO MÉDICO ELETRÔNICO Nome dos autores: Igor Barreto Rodrigues¹; Patrick Letouze Moreira² 1 Aluno do Curso de Ciência da Computação; Campus de Palmas; e-mail: igor.cientista@uft.edu.br
Leia maisBig Data. A Nova Onda
Big Data A Nova Onda Ricardo Rezende 18 anos em TI; 12 anos como DBA Oracle; Infrastructure Principal @ Accenture Enkitec Group; Oracle Certified Professional; IBM Certified Database Associate; Mestrando
Leia maisEngenharia de Software
Arquitetura de Sistemas Distribuídos Cap. 12 Sommerville 8 ed. Introdução: É um software que usa várias máquinas para executar suas tarefas. Praticamente todos os sistemas baseado em grandes computadores
Leia maisConceitos de Sistemas Distribuídos
Conceitos de Sistemas Distribuídos Roteiro Definição de Sistemas Distribuídos (SD) Evolução Histórica Exemplos (SD) Modelos (Vantagens x Desvantagens) 2 O que é um Sistema Distribuído? Definição Coleção
Leia maisHadoop - HDFS. Universidade Federal de Goiás Ciência da Computação
Hadoop - HDFS Universidade Federal de Goiás Ciência da Computação O que é Hadoop? Um framework para lidar com aplicações distribuídas que fazem uso massivo de dados Originalmente construído para a distribuição
Leia maisPROGRAMAÇÃO PARA INTERNET RICA RICH INTERNET APPLICATIONS
PROGRAMAÇÃO PARA INTERNET RICA RICH INTERNET APPLICATIONS Prof. Dr. Daniel Caetano 2011-2 Visão Geral 1 2 3 4 5 Conceito das RIA Desafios Atuais Características das RIA Considerações e Benefícios Situação
Leia maisAlessandro Jannuzi Open Source Lead
Microsoft + Open Source Inovação e Eficiência Operacional em um Mundo mais Integrado Alessandro Jannuzi Open Source Lead Microsoft + Open Source Tweet Cnet, Q&A Tweet Industry Leaders The Seattle Times
Leia maisHadoopDB. Edson Ie Serviço Federal de Processamento de Dados - SERPRO
HadoopDB Edson Ie Serviço Federal de Processamento de Dados - SERPRO Motivação Grandes massas de dados precisam ser processadas em clusters: 1 nó: 100TB@59MB/s = 23 dias Cluster com 1000 nós 33 min!!!
Leia maisSeminário apresentado em 29/06/2017 Disciplina: Sistemas Distribuídos Professora: Noemi Rodriguez Aluno: Ricardo Dias
Seminário apresentado em 29/06/2017 Disciplina: Sistemas Distribuídos Professora: Noemi Rodriguez Aluno: Ricardo Dias Visão Geral Alta disponibilidade & tolerante a falhas Banco de dados distribuído de
Leia maisHaddop, MapReduce e Spark
Haddop, MapReduce e Spark Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Conceitos Básicos 2. MapReduce 3. Spark 4. Transformações Básicas 5. Ações Básicas 1 Conceitos Básicos Hadoop
Leia maisCOMPUTAÇÃO PARALELA E DISTRIBUÍDA
COMPUTAÇÃO PARALELA E DISTRIBUÍDA Aluno: Alessandro Faletti Orientadora: Noemi Rodriguez Introdução O objetivo inicial no projeto era aplicar a possibilidade de processamento em paralelo no sistema CSBase
Leia maisSistemas de Informação (SI) Infraestrutra de Tecnologia da Informação (TI): Software
Sistemas de Informação (SI) Infraestrutra de Tecnologia da Informação (TI): Software Prof.ª Dr.ª Symone Gomes Soares Alcalá Universidade Federal de Goiás (UFG) Regional Goiânia (RG) Faculdade de Ciências
Leia maisEvolução Histórica das Redes de Computadores
Evolução Histórica das Redes de Computadores Redes de Computadores Charles Tim Batista Garrocho Instituto Federal de Minas Gerais IFMG Campus Ouro Branco https://garrocho.github.io charles.garrocho@ifmg.edu.br
Leia mais