Análise de Big Data Streams



Documentos relacionados
Redes Definidas por Software

EA080- Laboratório de Redes de Computadores Laboratório 2 Virtualização (Relatório Individual) Prof. Responsável: Mauricio Ferreira Magalhães

Separação de fluxos TCP e UDP

Infra-Estrutura de Software. Introdução. (cont.)

Como criar máquinas virtuais no VMware ESXi

Controle de congestionamento em TCP

Introdução. O que vimos. Infraestrutura de Software. (cont.) História dos Sistemas Operacionais. O que vimos 12/03/2012. Primeira geração:

Realizando o P2V - Online

TUTORIAL VMWARE WORKSTATION 8. Aprenda a instalar e configurar corretamente uma máquina virtual utilizando VMware Workstation com este tutorial

Sistemas Operacionais

BRAlarmExpert. Software para Gerenciamento de Alarmes. BENEFÍCIOS obtidos com a utilização do BRAlarmExpert:

BIG DATA: UTILIZANDO A INTERNET PARA TOMADA DE DECISÕES

Senado Federal Questões 2012

Tópicos Especiais em Redes de Telecomunicações

ETEC RAPOSO TAVARES GESTÃO DE SISTEMAS OPERACIONAIS I. Máquina Virtual. Instalação de S.O. em dual boot. 1º Semestre 2010 PROF.

Introdução a Informática - 1º semestre AULA 02 Prof. André Moraes

Requisitos de Sistema Impressão Comercial e Editorial

5.2 MAN s (Metropolitan Area Network) Redes Metropolitanas

INSTALANDO UM SERVIDOR WINDOWS SERVER 2012 R2 SERVER CORE

CoIPe. Telefonia com Tecnologia

Tópicos Especiais em Redes de Telecomunicações

Software de gerenciamento de impressoras

DELL POWERVAULT SÉRIE MD ARMAZENAMENTO DE DADOS MODULAR ARMAZENAMENTO DE DADOS DELL POWERVAULT SÉRIE MD

Uc-Redes Técnico em Informática André Luiz Silva de Moraes

GUIA DE INÍCIO RÁPIDO NHS NOBREAK MANAGER 4.0 TOPOLOGIA MÍNIMA DE REDE PARA A INSTALAÇÃO E USO DO SOFTWARE COM GPRS

Conteúdo do pacote de 03 cursos hands-on

Resumo até aqui. Gerenciamento Proteção Compartilhamento. Infra-estrutura de Software

Tópicos. Atualizações e segurança do sistema. Manutenção Preventiva e Corretiva de Software (utilizando o MS Windows XP)

1 REQUISITOS BÁSICOS PARA INSTALAR O SMS PC REMOTO

Instalando e configurando DFS (Distributed File System) no Windows Server 2008 R2 em ambiente virtual (VirtualBox)

Gerência de Redes de Computadores. 05 Gerência de Hospedeiros (Hosts)

Prof. Ms. José Eduardo Santarem Segundo Demonstrar o impacto que o tema virtualização tem representado no mercado

Virtualização Gerencia de Redes Redes de Computadores II

Projeto Liowsn Manual de utilização do sistema

Guia De Configuração do Sistema de Comunicação GPRS ID DATA

Requisitos de Sistema Impressão Comerciale Editorial

TISSNet Instalando e Configurando Schemas

Capítulo 1. Introdução

Aula 1 Windows Server 2003 Visão Geral

Padrão ix. Manual de Instalação do Q-Ware Server Versão

Sistemas Distribuídos. Professora: Ana Paula Couto DCC 064

Lab 2 MapReduce e o Console Web

Manual de Operação do Simulador EONSim - Elastic Optical Networks Simulator

Virtualização e Consolidação de Centro de Dados O Caso da UTAD António Costa - acosta@utad.pt

Colégio Liceal de Santa Maria de Lamas

SISTEMAS OPERACIONAIS. Maquinas Virtuais e Emuladores

NOVO MODELO DE ATUALIZAÇÃO FOCCO Atualização automática com o FoccoUPDATE


Projeto de Redes Top-Down

Sistemas Operacionais. Conceitos de um Sistema Operacional

I N F O R M Á T I C A. Sistemas Operacionais Prof. Dr. Rogério Vargas Campus Itaqui-RS

Introdução à Computação: Sistemas Operacionais II

Introdução. Sistemas Operacionais. Introdução. Roteiro (1 / 2) Por que Máquinas Virtuais Existem? Roteiro (2 / 2)

IBM Software Demos Tivoli Provisioning Manager for OS Deployment

Manual de Instalação. Sistema de Gestão e Acompanhamento de Frotas SIGAFROTA. Versão 1.0 Francisco Edilson do Nascimento

Prof. Luiz Fernando Bittencourt MC714. Sistemas Distribuídos 2 semestre, 2013

Máquinas Virtuais E eu com isso???

Redes de Computadores

Curso de extensão em Administração de sistemas GNU/Linux: redes e serviços

Manual de Instalação ( Client / Server ) Versão 1.0

Procedimentos para Instalação do SISLOC

Manual do usuário. Mobile Auto Download

SDN-WISE: Design, prototyping and experimentation of a stateful SDN solution for WIreless SEnsor networks

ADMINISTRAÇÃO DE SISTEMAS OPERACIONAIS SERVIÇOS DE ACESSO REMOTO (TELNET E TERMINAL SERVICES) Professor Carlos Muniz

MINICURSO WINDOWS SERVER 2008 UTILIZANDO O VMWARE PLAYER

1

Este tutorial está publicado originalmente em

Requisitos de Sistema Impressão Comercial e Editorial

Guia de instalação UEG Linux LTS

ARQUIVOS DE CONFIGURAÇAO ZIM 8.50

Conceitos de relação de confiança

Realizado por: Fábio Rebeca Nº6. Iuri Santos Nº8. Telmo Santos Nº23

Capítulo 8. Software de Sistema

Para continuar, baixe o linux-vm aqui:

Foundation Fieldbus HSE

Configurações para otimização de performance

Prof. José Maurício S. Pinheiro UniFOA

SolarWinds Kiwi Syslog Server

Manual do usuário. Mobile Player

COORDENAÇÃO DE TECNOLOGIA (COTEC) ABRIL/2011

NETALARM GATEWAY Manual Usuário

Prof. Samuel Henrique Bucke Brito

Guia do Usuário do Avigilon Control Center Server

4 Estrutura do Sistema Operacional Kernel

Bruno Antunes da Silva UFSCar - Sorocaba

Quarta-feira, 09 de janeiro de 2008

Manual Instalação, Configuração e Atualização FullCopyConvert Data FullCopyConvertService

Palestra sobre os softwares: AFSoft, GeoFieldere Sacam Desenvolvimento e aplicação de tecnologias.

MANUAL DE INSTALAÇÃO 1) ORACLE VIRTUALBOX ; 2) MICROSOFT WINDOWS ; 3) SUMÁRIOS GENEPLUS.

INTERFACE USB PARA PROFIBUS PA

Construa um Data Lake multi-protocolo e otimizado para analytics com ISILON. Fernando Pavan Isilon Specialist

Manual de Instalação do Agente Citsmart

(Open System Interconnection)

Guia de Conectividade Worldspan Go Res! A V A N Ç A D O

Transcrição:

Análise de Big Data Streams Identificando e tratando fluxo Hadoop Marcelo Vaz Netto Nilson Moraes Filho 14/07/14

Propósito do Artigo Original Programming Your Network at Run-time for Big Data Applications Discutir a otimização do fluxo de dados na rede através do gerenciamento SDN Alteração, em tempo real, da topologia da rede usando Switches Ópticos Exemplo: Processos Hadoop Hadoop é um framework que permite o processamento distribuídode grandesconjuntosde dados atravésde um cluster de computadoresutilizandoum modelosimples de programação

Finalidade do nosso projeto Análise de Big Data Streams tratando fluxo Hadoop Objetivo: Otimizar fluxo interno de dados em grandes Data Centers Criar um ambiente dentro do Mininet para execução dos processos Hadoop. Instalar toda a funcionalidade Hadoop no ambiente Mininet Não utilizar diferentes ambientes virtualizados para o Hadoop Usando SDN, criar rotas específicas para tráfego de controle e tráfego de dados Tráfego de dados simula a utilização dos switches ópticos Tráfego de controle, por ser de menor volume, simula a utilização de switches tradicionais

Ambienteutilizadonostestes Laptop 1 Windows XP, 4GB RAM, Intel Core Duo @2.26GHz VMWare Player Imagem Mininet 2.1.0-130919-ubuntu-1304- server-i386 com 2GB de RAM e 8GB de storage alocados Hadoop 1.2.1 Laptop 2 Ubuntu 14.04, 3GB RAM, Intel processor Hadoop 1.2.1

Recordandoum poucosobrehadoop Principais processos do Hadoop: NameNode: é o ponto central do Hadoop File System (HDFS). Mantém a árvore de diretórios de todos os arquivos e gerencia onde o arquivo é armazenado através do cluster. Aplicações clientes trocam mensagens com o NameNode para localizar um arquivo. DataNode: armazena arquivos no HDFS MapReduce: é o algoritmo chave que distribui as tarefas através dos clusters Job Tracker é um serviço dentro do Hadoop que distribui as tarefas MapReduce para nós específicos no cluster, de preferência onde os dados estão armazenados ou pelo menos no mesmo rack Task Tracker: é um nó do cluster que aceita tarefas operações Map, Reduce e Shuffle de um Job Tracker Ambiente Mininet Host 2 Host 3 Host 4 Host1

Nossoprimeirodesafio Problema: Mininet suporta network namespaces (virtualização leve que fornece individualmenteaosprocessosinterface de redesindependentese tabelas de roteamento e ARP separadas) Entretantopararodaro Hadoopde forma distribuídaemcadahost, necessitávamostambémda independênciade processos(pid) e disco (mount) Solução: UtilizamosLXC Containers: o objetivodo LXC é o de criarum ambienteo maispróximopossívelde umainstalaçãopadrãolinux massema necessidade de um kernel em separado LXC utilizaas seguintesfunçõesdo kernel paraconterosprocessos: Kernel namespaces (ipc, uts, mount, pid, network and user), Chroots, Kernel capabilities e Control groups (cgroups) Outras opções de containers: Dockers, Debian

PrimeiroPasso Carregando Topologia Mininet e controlador POX

Segundo Passo Acessando os hosts (Xterm)

TerceiroPasso Iniciando os containers

Quarto Passo Iniciando o Hadoop

QuintoPasso Verificando os processos do Hadoop JPS: Java Virtual Machine Process Status Tool lista as JVM rodando no sistema

SextoPasso Executando o Hadoop Testando com o wordcount Aplicação wordcount vem com o Hadoop

VerificandoosResultados Contando as palavras do livro Ulysses de James Joyce

Como foiimplementado Topologia e SDN Tráfegode Controle: Portas10001 e 10002 Switch S8 Tráfego de Dados: Porta 50010 Não inserimos na figura o controlador SDN para facilitar a visualização Controlador SDN conectado a todos os Switches

Regrasdo ControladorPOX(exemplos de regras) Pacote TCP Porta de Controle Switch de Controle S8 recebe pacote ARP Flood em todas as portas Tráfego para o Switch S2 0x0806 = ARP

Verificando os Resultados Fluxo de Controle (wireshark) Controle

Verificando os Resultados Fluxo de Dados (wireshark) Dados

TecnologiasUtilizadase PróximosPassos Tecnologia Utilizada Mininet com controlador POX Hadoop Containers Próximos Passos Implementaralgoritmode roteamento(djikstra, etc?) Rotas de Contingência

Referências [1] GuohuiWang, T. S. Eugene Ngy, AneesShaikh: Programming Your Network at Run-time for Big Data Applications. In ACM SIGCOMM Workshop on Hot Topics in Software Defined Networking (HotSDN'12) [2] mininet.org/overview [3] http://docs.hortonworks.com/hdpdocuments/hdp1/hdp- 1.2.0/bk_reference/content/reference_chap2_1.html [4] http://containerops.org/2013/11/19/lxc-networking [5] http://ofirm.wordpress.com/2014/01/05/creating-a-virtualized-fullydistributed-hadoop-cluster-using-linux-containers/ [6] http://hadoop.apache.org/