Big Data Open Source com Hadoop

Tamanho: px
Começar a partir da página:

Download "Big Data Open Source com Hadoop"

Transcrição

1 Big Data Open Source com Hadoop Palestrante: Marcio Junior Vieira Realização:

2 Marcio Junior Vieira 14 anos de experiência em informática, vivência em desenvolvimento e análise de sistemas de Gestão empresarial. Trabalhando com Software Livre desde 2000 com serviços de consultoria e treinamento. Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR. Palestrante em diversos Congressos relacionados a Software Livre tais como: CONISLI, SOLISC, FISL, LATINOWARE, SFD, JDBR, Campus Party, Pentaho Day. Fundador da Ambiente Livre.

3 Ecosistema Ambiente Livre

4 Colaborações

5 Big Data - Muito se fala...

6

7 Big Data É um novo conceito se consolidando. Grande armazenamento de dados e maior velocidade

8 Os 4 V's Velocidade, Volume, Variedade e Valor

9 Volume Modelos de Persistência da ordem de Petabytes, zetabytes ou yottabyte(yb). Geralmente dados não estruturados. Um Zettabyte corresponde a (10²¹) ou (2 elevado a 70) Bytes.

10 Velocidade Processamento de Dados Armazenamento Analise de Dados

11 Variedade Dados semi-estruturados Dados não estruturados Diferentes fontes Diferentes formatos

12 Valor Tomada de Decisão Benefícios Objetivo do Negócio.

13 O momento é agora

14 Onde podemos utilizar Big Data??

15 Sistema de Recomendação WWW em geral

16 Redes Sociais

17 Analise de Risco Crédito Seguros Mercado Financeiro

18 Dados Espaciais Clima Imagens Trafego Monitoramento

19 Big Data X BI Big Data e uma evolução do BI, devem caminhar juntos Data Warehouses são necessários para armazenar dados estruturados Previsão: BI Casos específicos Big Data Analise geral

20 Profissionais Novo profissional: Cientista de Dados

21 Competências do Cientista de dados Fonte

22 De onde?

23 Ferramentas de Big Data

24 Hadoop O Apache Hadoop é um projeto de software open-source escrito em Java. Escalável, confiável e com processamento distribuído. Filesystem Distribuido. Inspirado Originalmente pelo GFS e MapReduce da Google ( Modelo de programação MapReduce) Utiliza-se de Hardware Comum ( Commodity cluster computing ) Framework para computação distribuída infraestrutura confiável capaz de lidar com falhas ( hardware, software, rede )

25 Motivações Atuais Grande quantidade ( massiva ) de dados Dados não cabem em uma máquina Demoram muito para processar de forma serial Máquinas individuais falham Computação nas nuvens Escalabilidade de aplicações Computação sob demanda

26 A origem do Nome Segundo Doug Cutting, criador do Hadoop O nome que meu filho deu a um elefante amarelo de pelúcia. Curto, relativamente fácil de soletrar e pronunciar, sem sentido, e não usado em outro lugar: esses são os meus critérios de nomeação

27 Ecosistema

28 O que é HDFS Hadoop Filesystem Um sistema de arquivos distribuído que funciona em grandes aglomerados de máquinas de commodities.

29 Características do HDFS Inspirado em GFS Projetado para trabalhar com arquivos muito grandes e grandes volumes Executado em hardware comum Streaming de acesso a dados Replicação e localidade

30 HDFS Projetado para escalar a petabytes de armazenamento, e correr em cima dos sistemas de arquivos do sistema operacional subjacente.

31 Fonte:

32 HDFS - Replicação Dados de entrada é copiado para HDFS é dividido em blocos e cada blocos de dados é replicado para várias máquinas

33 MapReduce É um modelo de programação desenhado para processar grandes volumes de dados em paralelo, dividindo o trabalho em um conjunto de tarefas independentes

34 Programação Distribuída

35 MapReduce Você especifica o map (...) e reduce (...) funções map = (lista (k, v) -> lista (k, v)) reduce = (k, lista (v) -> k, v) O Framework faz o resto Dividir os dados Execute vários mappers sobre as divisões Embaralhar os dados para os redutores Execute vários redutores Guarde os resultados finais

36 MapReduce Map Reduce

37 Modos de Operação Standalone ( Local ) Pseudo-distributed Fully-distributed

38 Outros componentes PIG - linguagem de fluxo de dados e ambiente de execução para explorar grandes conjuntos de dados.executado no HDFS e grupos MapReduce. Hive - Armazém de dados (datawarehouse) distribuídos. Gerencia os dados armazenados no HDFS e fornece uma linguagem de consulta baseada em SQL para consultar os dados. Hbase Banco de dados orientada por colunas distribuída. HBase usa o HDFS por sua subjacente de armazenamento e suporta os cálculos de estilo lote usando MapReduce e ponto consultas (leituras aleatórias).

39 Outros componentes ZooKeeper Serviço de coordenação altamente disponível e distribuído. Fornece funções de bloqueios distribuídos que podem ser usados para a construção de aplicações distribuídas. Sqoop Ferramenta para a movimentação eficiente de dados entre bancos de dados relacionais e HDFS. Mahout - Aprendizagem de máquina escalável, de fácil uso comercial para a construção de aplicativos inteligentes

40 Distribuições Hadoop Open Source Apache Comercial Open Source - Cloudera - HortoWorks - MapR - AWS MapReduce - Microsoft HDInsight (beta)

41 Possibilidades de Uso DataWareHouse Business Intelligence Aplicações analíticas Mídias Sociais Sugestão de Compras Analise preditiva Compras Coletivas Recomendações

42 Modelo tradicional de Uso

43 Empresa Usando Hadoop Amazon Joost Facebook Last.fm Google New York Times IBM PowerSet Yahoo Veoh Linkedin Twitter Ebay

44 Hadoop no Brasil

45 Contatos Blog blogs.ambientelivre.com.br/marcio Facebook/ambientelivre

46 Convite Pentaho Day 17 de Maio SP FTSL - 18 e 19 de Setembro Software Freedom Day 20 de Setembro.

Elaborando uma plataforma de Big Data & Analytics 100% Open Source com apoio do Pentaho.

Elaborando uma plataforma de Big Data & Analytics 100% Open Source com apoio do Pentaho. Open Source Data Science Elaborando uma plataforma de Big Data & Analytics 100% Open Source com apoio do Pentaho. Palestrante: Marcio Junior Vieira CEO e Data Scientist na Ambiente Livre marcio@ambientelivre.com.br

Leia mais

PostgreSQL em um Ambiente Híbrido de Big Data Analytics. Palestrante: Marcio Junior Vieira marcio@ambientelivre.com.br

PostgreSQL em um Ambiente Híbrido de Big Data Analytics. Palestrante: Marcio Junior Vieira marcio@ambientelivre.com.br PostgreSQL em um Ambiente Híbrido de Big Data Analytics Palestrante: Marcio Junior Vieira marcio@ambientelivre.com.br Marcio Junior Vieira Trabalhando com Software Livre desde 2000 com serviços de consultoria

Leia mais

Bruno Antunes da Silva UFSCar - Sorocaba

Bruno Antunes da Silva UFSCar - Sorocaba Bruno Antunes da Silva UFSCar - Sorocaba Introdução HDFS Arquitetura Leitura e escrita Distribuição de nós Controle de réplicas Balancer MapReduce Conclusão Aplicações web com grandes quantidades de dados

Leia mais

Informática Parte 10 Prof. Márcio Hunecke

Informática Parte 10 Prof. Márcio Hunecke Escriturário Informática Parte 10 Prof. Márcio Hunecke Informática CONCEITOS DE MAPREDUCE E HDFS/HADOOP/YARN 2.7.4 Big Data O termo Big Data refere-se a um grande conjunto de dados armazenados e baseia-se

Leia mais

AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP

AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Dr. Paulo Romero Martins Maciel INTRODUÇÃO Nem sempre os dados

Leia mais

Informática Parte 11 Prof. Márcio Hunecke

Informática Parte 11 Prof. Márcio Hunecke Escriturário Informática Parte 11 Prof. Márcio Hunecke Informática FERRAMENTAS DE INGESTÃO DE DADOS (SQOOP 1.4.6, FLUME 1.7.0, NIFI 1.3.0 E KAFKA 0.11.0) Visão geral sobre os quatro componentes Fazem

Leia mais

PÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan

PÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan PÓS-GRADUAÇÃO LATO SENSU Curso: Banco de Dados Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan Unidade 1.3 2016 Big Data Big Data - Contexto Globalização Modelo

Leia mais

PrIntCloud. Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13

PrIntCloud. Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13 PrIntCloud Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13 Roteiro 1. Fundamentação Teórica A.- Cloud Computing B.- Hadoop C.- MapReduce D.- NoSql 2. Proposta

Leia mais

Pentaho IoT Analytics Open Source Trilha IoT

Pentaho IoT Analytics Open Source Trilha IoT Pentaho IoT Analytics Open Source Trilha IoT Marcio Junior Vieira CEO & Data Scientist, Ambiente Livre Marcio Junior Vieira Mini-cv 18 anos de experiência em informática, vivência em desenvolvimento e

Leia mais

BUSINESS INTELLIGENCE E DATA WAREHOUSE. Big Data Conceitos, Técnicas, Ferramentas e Arquitetura. tutorpro.com.br cetax.com.br

BUSINESS INTELLIGENCE E DATA WAREHOUSE. Big Data Conceitos, Técnicas, Ferramentas e Arquitetura. tutorpro.com.br cetax.com.br BUSINESS INTELLIGENCE E DATA WAREHOUSE Big Data Conceitos, Técnicas, Ferramentas e Arquitetura tutorpro.com.br cetax.com.br Quem somos 2 3 Objetivos do Curso de Big Data 4 Alinhamento das expectativas

Leia mais

BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES?

BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES? 1 BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES? Deyvirson Mendonça SUMÁRIO Definição Os Vs do Big Data Desafios Hadoop BD e Big Data PARA COMEÇAR O QUE SÃO DADOS? Informações diversas, que podem ser organizadas

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e

Leia mais

Benjamin Bengfort Jenny Kim

Benjamin Bengfort Jenny Kim Benjamin Bengfort Jenny Kim Novatec Authorized Portuguese translation of the English edition of Data Analytics with Hadoop, ISBN 9781491913703 2016 Benjamin Bengfort, Jenny Kim. This translation is published

Leia mais

MBA ANALYTICS EM BIG DATA

MBA ANALYTICS EM BIG DATA MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação

Leia mais

Big Data. O que é Big Data! Como surgiu isso! Para que serve?!

Big Data. O que é Big Data! Como surgiu isso! Para que serve?! Big Data O que é Big Data! Como surgiu isso! Para que serve?! Da teoria a prática:! 1! Dá mesmo para! fazer algo prático! com o! Big Data?! Como tudo! começou?!! Qual o! Problema?! PERCEBEU:! Informações

Leia mais

BIG DATA. Jorge Rady de Almeida Jr. Escola Politécnica da U SP

BIG DATA. Jorge Rady de Almeida Jr. Escola Politécnica da U SP BIG DATA Jorge Rady de Almeida Jr. jorgerady@usp.br Escola Politécnica da U SP BIG DATA - MOTIVAÇÃO Aumento da geração e armazenamento digital de dados Aumento da capacidade de processamento em geral:

Leia mais

QUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ;

QUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ; QUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ; LEIA O MATERIAL ANTES DE FAZER O EXEMPLO DIDÁTICO. AS QUESTÕES ABAIXO PODEM SER RESPONDIDAS, USANDO, PREFERENCIALMENTE, SUA PRÓPRIAS

Leia mais

Solisc 2010 Uma Introdução ao Pentaho BI Open Source

Solisc 2010 Uma Introdução ao Pentaho BI Open Source Solisc 2010 Uma Introdução ao Pentaho BI Open Source Marcio Junior Vieira marcio @ ambientelivre.com.br Sobre o Palestrante A 10 anos trabalha nas áreas de análise, consultoria e desenvolvimento de sistemas.

Leia mais

A NOVA EXPERIÊNCIA ANALÍTICA

A NOVA EXPERIÊNCIA ANALÍTICA A NOVA EXPERIÊNCIA ANALÍTICA USANDO MELHOR O HADOOP COMO PEÇA DO QUEBRA-CABEÇA DO BIG DATA Rafael Aielo Gerente de Soluções AGENDA Era Big Data Hadoop O que é e como funciona SAS e Hadoop ERA BIG DATA

Leia mais

Community Builder Construção de Redes Sociais em Joomla. Marcio Junior Vieira marcio @ ambientelivre.com.br

Community Builder Construção de Redes Sociais em Joomla. Marcio Junior Vieira marcio @ ambientelivre.com.br Community Builder Construção de Redes Sociais em Joomla Marcio Junior Vieira marcio @ ambientelivre.com.br Sobre o Palestrante A 10 anos trabalha nas áreas de análise, consultoria e desenvolvimento de

Leia mais

COMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações

COMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações COMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações Jaqueline Joice Brito Slides em colaboração com Lucas de Carvalho Scabora Sumário Computação em Nuvem Definição

Leia mais

CURTA DURAÇÃO ANÁLISE DE BIG DATA. CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini

CURTA DURAÇÃO ANÁLISE DE BIG DATA. CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini CURTA DURAÇÃO ANÁLISE DE BIG DATA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini OBJETIVO O volume crescente de informação disponível nas

Leia mais

Solisc 2010 Gerenciamento de Projetos com dotproject

Solisc 2010 Gerenciamento de Projetos com dotproject Solisc 2010 Gerenciamento de Projetos com dotproject Marcio Junior Vieira marcio em ambientelivre.com.br Sobre o Palestrante A 10 anos trabalha nas áreas de análise, consultoria e desenvolvimento de sistemas.

Leia mais

UNIVERSIDADE PRESBITERIANA MACKENZIE

UNIVERSIDADE PRESBITERIANA MACKENZIE 1. Identificação do Curso a. Curso de Especialização em: Ciência de Dados (BIG DATA ANALYTICS) b. Área: Computação c. Área temática (tema): BIG DATA d. Linha de Pesquisa: Computação e Sistemas de Informação

Leia mais

Governança e Big Data. Celso Poderoso

Governança e Big Data. Celso Poderoso Governança e Big Data Celso Poderoso cpoderoso@microstrategy.com Celso Poderoso Formação Acadêmica: Economista Especialista em Sistemas de Informação Mestre em Tecnologia (Grid Computing/Cloud Computing)

Leia mais

Big Data. A Nova Onda

Big Data. A Nova Onda Big Data A Nova Onda Ricardo Rezende 18 anos em TI; 12 anos como DBA Oracle; Infrastructure Principal @ Accenture Enkitec Group; Oracle Certified Professional; IBM Certified Database Associate; Mestrando

Leia mais

Estudo de implementação de um cluster utilizando apache hadoop. Giovanni Furlanetto

Estudo de implementação de um cluster utilizando apache hadoop. Giovanni Furlanetto Estudo de implementação de um cluster utilizando apache hadoop Giovanni Furlanetto 1470175 Sumário Introdução Metodologia de Pesquisa Revisão Bibliográfica Resultados Conclusão Referências Introdução Considerando

Leia mais

Processamento de INDUSTRIA 4.0. Big Data. Aula #10 - Processamento distribuído de dados FONTE: DELIRIUM CAFE EDUARDO CUNHA DE ALMEIDA

Processamento de INDUSTRIA 4.0. Big Data. Aula #10 - Processamento distribuído de dados FONTE: DELIRIUM CAFE EDUARDO CUNHA DE ALMEIDA INDUSTIA 4.0 Processamento de Big Data FONTE: DELIIU CAFE Aula #10 - Processamento distribuído de dados EDUADO CUNHA DE ALEIDA Agenda - Divisão do problema - apeduce - Hadoop - SQL-on-Hadoop: Hive 2 Divisão

Leia mais

BIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt

BIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt BIG DATA: UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com 70% 60% 50% 40% 30% 20%

Leia mais

Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop

Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Paulo Romero Martins Maciel prmm@cin.ufpe.br Dados,

Leia mais

Sergio Adriano Blum Data Scientists

Sergio Adriano Blum Data Scientists Big Data e Inovação Sergio Adriano Blum Data Scientists Instrutor Gerente de Projetos Consultor MBA Gestão Estratégia de Empresas pela Unisinos Bacharel em Administração de Empresas com Ênfase em Análise

Leia mais

Introdução Ferramentas Unix MapReduce Outras Ferramentas. Batch Processing. Fabiola Santore. Universidade Federal do Paraná

Introdução Ferramentas Unix MapReduce Outras Ferramentas. Batch Processing. Fabiola Santore. Universidade Federal do Paraná Fabiola Santore Universidade Federal do Paraná Sumário 1. Introdução 2. Ferramentas Unix 2.1 Análise de log 2.2 Filosofia Unix 3. MapReduce 3.1 Procedimento 3.2 Reduce: Joins e Agrupamento 3.3 Análise

Leia mais

Introdução a Big Data. Juciander L. Moreira Wallace Brito

Introdução a Big Data. Juciander L. Moreira Wallace Brito Introdução a Big Data Juciander L. Moreira Wallace Brito 1 Sumário 1. 2. 3. 4. 5. 6. Introdução Os 3 Vs de Big Data Definição de Big Data Mitos sobre Big Data Aplicações Iniciando um projeto de Big Data

Leia mais

EMPREENDEDORISMO COM SOFTWARE LIVRE E SOFTWARE ABERTO.

EMPREENDEDORISMO COM SOFTWARE LIVRE E SOFTWARE ABERTO. Marcio Junior Vieira marcio@ambientelivre.com.br EMPREENDEDORISMO COM SOFTWARE LIVRE E SOFTWARE ABERTO. Sobre o Palestrante A 10 anos trabalha nas áreas de análise, consultoria e desenvolvimento de sistemas.

Leia mais

Escalonamento Adaptativo para o Apache Hadoop

Escalonamento Adaptativo para o Apache Hadoop Escalonamento Adaptativo para o Apache Hadoop 1 Andrea Schwertner Charão 1 {cassales,andrea}@inf.ufsm.br 1 Departamento de Linguagens e Sistemas de Computação Centro de Tecnologia Universidade Federal

Leia mais

BD e Cloud Gerenciamento de. Dados na Nuvem

BD e Cloud Gerenciamento de. Dados na Nuvem CIn/UFPE In940 - Banco de Dados Gerenciamento de Dados na Nuvem Conceitos e Arquiteturas Chaina Santos Oliveira - cso2 Roteiro Motivação Computação em Nuvem Gerenciamento de dados na Nuvem Sistemas de

Leia mais

Apache Spark I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA

Apache Spark I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA Apache Spark CARLOS EDUARDO MART INS RELVAS I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA Apache Hadoop Mudou a forma de armazenamento e processamento de dados em um cluster de computadores, trazendo

Leia mais

MapReduce. Capítulo 2. Renato Gomes Borges Júnior

MapReduce. Capítulo 2. Renato Gomes Borges Júnior MapReduce Capítulo 2 Renato Gomes Borges Júnior Sumário Introdução Exemplo: um conjunto de dados climáticos Analisando os dados Map and Reduce Java MapReduce Fluxo de dados Executando MapReduce distribuído

Leia mais

Capítulo 7: SPARQL Processamento de consulta em nuvem

Capítulo 7: SPARQL Processamento de consulta em nuvem Capítulo 7: SPARQL Processamento de consulta em nuvem 01/11/2016 Acadêmico: Maicou Moor Cândido de Lima Professora: Carmem Satie Hara Introdução Neste capítulo concentra-se em recentes propostas de técnicas

Leia mais

Negócios em FLOSS 1ª etapa do Circuito Curitibano de Software Livre

Negócios em FLOSS 1ª etapa do Circuito Curitibano de Software Livre Negócios em FLOSS 1ª etapa do Circuito Curitibano de Software Livre Marcio Junior Vieira marcio@ambientelivre.com.br Realização Promoção Apoio Marcio Junior Vieira 15 anos de experiência em informática,

Leia mais

O que é preciso para ser Cientista de Dados?

O que é preciso para ser Cientista de Dados? O que é preciso para ser Cientista de Dados? Cássio Socal Cervo Administração de Empresas - PUCRS Ciências Contábeis - PUCRS MBA Gerenciamento de Projetos - FGV/Decision MBA Big Data e Analytics - FGVSP

Leia mais

UM ESTUDO EXPLORATÓRIO ACERCA DE COMO O DADO PODERÁ TRANSFORMAR A SAÚDE POR MEIO DA TECNOLOGIA DE BIG DATA

UM ESTUDO EXPLORATÓRIO ACERCA DE COMO O DADO PODERÁ TRANSFORMAR A SAÚDE POR MEIO DA TECNOLOGIA DE BIG DATA UM ESTUDO EXPLORATÓRIO ACERCA DE COMO O DADO PODERÁ TRANSFORMAR A SAÚDE POR MEIO DA TECNOLOGIA DE BIG DATA Gabriel Alan Madureiro GONÇALVES, Alex Sandro Romeo de Souza POLETTO alang.von@gmail.com, apoletto@femanet.com.br

Leia mais

Como criar seu ecossistema de dados com o Tableau no AWS

Como criar seu ecossistema de dados com o Tableau no AWS Como criar seu ecossistema de dados com o Tableau no AWS Migrando seu BI para a nuvem Seu BI funciona e, provavelmente, funciona muito bem. Porém, continuar capacitando seus colegas com os dados será um

Leia mais

SOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE

SOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE SOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE PRINCÍPIOS BÁSICOS EMC ISILON Use a primeira e única solução NAS scale-out do setor com suporte nativo ao Hadoop Reduza os custos e acelere os resultados

Leia mais

CASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO

CASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO Patrocínio, MG, outubro de 2016 ENCONTRO DE PESQUISA & EXTENSÃO, 3., 2016, Patrocínio. Anais... Patrocínio: IFTM, 2016. CASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO Moises Wesley de Souza

Leia mais

Apache. Conceitos teóricos e práticos, evolução e novas possibilidades

Apache. Conceitos teóricos e práticos, evolução e novas possibilidades Apache Conceitos teóricos e práticos, Prof. Dr. Alfredo Goldman Prof. MS. Ivanilton Polato By Alfredo Goldman, Fabio Kon, Francisco Pereira Junior, Ivanilton Polato e Rosângela de Fátima Pereira. These

Leia mais

GESTÃO DE DADOS NAS ORGANIZAÇÕES. Prof. Robson Almeida

GESTÃO DE DADOS NAS ORGANIZAÇÕES. Prof. Robson Almeida GESTÃO DE DADOS NAS ORGANIZAÇÕES Prof. Robson Almeida INFRA-ESTRUTURA DE SISTEMAS DE INFORMAÇÃO 3 CONCEITOS Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único

Leia mais

Técnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência

Técnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência 12º CONTECSI Conferência Internacional sobre Sistemas de Informação e Gestão de Tecnologia Técnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência Alcides Carlos de Araújo

Leia mais

Organize grande quantidade de dados de forma rápida e com precisão analítica, para melhor tomada de decisões.

Organize grande quantidade de dados de forma rápida e com precisão analítica, para melhor tomada de decisões. Organize grande quantidade de dados de forma rápida e com precisão analítica, para melhor tomada de decisões. O Pentaho BI é uma solução para Inteligência de negócios do inglês Business Intelligente, é

Leia mais

APLICAÇÕES DE BIG DATA COM SPARK E PYTHON

APLICAÇÕES DE BIG DATA COM SPARK E PYTHON CURTA DURAÇÃO APLICAÇÕES DE BIG DATA COM SPARK E PYTHON CARGA HORÁRIA: 48 horas DURAÇÃO: 3 meses COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Dr.ª Alessandra de Ávila Montini APRESENTAÇÃO O crescente

Leia mais

Popularidade das Linguagens

Popularidade das Linguagens Popularidade das Linguagens Utilização em projetos de desenvolvimento de software fonte: TIOBE index http://www.tiobe.com 300 million lines of software Code, world-wide, real-time, each day Dados de Fevereiro/2016

Leia mais

Administração de Serviços de Redes. Introdução a Clusters. Prof. Dayvidson Bezerra Contato:

Administração de Serviços de Redes. Introdução a Clusters. Prof. Dayvidson Bezerra Contato: Administração de Serviços de Redes Introdução a Clusters Prof. Dayvidson Bezerra Contato: dayvidsonbezerra@gmail.com Definição Cluster é um termo amplamente utilizado, significa computadores independentes

Leia mais

Estratégias de Integração com Cloud

Estratégias de Integração com Cloud Estratégias de Integração com Cloud Bruno Squassoni, Engenheiro de Sistemas 28 de maio, 2019 Copyright 2019 OSIsoft, LLC Copyright 2019 OSIsoft, LLC 1 Operações Conhecimento em engenharia Funcionamento

Leia mais

Armazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil

Armazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil 1 Armazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil Acadêmico: Matheus Magnusson Bolo Disciplina: Segurança Computacional 2 Contexto WGID IV Workshop de Gestão de

Leia mais

Sistemas de Apoio a Decisão

Sistemas de Apoio a Decisão Sistemas de Apoio a Decisão (Inteligência nos Negócios - Business Inteligente) Sistemas de Informação/Ciências da Computação Aran Bey Tcholakian Morales, Dr. Eng. (Unidade 1) 1. Inteligência nos Negócios

Leia mais

COMPUTAÇÃO PARALELA E DISTRIBUÍDA

COMPUTAÇÃO PARALELA E DISTRIBUÍDA COMPUTAÇÃO PARALELA E DISTRIBUÍDA Aluno: Alessandro Faletti Orientadora: Noemi Rodriguez Introdução O objetivo inicial no projeto era aplicar a possibilidade de processamento em paralelo no sistema CSBase

Leia mais

Um Repositório Chave-Valor com Garantia de Localidade de Dados. Patrick A. Bungama Wendel M. de Oliveira Flávio R. C. Sousa Carmem S.

Um Repositório Chave-Valor com Garantia de Localidade de Dados. Patrick A. Bungama Wendel M. de Oliveira Flávio R. C. Sousa Carmem S. Um Repositório Chave-Valor com Garantia de Localidade de Dados Patrick A. Bungama Wendel M. de Oliveira Flávio R. C. Sousa Carmem S. Hara Agenda Motivação Desafios ALOCS Princípios de funcionamento Experimentos

Leia mais

Framework para Deduplicação de Dados com Apache Spark

Framework para Deduplicação de Dados com Apache Spark Framework para Deduplicação de Dados com Apache Spark César Magrin - magrin@inf.ufpr.br Disciplina: Metodologia Científica - CI860 Professor: Alexandre Direne Sumário 1. Qualidade de Dados 2. Deduplicação

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Introdução Laboratório de Computação para Ciências Módulo II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Mestrado Profissional

Leia mais

Introdução à Informática

Introdução à Informática Introdução à Informática Aula 10 http://www.ic.uff.br/~bianca/introinfo/ Aula 10-05/10/2007 1 Ementa Conceitos Básicos de Computação (Hardware, Software e Internet) Softwares Aplicativos Tutorial: Word

Leia mais

HadoopDB. Edson Ie Serviço Federal de Processamento de Dados - SERPRO

HadoopDB. Edson Ie Serviço Federal de Processamento de Dados - SERPRO HadoopDB Edson Ie Serviço Federal de Processamento de Dados - SERPRO Motivação Grandes massas de dados precisam ser processadas em clusters: 1 nó: 100TB@59MB/s = 23 dias Cluster com 1000 nós 33 min!!!

Leia mais

Infraestrutura computacional para suporte de aplicações de big data na área da Saúde

Infraestrutura computacional para suporte de aplicações de big data na área da Saúde Infraestrutura computacional para suporte de aplicações de big data na área da Saúde Maurício Barreto Davide Rasella Marcos Barreto Centro Interdisciplinar em Ciências e Tecnologia da Informação Infraestrutura

Leia mais

Pentaho Community Edition

Pentaho Community Edition Pentaho Community Edition UmaIntroduçãoaBusinessIntelligence eaopentahobiopensource RafaelaRaganham rafaela@ambientelivre.com.br MarcioJuniorVieira marcio@ambientelivre.com.br Sobre o Palestrante Marcio

Leia mais

Big Data para Executivos e Profissionais de Mercado

Big Data para Executivos e Profissionais de Mercado LEIA E ENTENDA SOBRE BIG DATA, AS TECNOLOGIAS UTILIZADAS, AS APLICAÇÕES DE MERCADO, E AS CARREIRAS PROFISSIONAIS. Big Data para Executivos e Profissionais de Mercado Every company has Big Data in its future

Leia mais

Como analisar um Big Data com a Tecnologia Hadoop: Aplicação no Mercado Financeiro

Como analisar um Big Data com a Tecnologia Hadoop: Aplicação no Mercado Financeiro Como analisar um Big Data com a Tecnologia Hadoop: Aplicação no Mercado Financeiro Sabrina Bojikian Rissi 1 Luís Alexandre da Silva 1 1 Centro Paula Souza - Faculdade de Tecnologia de Bauru (FATEC) Rua

Leia mais

CATEGORIA: CONCLUÍDO ÁREA: ENGENHARIAS E ARQUITETURA SUBÁREA: ENGENHARIAS INSTITUIÇÃO: FACULDADE DE ENGENHARIA DE SOROCABA AUTOR(ES): TAN KIN TAT

CATEGORIA: CONCLUÍDO ÁREA: ENGENHARIAS E ARQUITETURA SUBÁREA: ENGENHARIAS INSTITUIÇÃO: FACULDADE DE ENGENHARIA DE SOROCABA AUTOR(ES): TAN KIN TAT TÍTULO: UM SISTEMA DE BIG DATA BASEADO EM APRENDIZAGEM DE MÁQUINA PARA DETERMINAÇÃO DE PERFIS DE ALUNOS PARA APLICAR DE FORMA DIRECIONADA PLANOS DE ESTUDOS DEDICADOS CATEGORIA: CONCLUÍDO ÁREA: ENGENHARIAS

Leia mais

Informática Parte 5 Prof. Márcio Hunecke

Informática Parte 5 Prof. Márcio Hunecke Escriturário Informática Parte 5 Prof. Márcio Hunecke Informática BANCO DE DADOS NOSQL (CONCEITOS BÁSICOS, BANCOS ORIENTADOS A GRAFOS, COLUNAS, CHAVE/VALOR E DOCUMENTOS) NoSQL (originalmente se referindo

Leia mais

UNIVERSIDADE DO SUL DE SANTA CATARINA GABRIEL BENJAMIM DA SILVA

UNIVERSIDADE DO SUL DE SANTA CATARINA GABRIEL BENJAMIM DA SILVA UNIVERSIDADE DO SUL DE SANTA CATARINA GABRIEL BENJAMIM DA SILVA COMPARATIVO ENTRE DIFERENTES SOLUÇÕES DE PROCESSAMENTO DE DADOS PARA BIG DATA Florianópolis 2017 GABRIEL BENJAMIM DA SILVA COMPARATIVO ENTRE

Leia mais

ESPECIALIZAÇÃO A DISTÂNCIA EM. Ciência de Dados e Big Data Aplicada à Administração Tributária. Área de conhecimento: Tecnologia da Informação

ESPECIALIZAÇÃO A DISTÂNCIA EM. Ciência de Dados e Big Data Aplicada à Administração Tributária. Área de conhecimento: Tecnologia da Informação ESPECIALIZAÇÃO A DISTÂNCIA EM Ciência de Dados e Big Data Aplicada à Administração Tributária Área de conhecimento: Tecnologia da Informação PUC MINAS VIRTUAL CORPO DOCENTE Raphael Rodrigues Campos (Mestre)

Leia mais

Introdução a Computação em Nuvem

Introdução a Computação em Nuvem Introdução a Computação em Nuvem Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia

Leia mais

Ementa. Workshop de Internet das Coisas: do Conceito à Realidade

Ementa. Workshop de Internet das Coisas: do Conceito à Realidade Ementa Workshop de Internet das Coisas: do Conceito à Realidade Descritivo O Workshop de IoT do Conceito à realidade foi concebido em 2016 e desde então vem tendo seu conteúdo atualizado e renovado, focando

Leia mais

Introdução a Computação em Nuvem

Introdução a Computação em Nuvem Introdução a Computação em Nuvem Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia

Leia mais

Hadoop - HDFS. Universidade Federal de Goiás Ciência da Computação

Hadoop - HDFS. Universidade Federal de Goiás Ciência da Computação Hadoop - HDFS Universidade Federal de Goiás Ciência da Computação O que é Hadoop? Um framework para lidar com aplicações distribuídas que fazem uso massivo de dados Originalmente construído para a distribuição

Leia mais

Agilidade nas empresas com a unificação dos dados A jornada para plataformas de dados transacionais analíticos

Agilidade nas empresas com a unificação dos dados A jornada para plataformas de dados transacionais analíticos Agilidade nas empresas com a unificação dos dados Um InfoBrief do IDC patrocinado pela SAP Agosto de 2015 O uso dos dados na atualidade Os dados transacionais dão origem a dados analíticos e separados.

Leia mais

SGBDs NoSQL Modelos e Sistemas de Colunas e Grafos. Aluno: Jorge Dias Disciplina: IN940

SGBDs NoSQL Modelos e Sistemas de Colunas e Grafos. Aluno: Jorge Dias Disciplina: IN940 SGBDs NoSQL Modelos e Sistemas de Colunas e Grafos Aluno: Jorge Dias Disciplina: IN940 Roteiro o Introdução o Motivação o NoSQL (Características) o Comparativo de SGBDs NoSQL x SGBDs Relacionais o Tipos

Leia mais

Treinamento em Apache Spark com Scala - Fundamental

Treinamento em Apache Spark com Scala - Fundamental Treinamento em Apache Spark com Scala - Fundamental O treinamento fundamental em Apache Spark prepara profissionais para o mercado de trabalho com Spark e Programação em Scala. Seu conteúdo programático

Leia mais

Apache Hadoop É hoje que vai instalar o seu primeiro cluster?

Apache Hadoop É hoje que vai instalar o seu primeiro cluster? Apache Hadoop É hoje que vai instalar o seu primeiro cluster? Date : 16 de Março de 2016 Como processar grandes quantidades de dados de forma rápida e a baixo custo? A resposta é Hadoop! Esta framework

Leia mais

Desenvolvimento de Software no Contexto Big Data

Desenvolvimento de Software no Contexto Big Data Universidade de Brasília - UnB Faculdade UnB Gama - FGA Engenharia de Software Desenvolvimento de Software no Contexto Big Data Autor: Guilherme de Lima Bernardes Orientador: Prof. Dr. Fernando William

Leia mais

software as a service (saas) e service-oriented architecture (soa)

software as a service (saas) e service-oriented architecture (soa) software as a service (saas) e service-oriented architecture (soa) engenharia de sistemas de informação Daniel Cordeiro 18 de agosto de 2017 Escola de Artes, Ciências e Humanidades EACH USP o que eles

Leia mais

Principais Motivos para Usar o MySQL

Principais Motivos para Usar o MySQL Principais Motivos para Usar o MySQL O Banco de Dados de Código Aberto mais Popular do Mundo MySQL é o "M" na pilha comprovada LAMP de código aberto (Linux, Apache, MySQL PHP/Perl/Python) usada pelos sites

Leia mais

Algoritmos de Junção Estrela em MapReduce

Algoritmos de Junção Estrela em MapReduce Algoritmos de Junção Estrela em MapReduce Jaqueline Joice Brito 09 de junho de 2015 1 Modelo Relacional Dados armazenados em um conjunto de tabelas Amplamente utilizado Junção Recuperação de dados de duas

Leia mais

Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000. Uma Nota Técnica da Dell

Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000. Uma Nota Técnica da Dell Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000 Uma Nota Técnica da Dell Esta nota técnica serve apenas para fins informativos e pode conter erros de digitação e erros técnicos.

Leia mais

BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP.

BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP. BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP Informações Central de Relacionamento: (11) 5081-8200 (opção 1) Segunda

Leia mais

UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA

UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA 1 UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA JUAN CASSIUS CARNEIRO PEREIRA PEDRO M. NETO GOOGLE CLOUD PONTA GROSSA 2017 2 JUAN CASSIUS

Leia mais

São Paulo. August,

São Paulo. August, São Paulo August, 28 2018 O futuro do armazenamento dos dados não estruturados Com o Dell EMC Isilon e o ECS Allan Gomes Souza Sr. Systems Engineer, Dell EMC A transformação digital está revolucionando

Leia mais

BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP.

BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP. BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP Informações Central de Relacionamento: (11) 5081-8200 (opção 1) Segunda

Leia mais

GSI030 ENGENHARIA DE SOFTWARE

GSI030 ENGENHARIA DE SOFTWARE UFU Universidade Federal de Uberlândia FACOM Faculdade de Computação GSI030 ENGENHARIA DE SOFTWARE Aula 01 Apresentação da Disciplina 09-08-2016 Prof. William Chaves de Souza Carvalho 09-08-2016 2 Professor

Leia mais

Apresentação do C3SL para o COUN

Apresentação do C3SL para o COUN Apresentação do C3SL para o COUN Marcos Castilho novembro 2018 Apresentação Grupo de pesquisa do Departamento de Informática da UFPR criado em 2002 Centro de desenvolvimento de soluções computacionais

Leia mais

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos

Introdução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos Conceitos Básicos Introdução Tópicos Especiais Modelagem de Dados Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Mestrado Profissional

Leia mais

Sistemas de Computação e de Informação

Sistemas de Computação e de Informação Sistemas de Computação e de Informação SLIDE 4 Professor Júlio Cesar da Silva juliocesar@eloquium.com.br site: http://eloquium.com.br/ twitter: @profjuliocsilva Qual é a historia dos sistemas e computadores?

Leia mais

Desenvolvimento de Software no Contexto Big Data

Desenvolvimento de Software no Contexto Big Data Universidade de Brasília - UnB Faculdade UnB Gama - FGA Engenharia de Software Desenvolvimento de Software no Contexto Big Data Autor: Guilherme de Lima Bernardes Orientador: Prof. Dr. Fernando William

Leia mais

Inovações Tecnológicas

Inovações Tecnológicas Inovações Tecnológicas Start-ups Computação em Nuvem Algoritmo Tecnologia Disruptiva Big Data Inteligência Artificial Internet das Coisas Blockchain, Criptomoedas e Bitcoin Start-ups Empreendimento em

Leia mais

Sobre a execução de workflows científicos sobre diferentes estrategias de dados de entrada - Uma Avaliação Experimental

Sobre a execução de workflows científicos sobre diferentes estrategias de dados de entrada - Uma Avaliação Experimental Sobre a execução de workflows científicos sobre diferentes estrategias de dados de entrada - Uma Avaliação Experimental Douglas Oliveira Cristina Boeres Fábio Laboratório Nacional de Computação Científica

Leia mais

Tecnologias da Informação TI /2 Material de apoio ler bibliografia recomendada (Stair)

Tecnologias da Informação TI /2 Material de apoio ler bibliografia recomendada (Stair) Objetivos: Hardware, Software e Sistemas de gerenciamento de Banco de dados. Capítulos 3, 4 e 5 Stair. Hardware (HW) Qualquer maquinário que assiste nas atividades de: Entrada Processamento de um Sistema

Leia mais

NÍVEL SUPERIOR NÍVEL SUPERIOR

NÍVEL SUPERIOR NÍVEL SUPERIOR CIA. DE PROCESSAMENTO DE DADOS DO ESTADO DA BAHIA - PRODEB ESTADO DA BAHIA A N E X O I - D O S R E Q U I S I T O S E C O M P E T Ê N C I A S D O S E M P R E G O S E D I T A L D E P R O C E S S O S E L

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro Prof. Daniela Barreiro Claro São dados que não podem ser processados ou analisados usando as ferramentas tradicionais Empresas acessando muitas informações mas não sabem como tirar proveito Normalmente

Leia mais

SISTEMAS OPERACIONAIS

SISTEMAS OPERACIONAIS SISTEMAS OPERACIONAIS Introdução a Sistemas Operacionais Andreza Leite andreza.leite@univasf.edu.br Plano de Aula Introdução aos Sistemas Operacionais Fundamentação Teórica Evolução Histórica Características

Leia mais

Apache Hadoop. Conceitos teóricos e práticos, evolução e novas possibilidades. Daniel Cordeiro

Apache Hadoop. Conceitos teóricos e práticos, evolução e novas possibilidades. Daniel Cordeiro Apache Hadoop Conceitos teóricos e práticos, evolução e novas possibilidades Daniel Cordeiro Departamento de Ciência da Computação Instituto de Matemática e Estatística Universidade de São Paulo Baseado

Leia mais