Big Data Open Source com Hadoop
|
|
- Joana Angelim Sousa
- 7 Há anos
- Visualizações:
Transcrição
1 Big Data Open Source com Hadoop Palestrante: Marcio Junior Vieira Realização:
2 Marcio Junior Vieira 14 anos de experiência em informática, vivência em desenvolvimento e análise de sistemas de Gestão empresarial. Trabalhando com Software Livre desde 2000 com serviços de consultoria e treinamento. Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR. Palestrante em diversos Congressos relacionados a Software Livre tais como: CONISLI, SOLISC, FISL, LATINOWARE, SFD, JDBR, Campus Party, Pentaho Day. Fundador da Ambiente Livre.
3 Ecosistema Ambiente Livre
4 Colaborações
5 Big Data - Muito se fala...
6
7 Big Data É um novo conceito se consolidando. Grande armazenamento de dados e maior velocidade
8 Os 4 V's Velocidade, Volume, Variedade e Valor
9 Volume Modelos de Persistência da ordem de Petabytes, zetabytes ou yottabyte(yb). Geralmente dados não estruturados. Um Zettabyte corresponde a (10²¹) ou (2 elevado a 70) Bytes.
10 Velocidade Processamento de Dados Armazenamento Analise de Dados
11 Variedade Dados semi-estruturados Dados não estruturados Diferentes fontes Diferentes formatos
12 Valor Tomada de Decisão Benefícios Objetivo do Negócio.
13 O momento é agora
14 Onde podemos utilizar Big Data??
15 Sistema de Recomendação WWW em geral
16 Redes Sociais
17 Analise de Risco Crédito Seguros Mercado Financeiro
18 Dados Espaciais Clima Imagens Trafego Monitoramento
19 Big Data X BI Big Data e uma evolução do BI, devem caminhar juntos Data Warehouses são necessários para armazenar dados estruturados Previsão: BI Casos específicos Big Data Analise geral
20 Profissionais Novo profissional: Cientista de Dados
21 Competências do Cientista de dados Fonte
22 De onde?
23 Ferramentas de Big Data
24 Hadoop O Apache Hadoop é um projeto de software open-source escrito em Java. Escalável, confiável e com processamento distribuído. Filesystem Distribuido. Inspirado Originalmente pelo GFS e MapReduce da Google ( Modelo de programação MapReduce) Utiliza-se de Hardware Comum ( Commodity cluster computing ) Framework para computação distribuída infraestrutura confiável capaz de lidar com falhas ( hardware, software, rede )
25 Motivações Atuais Grande quantidade ( massiva ) de dados Dados não cabem em uma máquina Demoram muito para processar de forma serial Máquinas individuais falham Computação nas nuvens Escalabilidade de aplicações Computação sob demanda
26 A origem do Nome Segundo Doug Cutting, criador do Hadoop O nome que meu filho deu a um elefante amarelo de pelúcia. Curto, relativamente fácil de soletrar e pronunciar, sem sentido, e não usado em outro lugar: esses são os meus critérios de nomeação
27 Ecosistema
28 O que é HDFS Hadoop Filesystem Um sistema de arquivos distribuído que funciona em grandes aglomerados de máquinas de commodities.
29 Características do HDFS Inspirado em GFS Projetado para trabalhar com arquivos muito grandes e grandes volumes Executado em hardware comum Streaming de acesso a dados Replicação e localidade
30 HDFS Projetado para escalar a petabytes de armazenamento, e correr em cima dos sistemas de arquivos do sistema operacional subjacente.
31 Fonte:
32 HDFS - Replicação Dados de entrada é copiado para HDFS é dividido em blocos e cada blocos de dados é replicado para várias máquinas
33 MapReduce É um modelo de programação desenhado para processar grandes volumes de dados em paralelo, dividindo o trabalho em um conjunto de tarefas independentes
34 Programação Distribuída
35 MapReduce Você especifica o map (...) e reduce (...) funções map = (lista (k, v) -> lista (k, v)) reduce = (k, lista (v) -> k, v) O Framework faz o resto Dividir os dados Execute vários mappers sobre as divisões Embaralhar os dados para os redutores Execute vários redutores Guarde os resultados finais
36 MapReduce Map Reduce
37 Modos de Operação Standalone ( Local ) Pseudo-distributed Fully-distributed
38 Outros componentes PIG - linguagem de fluxo de dados e ambiente de execução para explorar grandes conjuntos de dados.executado no HDFS e grupos MapReduce. Hive - Armazém de dados (datawarehouse) distribuídos. Gerencia os dados armazenados no HDFS e fornece uma linguagem de consulta baseada em SQL para consultar os dados. Hbase Banco de dados orientada por colunas distribuída. HBase usa o HDFS por sua subjacente de armazenamento e suporta os cálculos de estilo lote usando MapReduce e ponto consultas (leituras aleatórias).
39 Outros componentes ZooKeeper Serviço de coordenação altamente disponível e distribuído. Fornece funções de bloqueios distribuídos que podem ser usados para a construção de aplicações distribuídas. Sqoop Ferramenta para a movimentação eficiente de dados entre bancos de dados relacionais e HDFS. Mahout - Aprendizagem de máquina escalável, de fácil uso comercial para a construção de aplicativos inteligentes
40 Distribuições Hadoop Open Source Apache Comercial Open Source - Cloudera - HortoWorks - MapR - AWS MapReduce - Microsoft HDInsight (beta)
41 Possibilidades de Uso DataWareHouse Business Intelligence Aplicações analíticas Mídias Sociais Sugestão de Compras Analise preditiva Compras Coletivas Recomendações
42 Modelo tradicional de Uso
43 Empresa Usando Hadoop Amazon Joost Facebook Last.fm Google New York Times IBM PowerSet Yahoo Veoh Linkedin Twitter Ebay
44 Hadoop no Brasil
45 Contatos Blog blogs.ambientelivre.com.br/marcio Facebook/ambientelivre
46 Convite Pentaho Day 17 de Maio SP FTSL - 18 e 19 de Setembro Software Freedom Day 20 de Setembro.
Elaborando uma plataforma de Big Data & Analytics 100% Open Source com apoio do Pentaho.
Open Source Data Science Elaborando uma plataforma de Big Data & Analytics 100% Open Source com apoio do Pentaho. Palestrante: Marcio Junior Vieira CEO e Data Scientist na Ambiente Livre marcio@ambientelivre.com.br
Leia maisPostgreSQL em um Ambiente Híbrido de Big Data Analytics. Palestrante: Marcio Junior Vieira marcio@ambientelivre.com.br
PostgreSQL em um Ambiente Híbrido de Big Data Analytics Palestrante: Marcio Junior Vieira marcio@ambientelivre.com.br Marcio Junior Vieira Trabalhando com Software Livre desde 2000 com serviços de consultoria
Leia maisBruno Antunes da Silva UFSCar - Sorocaba
Bruno Antunes da Silva UFSCar - Sorocaba Introdução HDFS Arquitetura Leitura e escrita Distribuição de nós Controle de réplicas Balancer MapReduce Conclusão Aplicações web com grandes quantidades de dados
Leia maisInformática Parte 10 Prof. Márcio Hunecke
Escriturário Informática Parte 10 Prof. Márcio Hunecke Informática CONCEITOS DE MAPREDUCE E HDFS/HADOOP/YARN 2.7.4 Big Data O termo Big Data refere-se a um grande conjunto de dados armazenados e baseia-se
Leia maisAVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP
AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Dr. Paulo Romero Martins Maciel INTRODUÇÃO Nem sempre os dados
Leia maisInformática Parte 11 Prof. Márcio Hunecke
Escriturário Informática Parte 11 Prof. Márcio Hunecke Informática FERRAMENTAS DE INGESTÃO DE DADOS (SQOOP 1.4.6, FLUME 1.7.0, NIFI 1.3.0 E KAFKA 0.11.0) Visão geral sobre os quatro componentes Fazem
Leia maisPÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan
PÓS-GRADUAÇÃO LATO SENSU Curso: Banco de Dados Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan Unidade 1.3 2016 Big Data Big Data - Contexto Globalização Modelo
Leia maisPrIntCloud. Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13
PrIntCloud Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13 Roteiro 1. Fundamentação Teórica A.- Cloud Computing B.- Hadoop C.- MapReduce D.- NoSql 2. Proposta
Leia maisPentaho IoT Analytics Open Source Trilha IoT
Pentaho IoT Analytics Open Source Trilha IoT Marcio Junior Vieira CEO & Data Scientist, Ambiente Livre Marcio Junior Vieira Mini-cv 18 anos de experiência em informática, vivência em desenvolvimento e
Leia maisBUSINESS INTELLIGENCE E DATA WAREHOUSE. Big Data Conceitos, Técnicas, Ferramentas e Arquitetura. tutorpro.com.br cetax.com.br
BUSINESS INTELLIGENCE E DATA WAREHOUSE Big Data Conceitos, Técnicas, Ferramentas e Arquitetura tutorpro.com.br cetax.com.br Quem somos 2 3 Objetivos do Curso de Big Data 4 Alinhamento das expectativas
Leia maisBIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES?
1 BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES? Deyvirson Mendonça SUMÁRIO Definição Os Vs do Big Data Desafios Hadoop BD e Big Data PARA COMEÇAR O QUE SÃO DADOS? Informações diversas, que podem ser organizadas
Leia maisPÓS-GRADUAÇÃO ANÁLISE DE BIG DATA
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e
Leia maisBenjamin Bengfort Jenny Kim
Benjamin Bengfort Jenny Kim Novatec Authorized Portuguese translation of the English edition of Data Analytics with Hadoop, ISBN 9781491913703 2016 Benjamin Bengfort, Jenny Kim. This translation is published
Leia maisMBA ANALYTICS EM BIG DATA
MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação
Leia maisBig Data. O que é Big Data! Como surgiu isso! Para que serve?!
Big Data O que é Big Data! Como surgiu isso! Para que serve?! Da teoria a prática:! 1! Dá mesmo para! fazer algo prático! com o! Big Data?! Como tudo! começou?!! Qual o! Problema?! PERCEBEU:! Informações
Leia maisBIG DATA. Jorge Rady de Almeida Jr. Escola Politécnica da U SP
BIG DATA Jorge Rady de Almeida Jr. jorgerady@usp.br Escola Politécnica da U SP BIG DATA - MOTIVAÇÃO Aumento da geração e armazenamento digital de dados Aumento da capacidade de processamento em geral:
Leia maisQUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ;
QUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ; LEIA O MATERIAL ANTES DE FAZER O EXEMPLO DIDÁTICO. AS QUESTÕES ABAIXO PODEM SER RESPONDIDAS, USANDO, PREFERENCIALMENTE, SUA PRÓPRIAS
Leia maisSolisc 2010 Uma Introdução ao Pentaho BI Open Source
Solisc 2010 Uma Introdução ao Pentaho BI Open Source Marcio Junior Vieira marcio @ ambientelivre.com.br Sobre o Palestrante A 10 anos trabalha nas áreas de análise, consultoria e desenvolvimento de sistemas.
Leia maisA NOVA EXPERIÊNCIA ANALÍTICA
A NOVA EXPERIÊNCIA ANALÍTICA USANDO MELHOR O HADOOP COMO PEÇA DO QUEBRA-CABEÇA DO BIG DATA Rafael Aielo Gerente de Soluções AGENDA Era Big Data Hadoop O que é e como funciona SAS e Hadoop ERA BIG DATA
Leia maisCommunity Builder Construção de Redes Sociais em Joomla. Marcio Junior Vieira marcio @ ambientelivre.com.br
Community Builder Construção de Redes Sociais em Joomla Marcio Junior Vieira marcio @ ambientelivre.com.br Sobre o Palestrante A 10 anos trabalha nas áreas de análise, consultoria e desenvolvimento de
Leia maisCOMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações
COMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações Jaqueline Joice Brito Slides em colaboração com Lucas de Carvalho Scabora Sumário Computação em Nuvem Definição
Leia maisCURTA DURAÇÃO ANÁLISE DE BIG DATA. CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini
CURTA DURAÇÃO ANÁLISE DE BIG DATA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini OBJETIVO O volume crescente de informação disponível nas
Leia maisSolisc 2010 Gerenciamento de Projetos com dotproject
Solisc 2010 Gerenciamento de Projetos com dotproject Marcio Junior Vieira marcio em ambientelivre.com.br Sobre o Palestrante A 10 anos trabalha nas áreas de análise, consultoria e desenvolvimento de sistemas.
Leia maisUNIVERSIDADE PRESBITERIANA MACKENZIE
1. Identificação do Curso a. Curso de Especialização em: Ciência de Dados (BIG DATA ANALYTICS) b. Área: Computação c. Área temática (tema): BIG DATA d. Linha de Pesquisa: Computação e Sistemas de Informação
Leia maisGovernança e Big Data. Celso Poderoso
Governança e Big Data Celso Poderoso cpoderoso@microstrategy.com Celso Poderoso Formação Acadêmica: Economista Especialista em Sistemas de Informação Mestre em Tecnologia (Grid Computing/Cloud Computing)
Leia maisBig Data. A Nova Onda
Big Data A Nova Onda Ricardo Rezende 18 anos em TI; 12 anos como DBA Oracle; Infrastructure Principal @ Accenture Enkitec Group; Oracle Certified Professional; IBM Certified Database Associate; Mestrando
Leia maisEstudo de implementação de um cluster utilizando apache hadoop. Giovanni Furlanetto
Estudo de implementação de um cluster utilizando apache hadoop Giovanni Furlanetto 1470175 Sumário Introdução Metodologia de Pesquisa Revisão Bibliográfica Resultados Conclusão Referências Introdução Considerando
Leia maisProcessamento de INDUSTRIA 4.0. Big Data. Aula #10 - Processamento distribuído de dados FONTE: DELIRIUM CAFE EDUARDO CUNHA DE ALMEIDA
INDUSTIA 4.0 Processamento de Big Data FONTE: DELIIU CAFE Aula #10 - Processamento distribuído de dados EDUADO CUNHA DE ALEIDA Agenda - Divisão do problema - apeduce - Hadoop - SQL-on-Hadoop: Hive 2 Divisão
Leia maisBIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt
BIG DATA: UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com 70% 60% 50% 40% 30% 20%
Leia maisAvaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop
Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Paulo Romero Martins Maciel prmm@cin.ufpe.br Dados,
Leia maisSergio Adriano Blum Data Scientists
Big Data e Inovação Sergio Adriano Blum Data Scientists Instrutor Gerente de Projetos Consultor MBA Gestão Estratégia de Empresas pela Unisinos Bacharel em Administração de Empresas com Ênfase em Análise
Leia maisIntrodução Ferramentas Unix MapReduce Outras Ferramentas. Batch Processing. Fabiola Santore. Universidade Federal do Paraná
Fabiola Santore Universidade Federal do Paraná Sumário 1. Introdução 2. Ferramentas Unix 2.1 Análise de log 2.2 Filosofia Unix 3. MapReduce 3.1 Procedimento 3.2 Reduce: Joins e Agrupamento 3.3 Análise
Leia maisIntrodução a Big Data. Juciander L. Moreira Wallace Brito
Introdução a Big Data Juciander L. Moreira Wallace Brito 1 Sumário 1. 2. 3. 4. 5. 6. Introdução Os 3 Vs de Big Data Definição de Big Data Mitos sobre Big Data Aplicações Iniciando um projeto de Big Data
Leia maisEMPREENDEDORISMO COM SOFTWARE LIVRE E SOFTWARE ABERTO.
Marcio Junior Vieira marcio@ambientelivre.com.br EMPREENDEDORISMO COM SOFTWARE LIVRE E SOFTWARE ABERTO. Sobre o Palestrante A 10 anos trabalha nas áreas de análise, consultoria e desenvolvimento de sistemas.
Leia maisEscalonamento Adaptativo para o Apache Hadoop
Escalonamento Adaptativo para o Apache Hadoop 1 Andrea Schwertner Charão 1 {cassales,andrea}@inf.ufsm.br 1 Departamento de Linguagens e Sistemas de Computação Centro de Tecnologia Universidade Federal
Leia maisBD e Cloud Gerenciamento de. Dados na Nuvem
CIn/UFPE In940 - Banco de Dados Gerenciamento de Dados na Nuvem Conceitos e Arquiteturas Chaina Santos Oliveira - cso2 Roteiro Motivação Computação em Nuvem Gerenciamento de dados na Nuvem Sistemas de
Leia maisApache Spark I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA
Apache Spark CARLOS EDUARDO MART INS RELVAS I NTRODUÇÃO À C OMPUTAÇÃO PARALELA E D ISTRIBUÍDA Apache Hadoop Mudou a forma de armazenamento e processamento de dados em um cluster de computadores, trazendo
Leia maisMapReduce. Capítulo 2. Renato Gomes Borges Júnior
MapReduce Capítulo 2 Renato Gomes Borges Júnior Sumário Introdução Exemplo: um conjunto de dados climáticos Analisando os dados Map and Reduce Java MapReduce Fluxo de dados Executando MapReduce distribuído
Leia maisCapítulo 7: SPARQL Processamento de consulta em nuvem
Capítulo 7: SPARQL Processamento de consulta em nuvem 01/11/2016 Acadêmico: Maicou Moor Cândido de Lima Professora: Carmem Satie Hara Introdução Neste capítulo concentra-se em recentes propostas de técnicas
Leia maisNegócios em FLOSS 1ª etapa do Circuito Curitibano de Software Livre
Negócios em FLOSS 1ª etapa do Circuito Curitibano de Software Livre Marcio Junior Vieira marcio@ambientelivre.com.br Realização Promoção Apoio Marcio Junior Vieira 15 anos de experiência em informática,
Leia maisO que é preciso para ser Cientista de Dados?
O que é preciso para ser Cientista de Dados? Cássio Socal Cervo Administração de Empresas - PUCRS Ciências Contábeis - PUCRS MBA Gerenciamento de Projetos - FGV/Decision MBA Big Data e Analytics - FGVSP
Leia maisUM ESTUDO EXPLORATÓRIO ACERCA DE COMO O DADO PODERÁ TRANSFORMAR A SAÚDE POR MEIO DA TECNOLOGIA DE BIG DATA
UM ESTUDO EXPLORATÓRIO ACERCA DE COMO O DADO PODERÁ TRANSFORMAR A SAÚDE POR MEIO DA TECNOLOGIA DE BIG DATA Gabriel Alan Madureiro GONÇALVES, Alex Sandro Romeo de Souza POLETTO alang.von@gmail.com, apoletto@femanet.com.br
Leia maisComo criar seu ecossistema de dados com o Tableau no AWS
Como criar seu ecossistema de dados com o Tableau no AWS Migrando seu BI para a nuvem Seu BI funciona e, provavelmente, funciona muito bem. Porém, continuar capacitando seus colegas com os dados será um
Leia maisSOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE
SOLUÇÃO HADOOP COM EMC ISILON E CLOUDERA ENTERPRISE PRINCÍPIOS BÁSICOS EMC ISILON Use a primeira e única solução NAS scale-out do setor com suporte nativo ao Hadoop Reduza os custos e acelere os resultados
Leia maisCASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO
Patrocínio, MG, outubro de 2016 ENCONTRO DE PESQUISA & EXTENSÃO, 3., 2016, Patrocínio. Anais... Patrocínio: IFTM, 2016. CASSANDRA: BANCO DE DADOS NÃO RELACIONAL DE ALTO DESEMPENHO Moises Wesley de Souza
Leia maisApache. Conceitos teóricos e práticos, evolução e novas possibilidades
Apache Conceitos teóricos e práticos, Prof. Dr. Alfredo Goldman Prof. MS. Ivanilton Polato By Alfredo Goldman, Fabio Kon, Francisco Pereira Junior, Ivanilton Polato e Rosângela de Fátima Pereira. These
Leia maisGESTÃO DE DADOS NAS ORGANIZAÇÕES. Prof. Robson Almeida
GESTÃO DE DADOS NAS ORGANIZAÇÕES Prof. Robson Almeida INFRA-ESTRUTURA DE SISTEMAS DE INFORMAÇÃO 3 CONCEITOS Bit: Menor unidade de dados; dígito binário (0,1) Byte: Grupo de bits que representa um único
Leia maisTécnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência
12º CONTECSI Conferência Internacional sobre Sistemas de Informação e Gestão de Tecnologia Técnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência Alcides Carlos de Araújo
Leia maisOrganize grande quantidade de dados de forma rápida e com precisão analítica, para melhor tomada de decisões.
Organize grande quantidade de dados de forma rápida e com precisão analítica, para melhor tomada de decisões. O Pentaho BI é uma solução para Inteligência de negócios do inglês Business Intelligente, é
Leia maisAPLICAÇÕES DE BIG DATA COM SPARK E PYTHON
CURTA DURAÇÃO APLICAÇÕES DE BIG DATA COM SPARK E PYTHON CARGA HORÁRIA: 48 horas DURAÇÃO: 3 meses COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Dr.ª Alessandra de Ávila Montini APRESENTAÇÃO O crescente
Leia maisPopularidade das Linguagens
Popularidade das Linguagens Utilização em projetos de desenvolvimento de software fonte: TIOBE index http://www.tiobe.com 300 million lines of software Code, world-wide, real-time, each day Dados de Fevereiro/2016
Leia maisAdministração de Serviços de Redes. Introdução a Clusters. Prof. Dayvidson Bezerra Contato:
Administração de Serviços de Redes Introdução a Clusters Prof. Dayvidson Bezerra Contato: dayvidsonbezerra@gmail.com Definição Cluster é um termo amplamente utilizado, significa computadores independentes
Leia maisEstratégias de Integração com Cloud
Estratégias de Integração com Cloud Bruno Squassoni, Engenheiro de Sistemas 28 de maio, 2019 Copyright 2019 OSIsoft, LLC Copyright 2019 OSIsoft, LLC 1 Operações Conhecimento em engenharia Funcionamento
Leia maisArmazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil
1 Armazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil Acadêmico: Matheus Magnusson Bolo Disciplina: Segurança Computacional 2 Contexto WGID IV Workshop de Gestão de
Leia maisSistemas de Apoio a Decisão
Sistemas de Apoio a Decisão (Inteligência nos Negócios - Business Inteligente) Sistemas de Informação/Ciências da Computação Aran Bey Tcholakian Morales, Dr. Eng. (Unidade 1) 1. Inteligência nos Negócios
Leia maisCOMPUTAÇÃO PARALELA E DISTRIBUÍDA
COMPUTAÇÃO PARALELA E DISTRIBUÍDA Aluno: Alessandro Faletti Orientadora: Noemi Rodriguez Introdução O objetivo inicial no projeto era aplicar a possibilidade de processamento em paralelo no sistema CSBase
Leia maisUm Repositório Chave-Valor com Garantia de Localidade de Dados. Patrick A. Bungama Wendel M. de Oliveira Flávio R. C. Sousa Carmem S.
Um Repositório Chave-Valor com Garantia de Localidade de Dados Patrick A. Bungama Wendel M. de Oliveira Flávio R. C. Sousa Carmem S. Hara Agenda Motivação Desafios ALOCS Princípios de funcionamento Experimentos
Leia maisFramework para Deduplicação de Dados com Apache Spark
Framework para Deduplicação de Dados com Apache Spark César Magrin - magrin@inf.ufpr.br Disciplina: Metodologia Científica - CI860 Professor: Alexandre Direne Sumário 1. Qualidade de Dados 2. Deduplicação
Leia maisIntrodução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos
Introdução Laboratório de Computação para Ciências Módulo II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Mestrado Profissional
Leia maisIntrodução à Informática
Introdução à Informática Aula 10 http://www.ic.uff.br/~bianca/introinfo/ Aula 10-05/10/2007 1 Ementa Conceitos Básicos de Computação (Hardware, Software e Internet) Softwares Aplicativos Tutorial: Word
Leia maisHadoopDB. Edson Ie Serviço Federal de Processamento de Dados - SERPRO
HadoopDB Edson Ie Serviço Federal de Processamento de Dados - SERPRO Motivação Grandes massas de dados precisam ser processadas em clusters: 1 nó: 100TB@59MB/s = 23 dias Cluster com 1000 nós 33 min!!!
Leia maisInfraestrutura computacional para suporte de aplicações de big data na área da Saúde
Infraestrutura computacional para suporte de aplicações de big data na área da Saúde Maurício Barreto Davide Rasella Marcos Barreto Centro Interdisciplinar em Ciências e Tecnologia da Informação Infraestrutura
Leia maisPentaho Community Edition
Pentaho Community Edition UmaIntroduçãoaBusinessIntelligence eaopentahobiopensource RafaelaRaganham rafaela@ambientelivre.com.br MarcioJuniorVieira marcio@ambientelivre.com.br Sobre o Palestrante Marcio
Leia maisBig Data para Executivos e Profissionais de Mercado
LEIA E ENTENDA SOBRE BIG DATA, AS TECNOLOGIAS UTILIZADAS, AS APLICAÇÕES DE MERCADO, E AS CARREIRAS PROFISSIONAIS. Big Data para Executivos e Profissionais de Mercado Every company has Big Data in its future
Leia maisComo analisar um Big Data com a Tecnologia Hadoop: Aplicação no Mercado Financeiro
Como analisar um Big Data com a Tecnologia Hadoop: Aplicação no Mercado Financeiro Sabrina Bojikian Rissi 1 Luís Alexandre da Silva 1 1 Centro Paula Souza - Faculdade de Tecnologia de Bauru (FATEC) Rua
Leia maisCATEGORIA: CONCLUÍDO ÁREA: ENGENHARIAS E ARQUITETURA SUBÁREA: ENGENHARIAS INSTITUIÇÃO: FACULDADE DE ENGENHARIA DE SOROCABA AUTOR(ES): TAN KIN TAT
TÍTULO: UM SISTEMA DE BIG DATA BASEADO EM APRENDIZAGEM DE MÁQUINA PARA DETERMINAÇÃO DE PERFIS DE ALUNOS PARA APLICAR DE FORMA DIRECIONADA PLANOS DE ESTUDOS DEDICADOS CATEGORIA: CONCLUÍDO ÁREA: ENGENHARIAS
Leia maisInformática Parte 5 Prof. Márcio Hunecke
Escriturário Informática Parte 5 Prof. Márcio Hunecke Informática BANCO DE DADOS NOSQL (CONCEITOS BÁSICOS, BANCOS ORIENTADOS A GRAFOS, COLUNAS, CHAVE/VALOR E DOCUMENTOS) NoSQL (originalmente se referindo
Leia maisUNIVERSIDADE DO SUL DE SANTA CATARINA GABRIEL BENJAMIM DA SILVA
UNIVERSIDADE DO SUL DE SANTA CATARINA GABRIEL BENJAMIM DA SILVA COMPARATIVO ENTRE DIFERENTES SOLUÇÕES DE PROCESSAMENTO DE DADOS PARA BIG DATA Florianópolis 2017 GABRIEL BENJAMIM DA SILVA COMPARATIVO ENTRE
Leia maisESPECIALIZAÇÃO A DISTÂNCIA EM. Ciência de Dados e Big Data Aplicada à Administração Tributária. Área de conhecimento: Tecnologia da Informação
ESPECIALIZAÇÃO A DISTÂNCIA EM Ciência de Dados e Big Data Aplicada à Administração Tributária Área de conhecimento: Tecnologia da Informação PUC MINAS VIRTUAL CORPO DOCENTE Raphael Rodrigues Campos (Mestre)
Leia maisIntrodução a Computação em Nuvem
Introdução a Computação em Nuvem Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia
Leia maisEmenta. Workshop de Internet das Coisas: do Conceito à Realidade
Ementa Workshop de Internet das Coisas: do Conceito à Realidade Descritivo O Workshop de IoT do Conceito à realidade foi concebido em 2016 e desde então vem tendo seu conteúdo atualizado e renovado, focando
Leia maisIntrodução a Computação em Nuvem
Introdução a Computação em Nuvem Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia
Leia maisHadoop - HDFS. Universidade Federal de Goiás Ciência da Computação
Hadoop - HDFS Universidade Federal de Goiás Ciência da Computação O que é Hadoop? Um framework para lidar com aplicações distribuídas que fazem uso massivo de dados Originalmente construído para a distribuição
Leia maisAgilidade nas empresas com a unificação dos dados A jornada para plataformas de dados transacionais analíticos
Agilidade nas empresas com a unificação dos dados Um InfoBrief do IDC patrocinado pela SAP Agosto de 2015 O uso dos dados na atualidade Os dados transacionais dão origem a dados analíticos e separados.
Leia maisSGBDs NoSQL Modelos e Sistemas de Colunas e Grafos. Aluno: Jorge Dias Disciplina: IN940
SGBDs NoSQL Modelos e Sistemas de Colunas e Grafos Aluno: Jorge Dias Disciplina: IN940 Roteiro o Introdução o Motivação o NoSQL (Características) o Comparativo de SGBDs NoSQL x SGBDs Relacionais o Tipos
Leia maisTreinamento em Apache Spark com Scala - Fundamental
Treinamento em Apache Spark com Scala - Fundamental O treinamento fundamental em Apache Spark prepara profissionais para o mercado de trabalho com Spark e Programação em Scala. Seu conteúdo programático
Leia maisApache Hadoop É hoje que vai instalar o seu primeiro cluster?
Apache Hadoop É hoje que vai instalar o seu primeiro cluster? Date : 16 de Março de 2016 Como processar grandes quantidades de dados de forma rápida e a baixo custo? A resposta é Hadoop! Esta framework
Leia maisDesenvolvimento de Software no Contexto Big Data
Universidade de Brasília - UnB Faculdade UnB Gama - FGA Engenharia de Software Desenvolvimento de Software no Contexto Big Data Autor: Guilherme de Lima Bernardes Orientador: Prof. Dr. Fernando William
Leia maissoftware as a service (saas) e service-oriented architecture (soa)
software as a service (saas) e service-oriented architecture (soa) engenharia de sistemas de informação Daniel Cordeiro 18 de agosto de 2017 Escola de Artes, Ciências e Humanidades EACH USP o que eles
Leia maisPrincipais Motivos para Usar o MySQL
Principais Motivos para Usar o MySQL O Banco de Dados de Código Aberto mais Popular do Mundo MySQL é o "M" na pilha comprovada LAMP de código aberto (Linux, Apache, MySQL PHP/Perl/Python) usada pelos sites
Leia maisAlgoritmos de Junção Estrela em MapReduce
Algoritmos de Junção Estrela em MapReduce Jaqueline Joice Brito 09 de junho de 2015 1 Modelo Relacional Dados armazenados em um conjunto de tabelas Amplamente utilizado Junção Recuperação de dados de duas
Leia maisArquitetura de núcleo distribuído utilizando o sistema de switch central Z9000. Uma Nota Técnica da Dell
Arquitetura de núcleo distribuído utilizando o sistema de switch central Z9000 Uma Nota Técnica da Dell Esta nota técnica serve apenas para fins informativos e pode conter erros de digitação e erros técnicos.
Leia maisBIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP.
BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP Informações Central de Relacionamento: (11) 5081-8200 (opção 1) Segunda
Leia maisUNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA
1 UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA JUAN CASSIUS CARNEIRO PEREIRA PEDRO M. NETO GOOGLE CLOUD PONTA GROSSA 2017 2 JUAN CASSIUS
Leia maisSão Paulo. August,
São Paulo August, 28 2018 O futuro do armazenamento dos dados não estruturados Com o Dell EMC Isilon e o ECS Allan Gomes Souza Sr. Systems Engineer, Dell EMC A transformação digital está revolucionando
Leia maisBIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP.
BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP Informações Central de Relacionamento: (11) 5081-8200 (opção 1) Segunda
Leia maisGSI030 ENGENHARIA DE SOFTWARE
UFU Universidade Federal de Uberlândia FACOM Faculdade de Computação GSI030 ENGENHARIA DE SOFTWARE Aula 01 Apresentação da Disciplina 09-08-2016 Prof. William Chaves de Souza Carvalho 09-08-2016 2 Professor
Leia maisApresentação do C3SL para o COUN
Apresentação do C3SL para o COUN Marcos Castilho novembro 2018 Apresentação Grupo de pesquisa do Departamento de Informática da UFPR criado em 2002 Centro de desenvolvimento de soluções computacionais
Leia maisIntrodução. Conceitos Básicos. Conceitos Básicos. Conceitos Básicos
Conceitos Básicos Introdução Tópicos Especiais Modelagem de Dados Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Mestrado Profissional
Leia maisSistemas de Computação e de Informação
Sistemas de Computação e de Informação SLIDE 4 Professor Júlio Cesar da Silva juliocesar@eloquium.com.br site: http://eloquium.com.br/ twitter: @profjuliocsilva Qual é a historia dos sistemas e computadores?
Leia maisDesenvolvimento de Software no Contexto Big Data
Universidade de Brasília - UnB Faculdade UnB Gama - FGA Engenharia de Software Desenvolvimento de Software no Contexto Big Data Autor: Guilherme de Lima Bernardes Orientador: Prof. Dr. Fernando William
Leia maisInovações Tecnológicas
Inovações Tecnológicas Start-ups Computação em Nuvem Algoritmo Tecnologia Disruptiva Big Data Inteligência Artificial Internet das Coisas Blockchain, Criptomoedas e Bitcoin Start-ups Empreendimento em
Leia maisSobre a execução de workflows científicos sobre diferentes estrategias de dados de entrada - Uma Avaliação Experimental
Sobre a execução de workflows científicos sobre diferentes estrategias de dados de entrada - Uma Avaliação Experimental Douglas Oliveira Cristina Boeres Fábio Laboratório Nacional de Computação Científica
Leia maisTecnologias da Informação TI /2 Material de apoio ler bibliografia recomendada (Stair)
Objetivos: Hardware, Software e Sistemas de gerenciamento de Banco de dados. Capítulos 3, 4 e 5 Stair. Hardware (HW) Qualquer maquinário que assiste nas atividades de: Entrada Processamento de um Sistema
Leia maisNÍVEL SUPERIOR NÍVEL SUPERIOR
CIA. DE PROCESSAMENTO DE DADOS DO ESTADO DA BAHIA - PRODEB ESTADO DA BAHIA A N E X O I - D O S R E Q U I S I T O S E C O M P E T Ê N C I A S D O S E M P R E G O S E D I T A L D E P R O C E S S O S E L
Leia maisProf. Daniela Barreiro Claro
Prof. Daniela Barreiro Claro São dados que não podem ser processados ou analisados usando as ferramentas tradicionais Empresas acessando muitas informações mas não sabem como tirar proveito Normalmente
Leia maisSISTEMAS OPERACIONAIS
SISTEMAS OPERACIONAIS Introdução a Sistemas Operacionais Andreza Leite andreza.leite@univasf.edu.br Plano de Aula Introdução aos Sistemas Operacionais Fundamentação Teórica Evolução Histórica Características
Leia maisApache Hadoop. Conceitos teóricos e práticos, evolução e novas possibilidades. Daniel Cordeiro
Apache Hadoop Conceitos teóricos e práticos, evolução e novas possibilidades Daniel Cordeiro Departamento de Ciência da Computação Instituto de Matemática e Estatística Universidade de São Paulo Baseado
Leia mais