Introdução a Big Data. Juciander L. Moreira Wallace Brito
|
|
- Nicolas di Azevedo Conceição
- 5 Há anos
- Visualizações:
Transcrição
1 Introdução a Big Data Juciander L. Moreira Wallace Brito 1
2 Sumário Introdução Os 3 Vs de Big Data Definição de Big Data Mitos sobre Big Data Aplicações Iniciando um projeto de Big Data Captura e armazenamento dos dados Tecnologias para Big Data Tendências Conclusão Referências bibliográficas 2
3 Introdução Usamos smartphones desde que acordamos e em tempos pré-determinados durante o dia. A tecnologia está em constante evolução. Há vinte anos atrás não existiam soluções capazes de facilitar nossas ações diárias. Smartphone nos acorda com a música favorita. Nossos compromissos são notificados com antecedência. Documentos podem ser buscados facilmente acessando a internet em um serviço de computação em nuvem para armazenamento de dados. Solicitar serviço de transporte de passageiros por meio de um aplicativo. Etc Você é capaz de imaginar sua rotina diária sem os recursos tecnológicos existentes? Seja para lazer, viagens, compras ou trabalho, a tecnologia nos proporciona facilidades que antes eram inimagináveis. 3
4 Introdução 4
5 Introdução Qual a semelhança entre os serviços apresentados anteriormente? Os avanços em hardware, software, tecnologias e infraestrutura de redes foram responsáveis para que chegássemos à era dos dados. Um estudo feito pela revista Science apontou que, em 1996, somente 0.8% dos dados eram armazenados em formato digital, enquanto em 2007 a quantidade de dados digitais já era de 94%. Como as pessoas utilizam e armazenam uma música, um vídeo ou um documento nos dias atuais? A quantidade de dados que eles geram. A grande maioria das respostas envolve um dispositivo digital. Como ocorreu essa transformação? Um dos fatores é a internet e os dispositivos móveis. 5
6 Introdução 6
7 Introdução 7
8 Introdução Custo de armazenamento de 1 megabytes em 1990 era de aproximadamente U$ , a média atual é de apenas U$ Aumento do poder de processamento. Lei de Moore. Com o volume de dados crescendo e novas tecnologias habilitadoras para a geração desses dados, empresas de diversos segmentos passaram a perceber o potencial dos diferentes tipos de dados. A capacidade de processamento dos computadores dobraria aproximadamente a cada 18 meses. Aperfeiçoar processos. Aumentar a produtividade. Melhorar o processo de tomada de decisão. Desenvolver novos produtos ou serviços. Logo, surgiram soluções que utilizam uma série de dados para inúmeros propósitos. 8
9 Introdução Na indústria varejista, que adotam etiquetas de identificação por radiofrequência (RFID). Na agricultura, utilização de redes de sensores, que coletam fluxos de dados em tempo real para fornecer suporte às ações referentes ao processo de plantação, cultivo e colheita. Mesmos havendo tantos dados, um estudo do EMC apontou que, em 2012, de todos os 643 exabytes de dados existentes no mundo digital, somente 3% foram utilizados. 9
10 Os Vs de Big Data Além do próprio nome Big Data, grande quantidade de dados, dizer uma de suas principais características, existem outras como os Vs de Big Data. Os 3 Vs de Big Data está relacionado com as suas características. Volume. Variedade. Velocidade. 10
11 Os Vs de Big Data 11
12 Volume O atributo volume é a característica mais significativa no conceito de Big Data. Ele faz referência à dimensão sem precedentes do volume de dados. 90% dos dados foram criados nos últimos dois anos. Origem para tanto dados: Uma dúvida frequente relacionada ao volume de dados é a identificação de quando um determinado conjunto de dados pode ser considerado Big Data. É preciso ter uma quantidade de petabytes de dados para ter uma solução de Big Data? A cada segundo, cerca de buscas são realizadas no Google. A empresa Walmart manipula mais de 1 milhão de transações dos clientes por hora. A resposta é não. O que define se o atributo volume necessita de uma tecnologia de Big Data é limitação das ferramentas tradicionais para lidar com volumes de dados. 12
13 Volume 44 zettabytes de dados em
14 Variedade O banco de dados relacional é o modelo de armazenamento de dados mais usado nos últimos 40 anos pelas corporações. Embora seja muito eficiente e aplicado a diversos cenários, devido às características acima, o banco de dados relacional se torna uma limitação para Big Data, uma vez que esse termo inclui dados semiestruturados e não estruturados. Dados semiestruturados são aqueles que possuem uma estrutura pré-definida, porém não com o mesmo rigor dos dados relacionais. Dados rígidos, bem estruturados. Tamanho e os tipos de dados bem definidos. Arquivos no formato JSON (JavaScript Object Notation). XML (extensible Markup Language). Dados não estruturados incluem os vídeos, imagens, e alguns formatos de textos. Considerando todos os dados disponíveis globalmente, apenas 20% são considerados dados estruturados. 14
15 Variedade Quando nos referimos à variedade, também cabe destacar a variedade de áreas das quais Big Data tem sido aplicado. Na área governamental, com a utilização de tecnologias para rastrear os perfis dos eleitores na campanha do presidente dos Estados Unidos, Barack Obama; No setor financeiro, com soluções na área de análise de risco e detecção de fraude; Na área de transporte e automação, com o monitoramento de tráfego e rastreamento de carga; No setor de varejo, com a possibilidade de gerar ofertas baseadas na análise de vendas e no perfil do consumidor; Nas diversas possibilidades na área de marketing, por meio da análise de redes sociais; Na área de seguros, com a possibilidade de ofertas de planos baseados no comportamento do segurado. 15
16 Variedade Dados transacionais Repositório de dados 16
17 Velocidade Outra característica de Big Data é a velocidade com que os dados são coletados, analisados e utilizados. Imagine um e-commerce que faz recomendações de produtos a um cliente depois de uma semana dele ter comprado um produto. Se fosse feito no mesmo instante teria um impacto bem maior provavelmente. Além da análise dos dados, outro fator de velocidade deve ser levado em consideração e a rapidez com que os dados são gerados. Em apenas 1 minuto são gerados: 2 milhões de pesquisas no google. 6 milhões de páginas são visitadas no facebook. 1.3 milhão de vídeos são vistos no youtube. 17
18 Velocidade 18
19 Definição informal Big Data não é somente um grande volume de dados armazenado. Envolve variedade e velocidade dos dados, que necessita de estratégias inovadoras capaz de extrair informações valiosas de uma massa de dados. Exige quebra de paradigmas. Novos tamanhos de dados, novas velocidades, novas tecnologias e novos métodos de análise de dados. Mudança de estratégias e tecnologias a todo momento. Existem outras características além dos 3 Vs apresentados. O atributo valor, que consiste em quão valioso e significativo um dado é para uma solução. O atributo veracidade, que consiste na confiabilidade dos dados. Por ser característico de Big Data ter uma grande quantidade e variedade de dados, é comum a existência de dados inconsistentes. 19
20 Como os dados são gerados? 20
21 Dados gerados por humanos Dados gerados por humanos são aqueles em que o conteúdo foi gerado a partir do pensamento de uma pessoa, na qual a propriedade intelectual está integrada ao dado. Mídias sociais: Facebook, Instagram, twitter, whatsapp etc Sites colaborativos: wikipédia. Outros tipos de dados: blogs, avaliação de produtos, serviços de sites e-commerce, Internet das coisas. Comentários e curtidas. Compartilhamento e publicação de imagens, áudio e vídeo. Posts com pensamentos sobre algo que geram debates. Americanas.com, Walmart.com e Amazom.com. Dados de e-commerce são usados para fazer recomendações de produtos e serviços. Netflix: recomendar filmes para seu usuário. Walmart: descobrir preferências de seus usuários. 21
22 Dados gerados por máquinas Dados digitais produzidos por processos computacionais, sem necessitar explicitamente de intervenção humana. Registro de logs gerado pelos servidores da web Visitas em páginas da web. Clicks em link capturados. Internet das Coisas Sensores Atuadores Wearables Etiquetas de RFID 22
23 Mitos sobre Big Data Big Data engloba somente dados não estruturados. Banco de dados relacional precisou ser complementado. Dados relacionais continuam sendo valiosos e muito utilizados em soluções Big Data. Inclusão de mais tipos de dados. Big Data é aplicado somente às empresas do vale do Silício com Facebook, Twitter e Netflix. Big Data é aplicado somente em grandes empresas. Agricultura e varejo. Pequenas e médias empresas podem fazer uso de soluções de Big Data. As tecnologias de Big Data já estão bem estabelecidas. Infelizmente não, ou felizmente, se pensarmos nas oportunidades. 23
24 Aplicações Área Onde Big Data está sendo aplicado Saúde e Medicina Monitoramento de pacientes em tempo real; Análise de dados de redes sociais para descobertas de pandemias; Análise de padrões de doenças; Serviços financeiros Análise de risco; Detecção de fraude; Setor público Vigilância por vídeo; Otimização de rotas no transporte público; Telecomunicação Análise de registro de chamadas; Monitoramento de equipamentos; Varejo Previsão de demanda; Precificação dinâmica; 24
25 Iniciando um projeto de Big Data 25
26 Etapas num projeto de Big Data 1. Identificar as perguntas que devem ser respondidas com os dados a. 2. Etapa de captura e armazenamento dos dados a. b. c. d. 3. Que fontes devo utilizar? Como os dados serão capturados? Formato e tipo de dados a serem extraídos. Como serão armazenados? Etapa de processamento e análise a. b. 4. Quais informações pretende-se extrair de um conjunto de dados. Tecnologias de Big Data devem ser definidas. Mecanismos de machine learning, métodos estatísticos, fundamentos matemáticos e mineração de dados. Visualização de dados a. Técnicas de criação de gráficos dinâmicos e interativos. 26
27 Etapas num projeto de Big Data 1. Identificar as perguntas que devem ser respondidas com os dados a. 2. Etapa de captura e armazenamento dos dados a. b. 3. Que fontes devo utilizar? Como os dados serão capturados? Etapa de processamento e análise a. b. 4. Quais informações pretende-se extrair de um conjunto de dados. Tecnologias de Big Data devem ser definidas. Mecanismos de machine learning, métodos estatísticos, fundamentos matemáticos e mineração de dados. Visualização de dados a. Técnicas de criação de gráficos dinâmicos e interativos. 27
28 Captura e armazenamento dos dados Formas de obtenção dos dados Dados internos Dados em que a empresa é dona e possui controle. Arquivos, documentos XML, JSON, CSV. Registro de logs. Dados de sensores. Dados externos Dados de domínio público. Open data. 28
29 Captura e armazenamento dos dados Armazenamento de dados Escalabilidade Manter o desempenho mesmo com a adição de mais dados. Os SGDBs relacionais, consegue garantir esse desempenho com adição de novos recursos computacionais. Alta disponibilidade Flexibilidade Os SGDBs relacionais precisa definir o esquema. Inviável para dados semiestruturados. Tecnologias NoSQL 29
30 Captura e armazenamento dos dados Características das tecnologias NoSQL: Ausência de esquema Não exigem um esquema rígido. Projetadas para cluster Oferecendo maior escalabilidade. Teorema CAP Consistência: Todos os nós da rede deve conter os mesmos dados. Disponibilidade: O sistema deverá sempre responder a uma requisição. Mesmo que não esteja consistente. Tolerância à partição 30
31 Captura e armazenamento dos dados 31
32 Processamento de dados Como processar grandes volumes de dados em tempo razoável? Processamento distribuído 32
33 Processamento de dados 33
34 Processando os dados com Hadoop O que é o Hadoop? Conjunto de ferramentas que permite fazer processamento distribuído. Inicialmente o Hadoop foi projetado para um propósito específico: uma engine de busca da Web, tal como serviço da Google, porém open source. Lançado oficialmente em
35 Processando os dados com Hadoop Principais características que tornaram o Hadoop tão interessante para aplicações que envolvem o grande volume de dados: Baixo custo, ou seja, Hadoop é open source. Escalabilidade. Permite a execução de aplicações em ambientes de cluster com centenas, ou até mesmo milhares de servidores. Tolerância a falhas. Hadoop garante a disponibilidade dos dados e execução de tarefas, mesmo na ocorrência de falhas. 35
36 Ecossistema do Hadoop 36
37 Hadoop - HDFS - HDFS Sistema de arquivos distribuído que permite o armazenamento de grande volume de dados de maneira tolerante a falhas. 37
38 Hadoop - HDFS - HDFS Transparência 38
39 Hadoop - Modelo MapReduce - MapReduce O Hadoop é baseado no modelo de programação MapReduce. Permite que grandes volumes de dados sejam processados por meio da divisão de uma aplicação em tarefas independentes. É composto por duas fases principais: Map Processar um conjunto de dados de entrada, que devem ser obtidos no formato de pares chave-valor. Reduce Recebe dados do Map, e tem como saída também no formato chave-valor. 39
40 Hadoop - Modelo MapReduce Exemplo básico: Contador de palavras Link do projeto: 40
41 Processando os dados com Hadoop $ hadoop jar Contador,jar ContadorDriver BaseEntrada saida 41
42 Processando os dados com Hadoop - Pipelines 42
43 Limitações do MapReduce MapReduce não é uma solução adequada para todas as aplicações de Big Data. Pois foi projetada para a categoria de processamento em lote. 43
44 Processamento em tempo real Processamento em tempo real: Dados são analisados assim que são gerados. O processamento é feito em apenas um item de dado. Exemplo: Processamento de dados oriundos de um sensor de temperatura. Características do processamento em tempo real: Baixa latência Consistência Alta disponibilidade 44
45 Processamento em tempo real Tecnologias de Big Data para processamento em tempo real: Apache Storm Apache Spark Oferece baixa latência. Pode ser utilizado em uma infraestrutura Hadoop. Considerado uma evolução do Apache MapReduce. Oferece mecanismos que otimizam o processamento em memória dos dados. Pode ser utilizado em uma infraestrutura Hadoop. Apache Kafka Pode ser utilizado em uma infraestrutura Hadoop. 45
46 Apache Spark 46
47 Apache Spark Aplicações em Java, Scala, Python, R, e SQL. Experimento executando uma lógica de regressão no Hadoop e Spark. 47
48 Apache Spark Exemplo: Monitoramento em tempo real. 48
49 Tendências Streaming de dados Análise de séries temporais Banco de dados de séries temporais Banco de dados que contenham sequências de valores ou eventos armazenados sucessivamente em função do tempo. Fusão de ferramentas de Big Data com IA Para atender massa de dispositivos da IoT. TensorFlow Combate a fake news 49
50 Conclusão Apresentamos algumas características de Big Data: volume, variedade, velocidade, valor, veracidade. Definimos o conceito de Big Data como sendo um grande volume de dados com variedade e velocidade que necessita de tecnologias inovadoras para processamento e armazenamento de dados. Apresentamos algumas aplicações em algumas áreas. Introduzimos ferramentas para Big Data: Hadoop e Apache spark. Big Data é considerado o novo petróleo. Está sendo e será mais usado ainda no futuro. Uma área que está se desenvolvendo cada vez mais com novas tecnologias, novas técnicas. 50
51 Referências Bibliográficas acessado em 02/07/18 ás 18:32h acessado em 02/07/18 ás 19:45h acessado em 02/07/18 ás 18:12h MCCREARY, Dan; KELLY, Ann. Making sense of NoSQL. Shelter Island: Manning, DEAN, Jeffrey; GHEMAWAT, Sanjay. MapReduce: simplified data processing on large clusters. Sixth Symposium on Operating System Design and Implementation, Dez LUBLINSKY, Boris; YAKUBOVICH, Alexey; SMITH, Kevin. Professional Hadoop Solutions. John Wiley & Sons, GOLDMAN, Alfredo; KON, Fabio; JUNIOR, Francisco Pereira; POLATO, Ivanilton; PEREIRA, Rosangela de Fátima. Apache Hadoop: conceitos teóricos e práticos, evoluçao e novas possibilidades. XXXI Jornadas de atualizaçoes em informatica,
BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES?
1 BIG DATA PODEMOS DIZER QUE SÃO DADOS GRANDES? Deyvirson Mendonça SUMÁRIO Definição Os Vs do Big Data Desafios Hadoop BD e Big Data PARA COMEÇAR O QUE SÃO DADOS? Informações diversas, que podem ser organizadas
Leia maisInformática Parte 10 Prof. Márcio Hunecke
Escriturário Informática Parte 10 Prof. Márcio Hunecke Informática CONCEITOS DE MAPREDUCE E HDFS/HADOOP/YARN 2.7.4 Big Data O termo Big Data refere-se a um grande conjunto de dados armazenados e baseia-se
Leia maisBig Data Open Source com Hadoop
Big Data Open Source com Hadoop Palestrante: Marcio Junior Vieira marcio@ambientelivre.com.br Realização: Marcio Junior Vieira 14 anos de experiência em informática, vivência em desenvolvimento e análise
Leia maisInformática Parte 11 Prof. Márcio Hunecke
Escriturário Informática Parte 11 Prof. Márcio Hunecke Informática FERRAMENTAS DE INGESTÃO DE DADOS (SQOOP 1.4.6, FLUME 1.7.0, NIFI 1.3.0 E KAFKA 0.11.0) Visão geral sobre os quatro componentes Fazem
Leia maisKDD E MINERAÇÃO DE DADOS:
KDD E MINERAÇÃO DE DADOS: Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com Coleta de dados em vários
Leia maisBIG DATA. Jorge Rady de Almeida Jr. Escola Politécnica da U SP
BIG DATA Jorge Rady de Almeida Jr. jorgerady@usp.br Escola Politécnica da U SP BIG DATA - MOTIVAÇÃO Aumento da geração e armazenamento digital de dados Aumento da capacidade de processamento em geral:
Leia maisPrIntCloud. Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13
PrIntCloud Disciplina: Procedência de Dados e Data Warehousing. Aluna: Shermila Guerra Santa Cruz. 16/04/13 Roteiro 1. Fundamentação Teórica A.- Cloud Computing B.- Hadoop C.- MapReduce D.- NoSql 2. Proposta
Leia maisBUSINESS INTELLIGENCE E DATA WAREHOUSE. Big Data Conceitos, Técnicas, Ferramentas e Arquitetura. tutorpro.com.br cetax.com.br
BUSINESS INTELLIGENCE E DATA WAREHOUSE Big Data Conceitos, Técnicas, Ferramentas e Arquitetura tutorpro.com.br cetax.com.br Quem somos 2 3 Objetivos do Curso de Big Data 4 Alinhamento das expectativas
Leia maisEstudo de implementação de um cluster utilizando apache hadoop. Giovanni Furlanetto
Estudo de implementação de um cluster utilizando apache hadoop Giovanni Furlanetto 1470175 Sumário Introdução Metodologia de Pesquisa Revisão Bibliográfica Resultados Conclusão Referências Introdução Considerando
Leia mais5 Infraestrutura de TI
Hardware consiste na tecnologia para processamento computacional, armazenamento, entrada e saída de dados. Ex: grandes mainframes, servidores, computadores pessoais, laptops e dispositivos móveis. 1 2
Leia maisSGBD NoSQL 1. Dácio Alves Florêncio
Dácio Alves Florêncio Introdução Surgimento da Web 2.0; Aplicações mais complexas; Ineficiência. 2 Motivação Ineficiência a tratar esses novos formatos de dados; 3 Objetivos Conceituação Fundamental do
Leia maisPrincipais Motivos para Usar o MySQL
Principais Motivos para Usar o MySQL O Banco de Dados de Código Aberto mais Popular do Mundo MySQL é o "M" na pilha comprovada LAMP de código aberto (Linux, Apache, MySQL PHP/Perl/Python) usada pelos sites
Leia maisBig Data. A Nova Onda
Big Data A Nova Onda Ricardo Rezende 18 anos em TI; 12 anos como DBA Oracle; Infrastructure Principal @ Accenture Enkitec Group; Oracle Certified Professional; IBM Certified Database Associate; Mestrando
Leia maisAPLICAÇÕES DE BIG DATA COM SPARK E PYTHON
CURTA DURAÇÃO APLICAÇÕES DE BIG DATA COM SPARK E PYTHON CARGA HORÁRIA: 48 horas DURAÇÃO: 3 meses COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Dr.ª Alessandra de Ávila Montini APRESENTAÇÃO O crescente
Leia maisBIG DATA: UMA INTRODUÇÃO. Prof. Ronaldo R. Goldschmidt
BIG DATA: UMA INTRODUÇÃO Prof. Ronaldo R. Goldschmidt Instituto Militar de Engenharia Seção de Engenharia de Computação (SE/8) ronaldo.rgold@ime.eb.br / ronaldo.rgold@gmail.com 70% 60% 50% 40% 30% 20%
Leia maisPÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan
PÓS-GRADUAÇÃO LATO SENSU Curso: Banco de Dados Disciplina: Data Warehouse e Business Intelligence; Laboratório Professor: Fernando Zaidan Unidade 1.3 2016 Big Data Big Data - Contexto Globalização Modelo
Leia maisPÓS-GRADUAÇÃO ANÁLISE DE BIG DATA
PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e
Leia maisSergio Adriano Blum Data Scientists
Big Data e Inovação Sergio Adriano Blum Data Scientists Instrutor Gerente de Projetos Consultor MBA Gestão Estratégia de Empresas pela Unisinos Bacharel em Administração de Empresas com Ênfase em Análise
Leia maisBenjamin Bengfort Jenny Kim
Benjamin Bengfort Jenny Kim Novatec Authorized Portuguese translation of the English edition of Data Analytics with Hadoop, ISBN 9781491913703 2016 Benjamin Bengfort, Jenny Kim. This translation is published
Leia maisinformação enviada (ex. Facebook) ou que a rede social utilize essa informação para sugerir locais de interesse próximos ao usuário (ex. Foursquare).
1 Introdução 1.1 Contextualização Recentemente, tem-se percebido um movimento de integração de comunidades físicas e comunidades virtuais. As pessoas utilizam cada vez mais a Internet para se comunicar
Leia maisCURTA DURAÇÃO ANÁLISE DE BIG DATA. CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini
CURTA DURAÇÃO ANÁLISE DE BIG DATA CARGA HORÁRIA: 80 horas COORDENAÇÃO: Prof. Dr. Adolpho Pimazoni Canton Prof.ª Drª Alessandra de Ávila Montini OBJETIVO O volume crescente de informação disponível nas
Leia maisMBA ANALYTICS EM BIG DATA
MBA ANALYTICS EM BIG DATA OBJETIVOS Este curso tem como objetivo principal apresentar de forma clara, objetiva e com aplicações reais como as metodologias de Big Data, Inteligência Artificial e Computação
Leia maisFramework para Deduplicação de Dados com Apache Spark
Framework para Deduplicação de Dados com Apache Spark César Magrin - magrin@inf.ufpr.br Disciplina: Metodologia Científica - CI860 Professor: Alexandre Direne Sumário 1. Qualidade de Dados 2. Deduplicação
Leia maisGovernança e Big Data. Celso Poderoso
Governança e Big Data Celso Poderoso cpoderoso@microstrategy.com Celso Poderoso Formação Acadêmica: Economista Especialista em Sistemas de Informação Mestre em Tecnologia (Grid Computing/Cloud Computing)
Leia maisBancos de Dados NoSQL
Bancos de Dados NoSQL Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Banco de Dados NoSQL (Not Only SQL) Foco no armazenamento de gigantescos volumes de dados (big data)
Leia maisElaborando uma plataforma de Big Data & Analytics 100% Open Source com apoio do Pentaho.
Open Source Data Science Elaborando uma plataforma de Big Data & Analytics 100% Open Source com apoio do Pentaho. Palestrante: Marcio Junior Vieira CEO e Data Scientist na Ambiente Livre marcio@ambientelivre.com.br
Leia maisSistemas Distribuídos. Plano de Curso. Plano de Curso 04/03/12 ! EMENTA:
Sistemas Distribuídos Prof. Msc. André Luiz Nasserala Pires nassserala@gmail.com! EMENTA: Plano de Curso! Conceitos. Comunicação entre processos (IPC). Programação de aplicações cliente- servidor. Sincronização
Leia maisL s. e f. i u. F s. i e
Q S o N a t a D g i B e L te i e L e p eli F s i u L or: s s e f o r P Contato luisleite@recife.ifpe.edu.br Professorluisleite.wordpress.com O e u q o é D g Bi? a at Big Data Vivemos hoje a era da informação.
Leia maisBig Data. O que é Big Data! Como surgiu isso! Para que serve?!
Big Data O que é Big Data! Como surgiu isso! Para que serve?! Da teoria a prática:! 1! Dá mesmo para! fazer algo prático! com o! Big Data?! Como tudo! começou?!! Qual o! Problema?! PERCEBEU:! Informações
Leia maisIntrodução Ferramentas Unix MapReduce Outras Ferramentas. Batch Processing. Fabiola Santore. Universidade Federal do Paraná
Fabiola Santore Universidade Federal do Paraná Sumário 1. Introdução 2. Ferramentas Unix 2.1 Análise de log 2.2 Filosofia Unix 3. MapReduce 3.1 Procedimento 3.2 Reduce: Joins e Agrupamento 3.3 Análise
Leia maisMEIC Sistemas Distribuídos
MEIC Sistemas Distribuídos 2 de março de 2017 Rodrigo Miragaia Rodrigues Baseado nos slides apresentados por Paulo Ferreira Departamento de Engenharia Informá3ca 2 Fonte: Malte Schwarzkopf. Operating system
Leia maisAula 05. Infraestrutura de TI: hardware e software Pearson. Todos os direitos reservados.
Aula 05 Infraestrutura de TI: hardware e software slide 1 Infraestrutura de TI: hardware e software 1. Quais os componentes da infraestrutura de TI? 2. Quais as principais tecnologias de hardware computacional,
Leia maisProf. Daniela Barreiro Claro
Prof. Daniela Barreiro Claro São dados que não podem ser processados ou analisados usando as ferramentas tradicionais Empresas acessando muitas informações mas não sabem como tirar proveito Normalmente
Leia maisInfra Estrutura Hardware e Software
Infra Estrutura Hardware e Software CEA145 Teoria e Fundamentos de Sistemas de Informação Universidade Prof. Federal George de H. G. Ouro Fonseca Preto DECEA / João Monlevade Universidade
Leia maisUm Servidor Escalável para Bases Massivas de
Um Servidor Escalável para Bases Massivas de Dados Geográficos Leandro da Silva Santos Orientador: Tiago Garcia de Senna Carneiro Co-orientador: Ricardo Augusto Rabelo Oliveira Departamento de Computação
Leia maisIntrodução a Sistemas Distribuídos
Sistemas Distribuídos Mauro Lopes Carvalho Silva Professor EBTT DAI Departamento de Informática Campus Monte Castelo Instituto Federal de Educação Ciência e Tecnologia do Maranhão Objetivos Nesta aula
Leia maisPentaho IoT Analytics Open Source Trilha IoT
Pentaho IoT Analytics Open Source Trilha IoT Marcio Junior Vieira CEO & Data Scientist, Ambiente Livre Marcio Junior Vieira Mini-cv 18 anos de experiência em informática, vivência em desenvolvimento e
Leia maisComputação em nuvem (Cloud Computing)
Computação em nuvem (Cloud Computing) Disciplina: Gestão da Tecnologia de Sistemas Professor: Thiago Silva Prates Computação em nuvem O termo computação em nuvem refere-se a modelo de capacitação na qual
Leia maisAVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP
AVALIAÇÃO DE DESEMPENHO DE PROCESSAMENTO DISTRIBUÍDO EM LARGA ESCALA COM HADOOP Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Dr. Paulo Romero Martins Maciel INTRODUÇÃO Nem sempre os dados
Leia maisANALYTICS: Dados e Atenção
ANALYTICS: Dados e Atenção O CONCEITO DE ANALYTICS NA INTERNET DAS COISAS BASEIA-SE NA CONSTANTE GERAÇÃO DE DADOS Por Nazareno Andrade Deyvison Bruno, Icaro Ramires, Joabe Pinheiro 1 Agenda Informações
Leia maisA NOVA EXPERIÊNCIA ANALÍTICA
A NOVA EXPERIÊNCIA ANALÍTICA USANDO MELHOR O HADOOP COMO PEÇA DO QUEBRA-CABEÇA DO BIG DATA Rafael Aielo Gerente de Soluções AGENDA Era Big Data Hadoop O que é e como funciona SAS e Hadoop ERA BIG DATA
Leia maisFundamentos de Informática Introdução aos Conceitos Básicos
Fundamentos de Informática Introdução aos Conceitos Básicos Professor: Luiz A. P. Neves neves@ufpr.br e lapneves@gmail.com 1 Roteiro Objetivos Conceitos Básicos Processamento de Dados Modalidade de Computadores
Leia maisTransformação Digital
20Tendências de Transformação Digital SLIDESHARE 01 Inteligência artificial Este ano a inteligência artificial começará a ser implementada para realização de tarefas muito repetitivas. Isso se dará principalmente
Leia maisIntrodução à Ciência da Computação
1 Universidade Federal Fluminense Campus de Rio das Ostras Curso de Ciência da Computação Introdução à Ciência da Computação Professor: Leandro Soares de Sousa e-mail: leandro.uff.puro@gmail.com site:
Leia maisSistema Gestor de Bancos de Dados (SGBD)
Sistema Gestor de Bancos de Dados (SGBD) Conceitos Gerais Prof. Guilherme Tomaschewski Netto guilherme.netto@gmail.com Roteiro! Contextualização! Apresentação, um pouco de história Legendas! Nesta apresentação
Leia maisUNIVERSIDADE PRESBITERIANA MACKENZIE
1. Identificação do Curso a. Curso de Especialização em: Ciência de Dados (BIG DATA ANALYTICS) b. Área: Computação c. Área temática (tema): BIG DATA d. Linha de Pesquisa: Computação e Sistemas de Informação
Leia maisDisciplina Gestão da Informação e do Conhecimento (ACA603)
Universidade Federal do Rio de Janeiro Centro de Ciências Jurídicas e Econômicas Faculdade de Administração e Ciências Contábeis Biblioteconomia e Gestão de Unidades de Informação Disciplina Gestão da
Leia maisInformática. Aplicativos de Áudio, Vídeo, Multimídia, Uso da Internet na Educação, Negócios, Emergências e outros Domínios. Professor Márcio Hunecke
Informática Aplicativos de Áudio, Vídeo, Multimídia, Uso da Internet na Educação, Negócios, Emergências e outros Domínios Professor Márcio Hunecke www.acasadoconcurseiro.com.br Informática APLICATIVOS
Leia maisBruno Antunes da Silva UFSCar - Sorocaba
Bruno Antunes da Silva UFSCar - Sorocaba Introdução HDFS Arquitetura Leitura e escrita Distribuição de nós Controle de réplicas Balancer MapReduce Conclusão Aplicações web com grandes quantidades de dados
Leia maisUNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA
1 UNIVERSIDADE ESTADUAL DE PONTA GROSSA SETOR DE CIÊNCIAS AGRÁRIAS E DE TECNOLOGIA DEPARTAMENTO DE INFORMÁTICA JUAN CASSIUS CARNEIRO PEREIRA PEDRO M. NETO GOOGLE CLOUD PONTA GROSSA 2017 2 JUAN CASSIUS
Leia maisUso da Internet. Disciplina: Gestão da Tecnologia de Sistemas. Professor: Thiago Silva Prates
Uso da Internet Disciplina: Gestão da Tecnologia de Sistemas Professor: Thiago Silva Prates Uso da Internet nos negócios Com a evolução dos Sistemas de Informações nas organizações, da melhoria na infraestrutura,
Leia maisHistórias de Dados. Big Data 2018
Histórias de Dados Big Data 2018 O que é Big Data Big Data são assets de informação de alto-volume, alta-velocidade e/ou alta-variedade que demandam formas de processamento inovadoras e econômicas que
Leia maisSistemas Distribuidos. Prof. Walter Gima
Sistemas Distribuidos Prof. Walter Gima 1 Apresentação da Disciplina Disciplina: Sistemas Distribuídos Carga Horária: 20 horas/aula Horário: 9:10 Até 22:00 2 Objetivos Reconhecer os diversos tipos de sistemas
Leia maisBIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP.
BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP Informações Central de Relacionamento: (11) 5081-8200 (opção 1) Segunda
Leia maisSOBRE O ARTIGO SOBRE OS AUTORES
Por ALEXANDRE SALVADOR E ANA IKEDA 1 SOBRE O ARTIGO Este artigo é uma adaptação sintética do artigo Big data usage in the marketing information system, publicado em agosto de 2014 no Journal of Data Analysis
Leia maisBrilliant Solutions for a Safe World
RECONHECIMENTO DE OBJECTIVOS PARA APLICAÇÕES DE VISÃO PARA COMPUTADOR MÓVEIS O SentiSight Embedded foi projetado para desenvolvedores que desejam usar o reconhecimento de objetos com base em visão por
Leia maisTCE Informática Dados Estruturados e Não-Estruturados Prof. Marcelo Ribeiro
TCE Informática Dados Estruturados e Não-Estruturados Prof. Marcelo Ribeiro www.acasadoconcurseiro.com.br Informática DADOS ESTRUTURADOS E NÃO-ESTRUTURADOS Esses termos referem-se à forma como um conjunto
Leia maisHaddop, MapReduce e Spark
Haddop, MapReduce e Spark Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Conceitos Básicos 2. MapReduce 3. Spark 4. Transformações Básicas 5. Ações Básicas 1 Conceitos Básicos Hadoop
Leia maisArmazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil
1 Armazenamento Distribuído de Dados Seguros para Efeito de Sistemas de Identificação Civil Acadêmico: Matheus Magnusson Bolo Disciplina: Segurança Computacional 2 Contexto WGID IV Workshop de Gestão de
Leia maisMineração de Dados com Big Data. Prof. Fabrício Olivetti de França Universidade Federal do ABC
Mineração de Dados com Big Data Prof. Fabrício Olivetti de França Universidade Federal do ABC Introdução Mineração de Dados Extração e descoberta de conhecimentos de bases de dados. Interdisciplinar: aprendizado
Leia maisFundamentos de Mineração de Dados
Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento
Leia maisSoluções IoT Inovadoras Plataforma Link IoT
Soluções IoT Inovadoras Plataforma Link IoT Tecnologia Beacon Como Funciona A Taggen está desenvolvendo produtos inovadores para auxiliar na criação de soluções voltadas à Internet das Coisas A Internet
Leia maisSão Paulo. August,
São Paulo August, 28 2018 Maximize resultados relacionando Aplicações, Dados e Analytics para IoT Com Dell EMC Isilon e ECS Sergio Moure Domingues Enterprise Sales Brazil Unstructured Data Solutions -
Leia maisQUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ;
QUESTIONÁRIO SOBRE HADOOP LEITURA DO MATERIAL FORNECIDO ALUNO/GRUPO ; LEIA O MATERIAL ANTES DE FAZER O EXEMPLO DIDÁTICO. AS QUESTÕES ABAIXO PODEM SER RESPONDIDAS, USANDO, PREFERENCIALMENTE, SUA PRÓPRIAS
Leia maisMineração de Dados com Big Data. Prof. Fabrício Olivetti de França Universidade Federal do ABC
Mineração de Dados com Big Data Prof. Fabrício Olivetti de França Universidade Federal do ABC Sobre mim Formado em Engenharia Elétrica com ênfase em Computação pela Universidade Católica de Santos. Mestrado
Leia maisAvaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop
Avaliação de desempenho e dependabilidade de processamento de dados em larga escala com Hadoop Débora Stefani Lima de Souza dsls@cin.ufpe.br Orientador: Paulo Romero Martins Maciel prmm@cin.ufpe.br Dados,
Leia maisOrganização e Recuperação da Informação
Organização e Recuperação da Informação Wendel Melo Faculdade de Computação Universidade Federal de Uberlândia Recuperação da Informação Adaptado do Material da Prof Vanessa Braganholo - IC/UFF Recuperação
Leia maisBD e Cloud Gerenciamento de. Dados na Nuvem
CIn/UFPE In940 - Banco de Dados Gerenciamento de Dados na Nuvem Conceitos e Arquiteturas Chaina Santos Oliveira - cso2 Roteiro Motivação Computação em Nuvem Gerenciamento de dados na Nuvem Sistemas de
Leia maisComputação Distribuída
Aula 1 Introdução aos Sistemas Distribuídos Anos 50 - Sistemas Operacionais tipo Lote Aumentar a capacidade de processamento de programas Usuário ia ao computador Processamento Seqüencial Leitoras de cartões
Leia maisBanco de Dados Data Mining Data Warehouse Big Data
Universidade Estadual de Mato Grosso do Sul Curso de Computação, Licenciatura Banco de Dados Data Mining Data Warehouse Big Data Prof. José Gonçalves Dias Neto profneto_ti@hotmail.com Data Mining: Introdução
Leia maisBIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP.
BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP Informações Central de Relacionamento: (11) 5081-8200 (opção 1) Segunda
Leia maisINTRODUÇÃO AO MULTIMÉDIA DIGITAL
Oficina de Multimédia B 2015-2016 Noção de Média Noção de Multimédia Noção de Multimédia Digital Tipos de produtos Multimédia O que significa MÉDIA? um meio - media - é o recurso técnico ou físico de conversão
Leia maisInstituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte Lista de Exercícios para a Terceira Unidade.
Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte Lista de Exercícios para a Terceira Unidade Disciplina: Informática Básica Professor: Eberton da Silva Marinho e-mail: ebertonsm@gmail.com
Leia maisIntrodução a Ciência de Dados Com Linguagem R
Introdução a Ciência de Dados Com Linguagem R Luis Paulo da Silva Carvalho luispscarvalho@gmail.com Adaptado de Material disponibilizado no SlideShare por Diego Cardoso Alves diegocardalves@gmail.com https://pt.slideshare.net/cardoso80/palestra-cincia-de-dados
Leia maisTécnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência
12º CONTECSI Conferência Internacional sobre Sistemas de Informação e Gestão de Tecnologia Técnicas de Big Data e Projeção de Medidas de Risco para de Negociação em Alta Frequência Alcides Carlos de Araújo
Leia maisBancos de Dados Orientados a Grafos. Mateus Lana e Thiago Santana
Bancos de Dados Orientados a Grafos Mateus Lana e Thiago Santana Conteúdo Grafos Definição; Representação; Conceitos. Bancos de dados orientados a grafos Introdução; Representação; Modelagem; Conceitos;
Leia maisPlataforma de Ciência de Dados. aplicada à Saúde. Pesquisador em Saúde Pública
Plataforma de Ciência de Dados aplicada à Saúde Prof. Dr. Marcel Pedroso Prof. Dr. Marcel Pedroso Pesquisador em Saúde Pública CIÊNCIA DE DADOS - DEFINIÇÃO OBJETIVO PRINCIPAL Pesquisar, desenvolver
Leia maisBCD29008 Banco de dados
BCD29008 Banco de dados Prof. Emerson Ribeiro de Mello Instituto Federal de Santa Catarina IFSC campus São José mello@ifsc.edu.br http://docente.ifsc.edu.br/mello/bcd 31 de julho de 2017 1/24 Apresentação
Leia maisInteligência Artificial. Prof. Ilaim Costa Jr.
Inteligência Artificial Prof. Ilaim Costa Jr. 4) Ciência da Computação 4) Ciência da Computação Exemplos de Aplicação da IA Matemática: demonstração
Leia maisCiências da Computação Disciplina:Computação Gráfica
Ciências da Computação Disciplina:Computação Gráfica Professora Andréia Freitas 2013 7 semestre Aula 06 MEMORIA, F. Design para a Internet. 1ª Edição. Rio de Janeiro: Campus, 2005. ALVES, W. P. Crie, anime
Leia maisCOMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações
COMPUTAÇÃO EM NUVEM E PROCESSAMENTO MASSIVO DE DADOS Conceitos, tecnologias e aplicações Jaqueline Joice Brito Slides em colaboração com Lucas de Carvalho Scabora Sumário Computação em Nuvem Definição
Leia maisSis i te t mas a O perac a i c o i nai a s um p ouco c d a a h is i tó t ria i. a... SO His i t s ó t r ó ic i o
Sistemas Operacionais um pouco da história... - Evolução dos SO s através do tempo - Novas técnicas não são assimiladas simultaneamente por todos - Década de 40, não existia SO - O programador é o faz
Leia maisIntrodução à Programação Aula 01. Prof. Max Santana Rolemberg Farias Colegiado de Engenharia de Computação
Introdução à Programação Aula 01 Prof. Max Santana Rolemberg Farias max.santana@univasf.edu.br Colegiado de Engenharia de Computação QUAL O OBJETIVO DA DISCIPLINA? Objetivo Tornar vocês (alunos) capazes
Leia maisSistemas Distribuídos
Faculdades SENAC Análise e Desenvolvimento de Sistemas 23 de fevereiro de 2011 Histórico Anos 50 - Sistemas Operacionais tipo Lote Aumentar a capacidade de processamento de programas Usuário ia ao computador
Leia maisDesigning Data Intensive Applications
Designing Data Intensive Applications Capítulo 1 Carmem Hara Aplicações Atuais Dados Processamento Problemas Volume Complexidade Velocidade de atualização Tecnologias SGBD: armazenamento Cache: resultados
Leia maisSistemas Distribuídos
Caracterização de Faculdades SENAC Análise e Desenvolvimento de Sistemas 24 de fevereiro de 2010 Caracterização de Histórico Anos 50 - Sistemas Operacionais tipo Lote Aumentar a capacidade de processamento
Leia maisSistemas de Informação Geográficos. Informação na Organização. O Valor da Informação. Sistemas de Informação Tradicionais. O Valor da Informação
Introdução Fundamentos e Histórico dos SIG Clodoveu Davis Geográficos Tópicos Informação Sistemas de informação Informação nas organizações Informação geográfica Histórico dos SIG Características e funcionalidade
Leia maisM V C, J S O N E X M L P R O F. M E. H É L I O E S P E R I D I Ã O
M V C, J S O N E X M L P R O F. M E. H É L I O E S P E R I D I Ã O A P L I C A Ç Õ E S M O N O L Í T I C A S Na época dos computares independentes um aplicativo era desenvolvido para ser usado em uma única
Leia maisA INTERNET DAS COISAS RODA EM LINUX
A INTERNET DAS COISAS RODA EM LINUX Plataformas criadas com Linux chegaram até os nossos carros com O CADILLAC DA GM, ASSIM COMO TESLA E TOYOTA, QUE JÁ CIRCULAM COM UM NÚMERO LIMITADO DE MODELOS. LINUX
Leia maisSão Paulo. August,
São Paulo August, 28 2018 O futuro do armazenamento dos dados não estruturados Com o Dell EMC Isilon e o ECS Allan Gomes Souza Sr. Systems Engineer, Dell EMC A transformação digital está revolucionando
Leia maisPROGRAMAÇÃO COMPLETA. Programa Avançado em Gestão da. Comunicação Digital
Programa Avançado em Gestão da Comunicação Digital PROGRAMAÇÃO COMPLETA Módulo 1: Gestão de marcas e negócios nas redes sociais - 12 horas 12 (segunda-feira), 14 (quarta-feira), 19 (segunda-feira) e 21
Leia maisPOLÍTICA DE PRIVACIDADE
POLÍTICA DE PRIVACIDADE Bem-vindo à política de privacidade dos recursos digitais da Cel-Lep Ensino de Idiomas S.A. Nossos sites e nossos aplicativos mobile podem ser utilizados por qualquer pessoa que
Leia maisInformática Simulado Prof. Márcio Hunecke
Escriturário Informática Simulado Prof. Márcio Hunecke Informática 1. Para gerar uma aplicação Java, são necessários alguns passos, conforme abaixo. I Compilar usando javac.exe II Salvar o arquivo com
Leia maisDesenvolvimento Web. Introdução Geral. Prof. Vicente Paulo de Camargo
Introdução Geral Prof. Vicente Paulo de Camargo Web e Internet A Internet é uma rede de computadores que conecta milhões de computadores Se comunicam através do protocolos específicos A Web é uma forma
Leia maisInteligência do Negócio
Inteligência do Negócio DENISE NEVES 2017 PROFA.DENISE@HOTMAIL.COM Inteligência do Negócio Objetivo Primeiro Bimestre Apresentar ao aluno as etapas de projeto de Business Intelligence. Introdução a Inteligência
Leia maisEscala planeta
agenda A CORRE Provedores @ Escala planeta Soluções T.I. rápidas CORRE O MUNDO ENCOLHEU A NÚVEM E A VIRTUALIZAÇÃO CONTEXTO DE UTILIZAÇÃO SIGLAS DO FUTURO CTT. Consigo por um futuro sustentável. a CORRE
Leia mais