E esse tal de Big Data?



Documentos relacionados
Como fazer contato com pessoas importantes para sua carreira?

Os desafios do Bradesco nas redes sociais

Imagens Mentais Por Alexandre Afonso

Se você está começando a explorar o marketing digita com o YouTube, então você, certamente, já notou o quão poderosos são os vídeos.

Como Criar seu produto digital

Autor: Marcelo Maia

Richard Uchôa C. Vasconcelos. CEO LEO Brasil

7 DICAS PARA UMA INDEXAÇÃO RELÂMPAGO


- Versão 1.0 Página 1

No E-book anterior 5 PASSOS PARA MUDAR SUA HISTÓRIA, foi passado. alguns exercícios onde é realizada uma análise da sua situação atual para

ebook Aprenda como aumentar o poder de captação do seu site. por Rodrigo Pereira Publicitário e CEO da Agência Retina Comunicação

Rio de Janeiro, 5 de junho de 2008

Compreendendo a dimensão de seu negócio digital

Desafio para a família

Hoje eu vou falar de um tema no qual eu tenho muito conforto em falar! Primeiro, porque a Wiki é uma empresa de serviços B2B. Segundo, porque a maior

Como obter excelentes. Resultados. no Marketing Digital. Aprenda a usar 3 metas matadoras. Publicação SEVEN - SPD

10 DICAS DE TECNOLOGIA PARA AUMENTAR SUA PRODUTIVIDADE NO TRABALHO

Tomada de Decisão uma arte a ser estudada Por: Arthur Diniz

Gestão da TI. Os custos escondidos da. Conheça os custos escondidos na gestão amadora da TI e pare de perder dinheiro.

Institucional. Realização. Patrocínio. Parceria

A Maquina de Vendas Online É Fraude, Reclame AQUI

MEU PLANO DE AÇÃO EM MASSA 7 PASSOS PARA UM INCRÍVEL 2015!

Web Analytics (Google analytics, Web trafic XITI, Coremetrics, etc.); Ferramentas de gestão de listas de s (Mailchimp, constant contact, etc.

Como escrever melhor em 5 passos simples

Introdução a Computação nas Nuvens

CRM estratégico criamos uma série de 05 artigos 100

5 Dicas Testadas para Você Produzir Mais na Era da Internet

Introdução. Bom, mas antes de começar, eu gostaria de me apresentar..

NOKIA. Em destaque LEE FEINBERG

PRIMEIRO ENCONTRO análise da sequência de. vendas de eben pagan

1. Quem somos nós? A AGI Soluções nasceu em Belo Horizonte (BH), com a simples missão de entregar serviços de TI de forma rápida e com alta qualidade.

Distribuidor de Mobilidade GUIA OUTSOURCING

A Tua Frase Poderosa. Coaches Com Clientes: Carisma. Joana Areias e José Fonseca

COMO GERAR LEADS SEM GASTAR NENHUM CENTAVO

e-commerce: 13 maneiras de aumentar a conversão

#10 PRODUZIR CONTEÚDO SUPER DICAS ATRATIVO DE PARA COMEÇAR A

EMBRATEL ENTREVISTA: Pietro Delai IDC Brasil DATA CENTER VIRTUAL - DCV

Claudinei Tavares da Silva Celular: (44)

CHAIR DRYDEN: Continuemos, vamos passar ao último tema do dia. Ainda temos 30 minutos.

Freelapro. Título: Como o Freelancer pode transformar a sua especialidade em um produto digital ganhando assim escala e ganhando mais tempo

10 Regras Para Ter Sucesso Com Negócios Digitais

BUSINESS INTELLIGENCE E DATA WAREHOUSE. Big Data Conceitos, Técnicas, Ferramentas e Arquitetura. tutorpro.com.br cetax.com.br

Hoje vou mostrar-te tudo o que precisas para rankear os teus vídeos no Google e no Youtube. Presta muita atenção. Se estas a ver este vídeo, já deves

SocialDB Social Digital Library

3 Dicas MATADORAS Para Escrever s Que VENDEM Imóveis

Problemas em vender? Veja algumas dicas rápidas e práticas para aumentar suas vendas usando marketing

SAP Customer Success Story Turismo Hotel Urbano. Hotel Urbano automatiza controle financeiro e internaliza contabilidade com SAP Business One

Meu resultado com SEO para Youtube

Aprenda a Tirar Vantagem da 2º Maior Ferramenta de Buscas do Mundo!

coleção Conversas #14 - outubro e r r Respostas perguntas para algumas que podem estar passando pela sua cabeça.

Antes de tudo... Obrigado!

Como ganhar dinheiro recomendando cursos.

JORNADA DE COMPRA. O que é e sua importância para a estratégia de Marketing Digital VECTOR

Vencedores! Ideias de Negócio. Passos para criar. Descubra como criar ideias com potencial lucrativo, alinhadas com suas habilidades pessoais!

Política de Privacidade do Serviço OurSound para Estabelecimentos

, como desenvolver o seu primeiro infoproduto

Redação do Site Inovação Tecnológica - 28/08/2009. Humanos aprimorados versus humanos comuns

SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2

Bate-papo: Uso do Scratch, uma nova linguagem de programação, no ensino fundamental - Web Currículo (25/05/2010)

GANHAR DINHEIRO COM SEU SITE OU BLOG

JOSÉ DE SOUZA CASTRO 1

Mudança de direção RODRIGO MENEZES - CATEGORIA MARKETERS

UWBP BLUEPRINT. Exclusivo Para Novos Membros Reynaldo Bosquet. Sugestões de Ações. Qual a sua meta mensal de Opt Ins?

3 Dicas Infalíveis Para Ganhar Dinheiro Online. Por Tiago Bastos, Criador da Máquina de Vendas Online

O que tem neste ebook?

OBJETIVO VISÃO GERAL SUAS ANOTAÇÕES

10 estratégias para gerar tráfego para seu blog

agência digital INSTITUCIONAL

COMO USAR OS VÍDEOS ONLINE PARA ALAVANCAR O MEU E-COMMERCE

Como usar o Facebook para catapultar sua lista de clientes?

COMUNICAÇÃO NA ERA DO BIG DATA

Teste sua empregabilidade

COMO CRIAR UM SITE DE NEGÓCIOS

Gerenciamento do ciclo de vida de um documento Simone de Abreu

RESUMO EXECUTIVO realmente significa estar informado? Como filtrar a informação certa do montante de informações triviais

Cenário Atual do Business Intelligence no Brasil. Pesquisa realizada por: Claudio Bonel

O sucesso de hoje não garante o sucesso de amanhã

1. A Google usa cabras para cortar a grama

5 Dicas de marketing para iniciantes

Veículo: Site Estilo Gestão RH Data: 03/09/2008

Como u&lizar as ferramentas de marke&ng digital no relacionamento com os cooperados

PARANÁ GOVERNO DO ESTADO

Produtividade e qualidade de vida - Cresça 10x mais rápido

Quando era menor de idade ficava pedindo aos meus pais para trabalhar, porém menor na época não tinha nada e precisei esperar mais alguns anos.

Você já teve a experiência de enviar um e, em pouco tempo, ver pedidos de orçamento e vendas sendo concretizadas?

internetsegura.fde.sp.gov.br

Palestrante: Thiago de Carvalho Moura

edirectory ios / Android Plataforma

Gestão e criação de conteúdo para mídias sociais

Política de Afiliados

MANUAL DO CIDADÃO. Para acessar a página do E-SIC clique no link do e-sic na página inicial do site (figura 1):

Lucas Liberato Coaching Coach de Inteligência Emocional lucasliberato.com.br


Transcrição:

E esse tal de Big Data? Hoje todas as pessoas que converso e que sabem que atuamos com Business Intelligence na Cetax Consultoria, me perguntam: E esse Big Data hein Marco? Eu vi até na Veja... está todo mundo falando disso. Vi que o Cientista de Dados é a profissão do futuro, Eu quero ser Cientista de Dados. Sempre penso muito antes de responder qualquer questão que foi colocada a mim, por isso vamos falar um pouco sobre tudo que cerca o assunto antes de grandes definições. Para quem nunca viu, abaixo está uma pesquisa feita no Google Trends (www.google.com/trends). O termo é pesquisado nos EUA desde sempre, mas em 2011 houve uma explosão de pesquisas tanto aqui, quanto lá na terra do Tio Sam. Publicação da Veja com Big Data na capa Aqui no Brasil vemos um crescimento constante a partir de 2012 e um pico em Maio/2013, exatamente quando a Veja publicou uma matéria sobre Big Data, não concordo com tudo que estava escrito na matéria, mas isso fica para um post a parte. 1

Outro gráfico interessante que coloquei abaixo é uma comparação entre as pesquisas sobre Big Data x Business Intelligence, essa pesquisa é Global. Podemos ver que o termo Business Intelligence reinou absoluto até o começo desse ano, onde o Big Data ultrapassou o termo. No gráfico abaixo uma comparação entre data warehouse x business Intelligence x big data. Em 2006, Business Intelligence passou Data Warehouse e em 2013, Big Data passou Business Intelligence. 2

1) Big Data = Grandes Dados ou Grandes Volumes de Dados? Alguns DBAs e programadores que conheço migraram seus currículos instantaneamente de Especialistas em Bancos de Dados para Especialistas em Big Data afinal de contas trabalhavam com bancos de dados de alguns Terabytes (TBs) e teoricamente isso é Big Data. Na verdade não é simplesmente o volume de dados que define o Big Data, o conceito é calcado em um pilar de 3 itens, algumas pessoas falam em 4, mas vamos aos 3 principais: Volume Volume dos Dados: Passamos a falar muito rápido de Gigabytes para Terabytes e agora estamos falando de Petabytes e outros volumes que não vou saber colocar aqui de cabeça para vocês. Hoje são contabilizados em média 12 Terabytes de Tweets diariamente, em 2012 foram gerados cerca de 2.834 Exabytes (que são milhões de Gigabytes) a previsão é que em 2020 se gerem anualmente 40.026 Exabytes de informações. Velocity Velocidade: Hoje para alguns negócios, 1 minuto pode ser muito tempo, detecção de fraudes, liberações de pagamentos, análises de dados médicos ou qualquer outra informação sensível a tempo. A maior parte dos projetos de DW/BI (Data Warehouse e Business Intelligence) ainda tem latência em D-1, ou seja, carregamos o dia anterior. Ainda acreditamos que essa solução se aplique a muitos negócios, porém, para algumas análises, quanto mais próximo do tempo real, maior pode ser o incremento de negócio. Variety Variedade: Big Data também poderia ser considerado como Any Data (qualquer dado), hoje temos capacidade de capturar e analisar dados estruturados e não estruturados, texto, sensores, navegação Web, áudio, vídeo, arquivos de logs, catracas, centrais de ar condicionado, entre outros. 3

Uma nova série de ferramentas está se tornando parte dos projetos, são as ferramentas de machine data, dados de máquina, quase qualquer aparelho eletrônico hoje em dia tem uma estrutura de dados ou programação, o ponto é que nem todos podem ser acessados (ainda..). 2) Qual o volume de dados gerado diariamente? O Facebook armazena, acessa e analisa mais de 50 petabytes de informações geradas pelos usuários, a cada mês são gerados mais de 700 milhões de minutos por mês. A cada minuto são feitos uploads de 48 horas de vídeos no Youtube, ou seja, nunca ninguém conseguirá assistir todos os vídeos do Youtube. Diariamente mais de 500 milhões de mensagens são enviadas pelo Twitter, com uma média de 5700 TPS (Twittes per Second ou Mensagens por Segundo), o recorde é de 143.199 TPS. O Google processa diariamente mais de 3 bilhões de pesquisas em todo o mundo, sendo desse total 15% totalmente inéditas. Seu "motor" de pesquisa rastreia 20 bilhões de sites diariamente, armazenando 100 petabytes de informação. Sem contar todas as informações que as companhias geram diariamente, sejam elas estruturadas ou não. 3) O que são informações estruturas e não estruturadas? Consideramos: Informações estruturadas - aquelas que possuem algum padrão ou formato que pode ser usado na sua leitura e extração dos dados. Dados de bancos de dados, sistemas legados, arquivos texto (sejam csv, txt ou XML). Informações não estruturadas não possuem um formato padronizado para leitura, podem ser arquivos Word, Páginas de Internet/Intranet, Vídeos, áudios, entre outros. 4) Quais ferramentas? não está fácil escolher.. Ok, já sabemos o que é o termo, temos uma ideia do que ele faz, mas qual ferramenta devo escolher? Não quero desanimar ninguém, mas olhando abaixo devem ter mais de umas 100 marcas diferentes em categorias de softwares diferentes também. 4

Deixei os Twitters dos responsáveis pela figura (Matt Turck e Shivon Zilis) que tiveram tempo e coragem para montar o gráfico acima. Em Maio/2013 fiz 2 cursos em Chicago-USA no TDWI (www.tdwi.org) com o Professor Krish Krishnan (@datagenius), realmente foram muito bom, um curso bem completo sobre Big Data e outro específico e mais focado no Hadoop. Gostamos muito do Hadoop, nos parece ser uma suíte muito completa e estamos colocando nossas fichas nele, mas claro, não colocamos todas as fichas na mesma aposta, a não ser que eu tenha certeza para mandar o All-In como fazemos no pôquer. Como essa aposta não é pôquer e tenho um quadro com cerca de 100 tecnologias diferentes, apostamos uma quantidade de fichas no Hadoop, mas guardamos fichas para mais apostas. Existem muitas ferramentas, muitos fabricantes, muitas a definições a acontecer, as perguntas que nos fazem: Mas qual devo estudar? 5

Qual é a melhor do mercado? Qual a mais usada? Todo esse mercado ainda é muito recente, estamos falando de produtos comerciais que tem 2 ou 3 anos no máximo. Muitas definições estão acontecendo nesse momento. Sabemos que o mercado americano gera a maior parte das tendências de tecnologia mundialmente e pelo que vimos, nem eles ainda tem uma ferramenta ou uma solução principal, ainda está tudo muito fragmentado. 5) E o meu Data Warehouse, o que acontecerá? Ainda segundo o Professor Krish Krishnan, os dados oriundos do Big Data serão complementares ao Data Warehouse existente, visto que ainda existirão sistemas legados com dados estruturados e bancos de dados, da maneira que fazemos BI hoje. O grande desafio será integrar os dados das estratégias de BI com as de Big Data, analisar separadamente as informações não é complexo, medir Tweets, Likes do Facebook ou qualquer outro dado não estruturado individualmente. Passará a ser um grande desafio quando cruzarmos esses dados com Notas Fiscais, Pedidos, Entregas, etc. Agradecimentos Pessoal, agradeço por conseguirem chegar até aqui! Mais artigos estão chegando: Gerenciamento de Projetos de BI. Cientista de Dados. Hadoop Obrigado, Marco Garcia mgarcia@cetax.com.br http://cetax.com.br 6