O que é preciso para ser Cientista de Dados?

Documentos relacionados
Governança e Big Data. Celso Poderoso

PÓS-GRADUAÇÃO ANÁLISE DE BIG DATA

A Matemática como Serviço a Ciência da Computação. Prof. Dr. Carlos Eduardo de Barros Paes Coordenador do Curso de Ciência da Computação

BIG DATA,DATA SCIENCE e ANALYTICS aplicados ao MARKETING MANUAL DO CURSO ESPM. Rua Joaquim Távora, 1240 Vila Mariana São Paulo/SP.

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

BIG DATA Business Analytics Alexandre Massei

Ferramentas de front-end no mercado. Carlos Sousa, Elivelton Delfino, Jeann Pereira e Jorge Bastos

Sergio Adriano Blum Data Scientists

Big Data Open Source com Hadoop

Ferramenta para suporte à tomada de decisões Ayrton Silva

Big Data. A Nova Onda

BIG DATA. Jorge Rady de Almeida Jr. Escola Politécnica da U SP

Disciplinas Fundamentais Curso de Especialização em Administração Industrial (CEAI)

O que não pode faltar em seus projetos de BI. Neimar Chagas

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini /

BIG DATA INTRODUÇÃO. Humberto Sandmann

Azure Cognitive Services Sentimental Analysis X Power BI

Introdução. O que é um Banco de Dados (BD)?

Big Data: Conceitos, Recursos, Tendências e Oportunidades. Eduardo de Rezende Francisco. FGV-EAESP e ESPM.

ESCOLA SECUNDÁRIA MANUEL DA FONSECA, SANTIAGO DO CACÉM GRUPO DISCIPLINAR: 1.º Matemática PROGRAMA-A ANO: 10º ANO LECTIVO : 2008 /2009 p.

Sumário resumido. As origens da competição e do pensamento estratégico. Aplicação dos fundamentos da estratégia. Gestão competitiva do conhecimento

Estatística Descritiva (I)

Material Complementar - BI. Grinaldo Lopes de Oliveira Curso Superior de Tecnologia em Análise e Desenvolvimento de Sistemas

Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence. Business Intelligence

Avaliação. Diagnóstico. Gerente Apuração de dados. Sistema integrado. Tudo que você precisa está a sua disposição no ambiente virtual.

Uso do BIG DATA & Analytics para melhorar a qualidade das operações

Sistemas de Informação. Alberto Felipe Friderichs Barros

RELATÓRIO DO LABORATÓRIO 5 GEO-ESTATÍSTICA

Plano de Trabalho Docente Ensino Médio

Estatística Descritiva

Business Intelligence :

PENTAHO NO MERCADO DE TRABALHO. Soluções de Business Intelligence Ítalo Ruann

Cartografia Digital e Geoprocessamento

ANEXO 01 (Conteúdo do EXIN Administração - Campus Mossoró) 3ª SÉRIE

Tecnologias da Informação TI /2 Material de apoio ler bibliografia recomendada (Stair)

Estatística básica para Comunicadores

MBA Big Data e Inteligência de Mercado

MBA Analytics em Big Data

1 Introdução aos Métodos Estatísticos para Geografia 1

TECNOLOGIA DA INFORMAÇÃO EVER SANTORO

Fabrício Jailson Barth BandTec

Ciências exatas e da terra. Erivelton de Oliveira Alves. PROFESSOR(A) TITULAÇÃO GRANDE ÁREA (CNPq) * EMENTA

PLANO DE ENSINO E APRENDIZAGEM

Gartner Quadrante Mágico para Ferramentas de BI e Analytics. João G. Gutheil Outubro/2016

Soluções em Analytics. Soluções analíticas e preditivas na tomada de decisão dos mais diferenciados negócios.

SISTEMAS DE INFORMAÇÃO Prof. Esp. Fabiano Taguchi

Otimização de processos de trabalho na petroquímica com a infraestrutura de dados do PI System

Extração de Conhecimento & Mineração de Dados

Sistemas de Informação e Decisão. Douglas Farias Cordeiro

PÓS-GRADUAÇÃO LATO SENSU. Curso: Banco de Dados. Disciplina: Laboratório de Data Warehouse e Business Intelligence Professor: Fernando Zaidan

Tecnologia da Informação

Análise de dados para negócios. Cesaltina Pires

Elaborando uma plataforma de Big Data & Analytics 100% Open Source com apoio do Pentaho.

Motivação. Análise de Dados. BD x DW OLTP. Data Warehouse. Revisão Quais as diferenças entre as tecnologias de BD e DW? OLAP Modelos Multidimensionais

Banco de Dados Geográficos

#pragma FinanceBot. Tome decisões assistidas por um Bot* que se comunica com o Dynamics 365 (AX).

Fundamentos de sistemas de informação. Plano de ensino

Modelo Entidade Relacionamento

CURSO: ENGENHARIA DE PRODUÇÃO EMENTAS º PERÍODO

SÍNTESE PROJETO PEDAGÓGICO. Missão

MESTRADO PROFISSIONAL EM ECONOMIA. Ênfase Desenvolvimento Sustentável. vire aqui

Computadores, Algoritmos e Linguagens

Inteligência Artificial

ORGANIZANDO DADOS E INFORMAÇÕES: Bancos de Dados

Otimização de processos de trabalho na petroquímica com a infraestrutura de dados do PI System

CURSO: ADMINISTRAÇÃO

Informática, ética e sociedade

COMUNICAÇÃO, MERCADOS E TECNOLOGIA DA INFORMAÇÃO

ÓTICA, ONDAS E ELETROMAGNETISMO CIÊNCIAS E TECNOLOGIA DOS MATERIAIS

CURSO DE GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO MATRIZ CURRICULAR MATUTINO Fase N.

MATRIZ DE REFERÊNCIA PARA O ENEM 2009


A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE:

Apresentação... XI Introdução Dado, Informação e Conhecimento: A Base de Tudo Dado Informação Conhecimento...

Transcrição:

O que é preciso para ser Cientista de Dados?

Cássio Socal Cervo Administração de Empresas - PUCRS Ciências Contábeis - PUCRS MBA Gerenciamento de Projetos - FGV/Decision MBA Big Data e Analytics - FGVSP (em andamento) 18 anos de experiência em TI Gerente de Sistemas de BI e Modelagem no Sicredi Integrante do grupo de coordenadores do GUBI na SUCESU RS (Grupo de Usuários de Business Intelligence)

IBM 305 RAMAC Disk System Ele foi lançado em 1956 como parte do IBM 305 RAMAC, um computador desenvolvido pela IBM para o mercado corporativo, e podia armazenar impressionantes 5 MB em 50 discos com 24 polegadas (60 cm) de diâmetro.

IBM 305 RAMAC 1956

25 PETABYTES por dia

25 PETABYTES por dia

1,6 GBytes > 300

1,6 GBytes >50 aviões

Cenário Atual é complexo e com muitos dados

Cenário Atual é complexo e com muitos dados muitos muitos muitos muitos muitos muitos muitos muitos

Big Data Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que impactam os negócios no dia a dia. Definição da SAS

Big Data 3Vs Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que impactam os negócios no dia a dia. Definição da SAS

Big Data 3Vs Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que impactam os negócios no dia a dia. Definição da SAS

Big Data 3Vs Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que impactam os negócios no dia a dia. Definição da SAS

Big Data 3Vs Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que impactam os negócios no dia a dia. Definição da SAS

Big Data 3Vs Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que impactam os negócios no dia a dia. Definição da SAS 4V???

Big Data 3Vs Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que impactam os negócios no dia a dia. Definição da SAS 5V 4V???

Big Data 3Vs Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que impactam os negócios no dia a dia. Definição da SAS 5V 4V???

Big Data Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que P: Quem/como extrair valor de um 3Vs impactam os negócios no dia a dia. Definição da SAS Big Data? 5V 4V???

Big Data Big Data é o termo que descreve o imenso volume de dados estruturados e não estruturados que P: Quem/como extrair valor de um 3Vs impactam os negócios no dia a dia. Definição da SAS Big Data? 5V R: Cientista de Dados 4V???

Cientista de Dados Uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos e a curiosidade de explorar quais são os problemas que precisam ser resolvidos. Definição da SAS

Cientista de Dados Funções típicas dos cientistas de dados Uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos e a curiosidade de explorar quais são os problemas que precisam ser resolvidos. Definição da SAS Trabalhar grandes quantidades de dados, buscado padrões e tendências, para solucionar problemas de negócio

Cientista de Dados Funções típicas dos cientistas de dados Uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos e a curiosidade de explorar quais são os problemas que precisam ser resolvidos. Definição da SAS Trabalhar grandes quantidades de dados, buscado padrões e tendências, para solucionar problemas de negócio Conhecer o negócio e comunicar-se com toda a empresa

Cientista de Dados Funções típicas dos cientistas de dados Uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos e a curiosidade de explorar quais são os problemas que precisam ser resolvidos. Definição da SAS Trabalhar grandes quantidades de dados, buscado padrões e tendências, para solucionar problemas de negócio Conhecer o negócio e comunicar-se com toda a empresa Trabalhar com uma variedade de linguagens de programação e ferramentas tecnológicas, mantendo-se a par das técnicas analíticas como machine learning, text analytics, etc.

Cientista de Dados Funções típicas dos cientistas de dados Uma nova geração de especialistas analíticos que têm as habilidades técnicas para resolver problemas complexos e a curiosidade de explorar quais são os problemas que precisam ser resolvidos. Definição da SAS Trabalhar grandes quantidades de dados, buscado padrões e tendências, para solucionar problemas de negócio Conhecer o negócio e comunicar-se com toda a empresa Trabalhar com uma variedade de linguagens de programação e ferramentas tecnológicas, mantendo-se a par das técnicas analíticas como machine learning, text analytics, etc. Ter uma sólida compreensão de estatísticas, incluindo testes estatísticos e distribuições.

Cientista de Dados Descritivo Diagnóstico Preditivo Prescritivo O que aconteceu? Por que aconteceu? O que irá acontecer? Como podemos fazer isso acontecer? Atuação do Cientista de Dados

Cientista de Dados Descritivo Diagnóstico Preditivo Prescritivo O que aconteceu? Por que aconteceu? O que irá acontecer? Como podemos fazer isso acontecer? Atuação do Cientista de Dados Técnologia Negócio

Cientista de Dados

Cientista de Dados

O que é preciso para ser Cientista de Dados? O que é preciso para ser Cientista de Dados?

Cientista de Dados

Estatística Inferência Estatística Séries Temporais Geoanálise e Estatística Espacial

Estatística Inferência Estatística é um conjunto de técnicas que objetiva estudar uma população através de evidências fornecidas por uma amostra. Inferência Estatística Séries Temporais Geoanálise e Estatística Espacial Estatística básica (Variância, Desvio Padrão, Média, Moda, Mediana,...) Diagrama de Dispersão Regra empírica Distribuição Qui-Quadrado Tipos de testes de hipóteses Regressão linear simples Regressão linear multipla Analise de resíduos

Estatística Uma série temporal é um conjunto de observações ordenadas no tempo, não necessariamente igualmente espaçadas, que apresentam dependência serial, isto é, dependência entre instantes de tempo. Inferência Estatística Séries Temporais Geoanálise e Estatística Espacial Procedimentos estatísticos de previsão Análise de autocorrelação Redes neurais na previsão de séries temporais Estacionariedade de uma série Avaliação do desempenho das previsões

Estatística O objetivo das técnicas de Análise Espacial é descrever os padrões existentes nos dados espaciais e estabelecer, preferencialmente de forma quantitativa, os relacionamentos entre as diferentes variáveis geográficas. Inferência Estatística Séries Temporais Geoanálise e Estatística Espacial Análise Espacial e Geoprocessamento Análise de Eventos Pontuais Análise de Superfícies por Geoestatística Linear Análise de Superfícies por Geoestatística Indicadora Análise de Dados de Área

Cientista de Dados

Tecnologia Bancos de Dados Modelagem de dados Programação Ferramenta de Visualização Machine Learning Big Data

Tecnologia Bancos de Dados Modelagem de dados Programação Ferramenta de Visualização Funcionamento dos bancos de dados mais comuns (Oracle, SQL Server, Postgree, MySQL, Teradata,...) Banco de dados colunares Banco de dados in memory Estrutura de Data Warehouse Banco de Dados nosql (MongoDB, Cassandra) Machine Learning Big Data

Tecnologia Bancos de Dados Modelagem de dados Programação Ferramenta de Visualização Machine Learning Big Data Modelos conceitual Modelos Lógico Modelos Físicos Modelagem Multidimensional (Star Schema, Snow Flake ) Atributos Relacionamentos Data Mining Versionamento Historização Expurgo de dados

Tecnologia Bancos de Dados Modelagem de dados Programação Ferramenta de Visualização Machine Learning Lógica de Programação R (R studio) Python SQL Dplyr SAS Java C, C++, C# Big Data

T ecnologia Bancos de Dados Modelagem de dados Programação Ferramenta de Visualização Machine Learning GGPlot Tableau QlikView Pentaho Excel Power Pivot Microstrategy Oracle IBM Outros Big Data

T ecnologia Bancos de Dados Modelagem de dados Programação Ferramenta de Visualização Machine Learning Big Data Redes Neurais Artificiais (RNAs) Inteligência artificial Internet das Coisas (IoT) IBM Watson Analytics

T ecnologia Bancos de Dados Modelagem de dados Programação Ferramenta de Visualização Machine Learning Big Data Hadoop Spark MapReduce Appliance de BI

Cientista de Dados

Negócio Análise Setorial Análise Financeira Análise Mercadológica Pessoas Decisões Empresariais e Raciocínio Analítico

N egócio Análise Setorial Análise Financeira Análise Mercadológica Conhecer o setor Macroeconomia e Cenário político Leis e Normas Conhecer a cadeia produtiva Produtos, serviços e tecnologias Ciclo de vida setorial Pessoas Decisões Empresariais e Raciocínio Analítico

N egócio Análise Setorial Análise Financeira Análise Mercadológica Pessoas Decisões Empresariais e Raciocínio Analítico Estrutura de Capital das empresas CMV Controladoria Gerencial Gestão de Custos Margem de contribuição dos produtos Alavancagem financeira Mercado de Capitais Matemática Financeira

Negócio Análise Setorial Análise Financeira Análise Mercadológica Pessoas Decisões Empresariais e Raciocínio Analítico Segmentação Os produtos e o mercado Pontos de vendas Perfil dos meus consumidores Análise SWOT Preços Campanhas publicitárias Direcionadores Estratégicos

Negócio Análise Setorial Análise Financeira Análise Mercadológica Pessoas Decisões Empresariais e Raciocínio Analítico User Experience Praxeologia* Psicologia do consumo Gestão de Pessoas nas empresas

Negócio Análise Setorial Análise Financeira Análise Mercadológica Pessoas Decisões Empresariais e Raciocínio Analítico Teoria dos Jogos Teoria de jogos combinatórios Teoria das Restrições Processo decisórios nas organizações

O que é preciso para ser Cientista de Dados?

Cientista de Dados

Landscape Big Data 2016

Cientista de Dados Ter Brio

01001111 01100010 01110010 01101001 01100111 01100001 01100100 01101111

01001111 01100010 01110010 01101001 01100111 01100001 01100100 01101111 Obrigado * *Para quem não entende Binário Cássio Socal Cervo cassiocervo@gmail.com 51 9245.5984