Visualização de Dados

Documentos relacionados
Visualização de dados

ANEXO I BICICLETA ESCOLAR. Modelo de ofício para adesão à ata de registro de preços (GRUPO 1)

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

O Programa Finep Startup. São Paulo, 01 de Agosto de 2018

Mortos e Acidentes por Unidade Federativa

Nota de Acompanhamento de Beneficiários Edição: Nº Data base: Outubro de 2018

Nova Pesquisa Nacional de Ataques a Bancos

MINISTÉRIO DO TRABALHO E EMPREGO CONCURSO PÚBLICO PARA PROVIMENTO DE VAGAS EM CARGOS DE NÍVEL SUPERIOR E DE NÍVEL MÉDIO DEMANDA DE CANDIDATOS POR VAGA

Programa Nacional de Suplementação de Vitamina A Divulgação dos resultados parciais do programa em 2013.

Racionamento de água. Abril/2017

Tipo de Frete Estado Capital Peso do pedido (até) Frete capital Frete interior 1 AC RIO BRANCO 5,00 57,23 65,81 1 AC RIO BRANCO 10,00 73,49 84,51 1

TABELA I - OPERAÇÕES REALIZADAS PELAS DISTRIBUIDORAS

Incubadoras em Implantação. Distribuição regional NORTE AM 01 AP 02 PA 03 RO 01 TO 01 TOTAL 08

Consed Sistema de Avaliação dos Estados Votação dos cenários. edulab21 Núcleo de Ciência pela Educação IAS/INSPER

ANÁLISE DO COMPORTAMENTO DA RECEITA DO SETOR DE SERVIÇOS (FEVEREIRO- 2015)

Candidatos por Vaga Processo Seletivo Simplificado / 2008: IBGE - INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA - ANALISTA CENSITÁRIO

INFORME SARGSUS. Situação da Alimentação do Relatório de Gestão Ano Informações sobre Plano e Programação Anual de Saúde

CAF: CONTAG: CPR: FETRAF: NPT: ONG: PNCF: SAC: SAT: SIB: SIC: SQD: UTE:

Diesel ficou mais caro em abril, mostra levantamento da Ticket Log

OBSERVATÓRIO DO TURISMO E EVENTOS DE BONITO-MS FEVEREIRO DESEMPENHO DA HOTELARIA DE BONITO-MS

OBSERVATÓRIO DO TURISMO E EVENTOS DE BONITO-MS MARÇO DESEMPENHO DA HOTELARIA DE BONITO-MS. Taxa de Ocupação dos hotéis Bonito-MS 2019

Observatório do Turismo de Bonito-MS Boletim Informativo Outubro 2015

Nota de Acompanhamento de Beneficiários Edição: Nº Data base: Novembro de 2018

Nota de Acompanhamento de Beneficiários Edição: Nº Data base: Setembro de 2018

OBSERVATÓRIO DO TURISMO E EVENTOS DE BONITO-MS MAIO DESEMPENHO DA HOTELARIA DE BONITO-MS. Taxa de Ocupação dos hotéis de Bonito-MS Ano 2019

Evolução das estatísticas de acidentes por Estado

Nota de Acompanhamento de Beneficiários Edição: Nº Data base: Julho de 2016

Observatório do Turismo de Bonito-MS Boletim Informativo Setembro 2015

ANÁLISE DO COMPORTAMENTO DA RECEITA DE SERVIÇOS (DEZEMBRO- 2015)

Áreas de negócio e de assistência técnica em todas UF

OBSERVATÓRIO DO TURISMO E EVENTOS DE BONITO-MS AGOSTO DESEMPENHO DA HOTELARIA DE BONITO-MS. Taxa de Ocupação dos hotéis de Bonito-MS Ano 2018

OBSERVATÓRIO DO TURISMO E EVENTOS DE BONITO-MS JULHO DESEMPENHO DA HOTELARIA DE BONITO-MS. Taxa de Ocupação dos hotéis de Bonito-MS Ano 2018

Pesquisa Mensal de Serviços - PMS

SUBSÍDIOS PARA A AÇÃO SINDICAL COMPORTAMENTO DO EMPREGO METALÚRGICO MARÇO DE 2011

Levantamento da Ticket Log mostra que o etanol baixou 2,18% em agosto, o que se refletiu nos postos de quase todo o País

Nota de Acompanhamento de Beneficiários Edição: Nº Data base: Janeiro de 2018

Casos de FHD Óbitos e Taxa de letalidade

OBSERVATÓRIO DO TURISMO E EVENTOS DE BONITO-MS OUTUBRO DESEMPENHO DA HOTELARIA DE BONITO-MS. Taxa de Ocupação dos hotéis de Bonito-MS Ano 2018

Movimentação das Empresas do Segmento Julho 2011

OBSERVATÓRIO DO TURISMO E EVENTOS DE BONITO-MS DEZEMBRO DESEMPENHO DA HOTELARIA DE BONITO-MS

Índice de Confiança do Empresário da Pequena e Média Indústria São Paulo. Confiança do Pequeno Industrial de São Paulo e do Brasil 36,9 27,3.

AGÊNCIA NACIONAL DE TELECOMUNICAÇÕES Acessos Quantidade de Acessos no Brasil Dividido por Tecnologia/Velocidade/UF

Movimentação das Empresas do Segmento Abril 2011

As cinco visualizações de dados mais influentes de todos os tempos

Levantamento Sistemático da Produção Agrícola

Guia EduTec. Uma ferramenta de gestão para os Estados brasileiros

DEMANDA DE CANDIDATOS POR CARGO / UF NÍVEL SUPERIOR

Nota de Acompanhamento de Beneficiários Edição: Nº Data base: Dezembro de 2017

OBSERVATÓRIO DO TURISMO E EVENTOS DE BONITO-MS JUNHO DESEMPENHO DA HOTELARIA DE BONITO-MS. Taxa de ocupação dos hotéis Bonito-MS 2018

Anuário Estatístico do Turismo de Bonito

Pesquisa de Egressos da UnB na RAIS 2013

ANÁLISE DO VOLUME DE VENDAS DO COMÉRCIO VAREJISTA JAN/2015

Levantamento da Ticket Log mostra disparada nos preços dos combustíveis

Litro do diesel registra pequena redução e chega a R$ 3,49 na média nacional, segundo levantamento da Ticket Log

ANÁLISE DO COMPORTAMENTO DA RECEITA DO SETOR DE SERVIÇOS (JANEIRO- 2015)

DEMONSTRATIVO DE CÁLCULO DE APOSENTADORIA - FORMAÇÃO DE CAPITAL E ESGOTAMENTO DAS CONTRIBUIÇÕES

Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua. Rio de Janeiro, 23 de fevereiro de 2017

IMPACTO DO PISO NOS ESTADOS E MUNICÍPIOS SESSÃO ESPECIAL NA COMISSÃO DE EDUCAÇÃO DA CAMARA DOS DEPUTADOS BRASÍLIA

Pendências de Envio do Relatório de Gestão Municipal-2013 aos CMS

CAF: CONTAG: CPR: FETRAF: NPT: ONG: PNCF: SAC: SAT: SIB: SIC: SQD: UTE:

SOLUÇÕES PARA NOVAS EXIGÊNCIAS FISCAIS

CIDE Combustíveis e a Federação

MINISTÉRIO DA EDUCAÇÃO

O DESEMPENHO DO ESPÍRITO SANTO NO PROGRAMA INTERNACIONAL DE AVALIAÇÃO DE ESTUDANTES (PISA) EM 2009

Programa Nacional de Suplementação de Vitamina A Divulgação dos resultados parciais do programa em 2013.

2017. Serviço Brasileiro de Apoio às Micro e Pequenas Empresas Sebrae

8ª Pesquisa Nacional de Ataques a Bancos (2014)

PROCESSO SELETIVO UFAL SiSU GERAL (5.168 vagas ofertadas)

Anuário Estatístico do Turismo de Bonito

Índice de Confiança do Empresário São Paulo Descontentamento do empresário industrial diminui em outubro

Movimentação das Empresas do Segmento Junho 2010

O que é preciso para ser Cientista de Dados?

- Programa Água para a Vida -

Pensando na Aposentadoria. Janeiro/2017

Indenizações Pagas Quantidades

Indicadores do Mercado de Meios Eletrônicos de Pagamento

agenciaweb4br.com.br

SITUAÇÃO EPIDEMIOLÓGICA E ENFRENTAMENTO DA DENGUE, CHIKUNGUNYA E ZIKA SECRETARIA DE VIGILÂNCIA EM SAÚDE BRASÍLIA, 26 DE JANEIRO DE 2017

Rio de Janeiro, 18/05/2017. Mercado de Trabalho Brasileiro 1º trimestre de 2017

Oportunidades na Ciência da Computação: Uma visão na perspectiva de Ciência de Dados

SESI EM NÚMEROS Um retrato do hoje

Índice de Confiança do Empresário da Pequena e Média Indústria São Paulo. Empresário da pequena indústria segue confiante em abril

Programa de Arrendamento Residencial (PAR): Análise da Atuação nas Unidades Federativas

DADOS ESTATÍSTICOS DE PRETENDENTES - BRASIL TOTAL % 1. Total de Pretendentes cadastrados: ,00%

MERCADO BRASILEIRO DE SEGUROS AUXÍLIO FUNERAL

Pesquisa Nacional por Amostra de Domicílios Contínua PNAD Contínua. Mercado de Trabalho Brasileiro 1º trimestre de de maio de 2018

COLETIVA DE IMPRENSA. Gilberto Duarte de Abreu Filho Presidente. São Paulo, 25 de Julho de 2018

PROINFÂNCIA. Programa Nacional de Reestruturação e Aquisição de Equipamentos para a Rede Escolar Pública de Educação Infantil

2018. Serviço Brasileiro de Apoio às Micro e Pequenas Empresas Sebrae

RESOLUÇÃO CFESS nº 516 /2007 de 28 de dezembro de 2007

LSPA. Levantamento Sistemático da Produção Agrícola. Dezembro de Pesquisa mensal de previsão e acompanhamento das safras agrícolas no ano civil

Conselho Federal de Medicina. Termo de Homologação do Pregão Eletrônico Nº 00043/2017 (SRP)

ÍNDICE DE TRANSPARÊNCIA DO CONTENCIOSO ADMINISTRATIVO TRIBUTÁRIO DOS ESTADOS BRASILEIROS

FATORES DE SUSTENTAÇÃO DA PRODUÇÃO DE MILHO NO BRASIL

Indicadores 3 e 4 do contrato de gestão Relatório de setembro de 2014

Evolução da abordagem em clusters A experiência do Estado de Minas Gerais - Brasil

Índice de Confiança do Empresário São Paulo Confiança do empresário paulista volta a recuar e atinge pior nível da série

Gestão da Qualidade da Banda Larga

Transcrição:

Visualização de Dados História e fundamentos Prof. Walmes Zeviani walmes@ufpr.br Laboratório de Estatística e Geoinformação Departamento de Estatística Universidade Federal do Paraná 3 de abril de 2019

Por que Visualização de Dados é tão importante? Walmes Zeviani UFPR Visualização de Dados 2

O poder de ver além Tabela 1. Os 4 pares de variáveis do quarteto de Ancombe. x 1 y 1 x 2 y 2 x 3 y 3 x 4 y 4 10 8.04 10 9.14 10 7.46 8 6.58 8 6.95 8 8.14 8 6.77 8 5.76 13 7.58 13 8.74 13 12.74 8 7.71 9 8.81 9 8.77 9 7.11 8 8.84 11 8.33 11 9.26 11 7.81 8 8.47 14 9.96 14 8.10 14 8.84 8 7.04 6 7.24 6 6.13 6 6.08 8 5.25 4 4.26 4 3.10 4 5.39 19 12.50 12 10.84 12 9.13 12 8.15 8 5.56 7 4.82 7 7.26 7 6.42 8 7.91 5 5.68 5 4.74 5 5.73 8 6.89 Walmes Zeviani UFPR Visualização de Dados 3

O poder de ver além Tabela 2. Resumo do ajuste da regressão linear simples com cada par de variáveis do quarteto de Anscombe. ˆβ 0 ˆβ1 R 2 Valor p 1 3.00 0.50 0.67 0.0022 2 3.00 0.50 0.67 0.0022 3 3.00 0.50 0.67 0.0022 4 3.00 0.50 0.67 0.0022 Walmes Zeviani UFPR Visualização de Dados 4

O poder de ver além 1 2 Valores de y 12 8 4 12 3 4 8 4 5 10 15 5 10 15 Valores de x Figura 1. O quarteto de Anscombe em um diagrama de dispersão. Walmes Zeviani UFPR Visualização de Dados 5

Rápida percepção, rápida reação Saia desta sala. Vire à direita e caminhe 3 metros até o final do corredor, onde você estará em frente a uma grande sala de conferências. Vire à esquerda e caminhe mais 3 metros até chegar ao final do corredor. À sua esquerda estará um alarme de incêndio, perto do elevador. À sua direita, no final do corredor, há uma escadaria. Não vá ao elevador. Vire à direita e caminhe mais 4 metros até o final do corredor, vire à esquerda e desça pelas escadas. Desça dois lances de escadas e saia do prédio na porta na parte inferior das escadas. Figura 2. Plano de rota de fuga. Adapatado de Berinato (2016). Walmes Zeviani UFPR Visualização de Dados 6

Rápida percepção, rápida reação Figura 3. Mapa de rota de fuga. Adapatado de Berinato (2016). Walmes Zeviani UFPR Visualização de Dados 7

Inspiração O maior valor de um gráfico é quando ele nos força a perceber o que nós jamais esperávamos ver. John Tukey Estatístico Visualizações dão a você respostas para questões que você não sabia que tinha. Ben Schneiderman Cientista da Computação Walmes Zeviani UFPR Visualização de Dados 8

Inspiração Visualizações funcionam como uma fogueira na qual nos reunimos para contar histórias. Al Shalloway CEO Net Objectives A maioria de nós precisa ouvir a música para entender o quão bonita ela é. No entanto, é assim que apresentamos estatísticas: nós apenas mostramos as notas, nós não tocamos a música. Hans Rosling Walmes Zeviani UFPR Visualização de Dados 9

A Era do Big Data & Data Science Walmes Zeviani UFPR Visualização de Dados 10

O fenônemo Big Data Big data: conjuntos de dados grandes ou complexos na qual as abordagens tradicionais de processamento são inadequadas/impraticáveis. Desafios: captura, armazenamento, beneficiamento, consulta, transferência, visualização, análise e privacidade. Figura 4. Os 8 V s do Big Data. Walmes Zeviani UFPR Visualização de Dados 11

O fenônemo Big Data Figura 5. Quanto de dados é produzido a cada minuto em diferentes serviços. Fonte: www.socialmediatoday.com. Walmes Zeviani UFPR Visualização de Dados 12

O fenônemo Big Data Algumas estatísticas Mais de 3.7 bilhões de pessoas usam internet. a Mais da metade de nossas buscas são feitas do smartphone. IoT: 17 bilhões de dispositivos conectados em 2018. b a www.forbes.com b iot-analytics.com Figura 6. Infográfico sobre fluxo de dados. Walmes Zeviani UFPR Visualização de Dados 13

O fenônemo Big Data Comunicação A arte da comunição é a linguagem da linderança. James Humes Acesso/exame dos dados de forma visualmente disgestível. Visualização é a forma mais rápida de transformar dados em informação acionável. 1 Visualização permite encontrar oportunidades nos dados. Gráficos bem elaborados são uma forma simples e poderosa de reconhecimento de padrões, extração de insights e comunicação. 1 www.tableau.com Walmes Zeviani UFPR Visualização de Dados 14

Objetivos Importância da visualização de dados. História com as principais contribuições. Fundamentos de visualização de dados. Tipo de visualização. Variáveis visuais. Principais competências. Galeria de gráficos. Recursos computacionais. Recomendações. Walmes Zeviani UFPR Visualização de Dados 15

Conteúdo previsto 1. Fundamentos sobre visualização de dados (hoje). 2. Gráficos (próxima). Almanaque de gráficos. Qual usar em cada caso. Anatomia dos gráficos. Características, prós e contras. O que você deve evitar. 3. Confeção de gráficos (próxima). Recursos/softwares para fazer gráficos. Um panorâma de recursos do software R. Exemplos de gráficos estáticos e interativos. Tutorial sobre gráficos com o ggplot2. Walmes Zeviani UFPR Visualização de Dados 16

Uma breve passagem pela história da Visualização de Dados Walmes Zeviani UFPR Visualização de Dados 17

Linha do tempo da Visualização de Dados 1786 - Willian Playfair 1914 - Willard Brinton Graphic methods for presenting facts Visualização para negócios. Gráfico de linhas, barras, setores. 1858 - Florence Nightingale Diagamas coxcomb do exército britânico. 1983 - Edward Tufte The visual display of quantitative information Rigor estatístico, clareza, design. 1967 - Jacques Bertin Sémiologie graphique Teoria da vis. e 7 variáveis visuais. 1986 - Jock Mackinlay Tese sobre J. Bertin para a era da digital. 2010 - Ronald Rensink Percepção Lei de Weber Efetividade gráfica. 1900 2000 1854 - John Snow 1861 - Charles Minard Exército de Napoleão marcha para Rússia. Mapeamento e descoberta da fonte de cólera. 1952 - Mary Eleanor Spear Charting statistics Boas práticas no Governo Americano. 1970s - John Tukey Vis. com computadores e vis. exploratória e confirmatória. Hoje Recursos para construção de vis. Vis. interativa e em tempo real Dashboards 1999 - Leland Wilkinson The gammar of graphics Gramática concisa para repres. componentes gráficos. 1984 - W. Cleveland & R. McGill Medir percepção gráfica e vis. efetiva. Figura 7. A linha do tempo da visualização de dados. Fonte: o autor. Walmes Zeviani UFPR Visualização de Dados 18

Linha do tempo da Visualização de Dados Figura 8. William Playfair (esq.), gráfico de barras (meio) e gráfico de linhas (dir.). 1786: Willian Playfair produziu os primeiros gráficos de linhas, barras e setores. Walmes Zeviani UFPR Visualização de Dados 19

Linha do tempo da Visualização de Dados Figura 9. John Snow e as ocorrências de óbito por cólera em Londres, 1854. 1854: John Snow (médico britânico) descobre a fonte transmissora de cólera com um mapa registrou a coordenada das ocorrências dos óbitos. Walmes Zeviani UFPR Visualização de Dados 20

Linha do tempo da Visualização de Dados Figura 10. Florence Nightingale (esq.) e os diagramas de coxcomb (dir.). 1858: Florence Nightingale (enfermeira britânica) produziu o coxcomb diagrams que mostrou as baixas do exército britânico na Guerra da Criméia. Walmes Zeviani UFPR Visualização de Dados 21

Linha do tempo da Visualização de Dados Figura 11. Charles Minard (esq.) e o diagrama retratando as baixas da investida de Napoleão sobre o território da Rússia (dir.). 1861: Charles Minard (engenheiro civil francês) retratou a dizimação do exército de Napoleão durante sua condenada campanha contra a Rússia. Walmes Zeviani UFPR Visualização de Dados 22

Linha do tempo da Visualização de Dados Figura 12. Páginas de Graphic Methods for presenting Facts de W. Brinton. 1914: Willard Brinton (engenheiro americano) publicou o primeiro livro de visualização para negócios. Walmes Zeviani UFPR Visualização de Dados 23

Linha do tempo da Visualização de Dados Figura 13. Capa e dobras de Pratical Charting Statistics de E. Spear. 1952: Mary Eleanor Spear publicou seu livro contendo boas práticas em construção de gráficos baseadas em décadas de serviço no governo Americano. Walmes Zeviani UFPR Visualização de Dados 24

Linha do tempo da Visualização de Dados Figura 14. Jacques Bertin (esq.) e sua obra Sémiologie Graphique em dois idiomas (meio, dir.). 1967: Jacques Bertin (cartógrafo francês) publicou o primeiro livro sobre teoria da visualização. Walmes Zeviani UFPR Visualização de Dados 25

Linha do tempo da Visualização de Dados Figura 15. As 7 variáveis visuais definidas por Bertin. Descreveu 7 variáveis visuais: posição, tamanho, forma, saturação, cor, orientação e textura. 2 Definiu 2 princípios: a expressividade e a efetividade da visualização. Walmes Zeviani UFPR Visualização de Dados 26

Linha do tempo da Visualização de Dados Figura 16. John Tukey ao computador da época (esq.) e a capa de seu livro Exploratory data analysis (dir.). 1970s: John Tukey (matemático americano) foi pioneiro no uso de computadores para visualização e popularizou o conceito de visualização exploratória e confirmatória. Walmes Zeviani UFPR Visualização de Dados 27

Linha do tempo da Visualização de Dados Figura 17. Edward Tufte (esq.) e seu livro The visual display of quantitative information (dir.). 1983: Edward Tufte publicou em seu livro formas de combinar rigor estatístico com clareza e princípios de design gráfico. Walmes Zeviani UFPR Visualização de Dados 28

Linha do tempo da Visualização de Dados Figura 18. Jock Mackinlay (esq.) e a área de trabalho do Tableau (dir.). 1986: Jock Mackinlay publicou sua Tese de PhD que levou o trabalho de Jacques Bertin para era digital. Hoje Mackinlay é vice presidente de P&D do Tableau. Walmes Zeviani UFPR Visualização de Dados 29

Linha do tempo da Visualização de Dados Figura 19. Leland Wilkinson (esq.) autor de The grammar of graphics (meio) e as camadas da gramática de gráficos que são usadas no ggplot2. 1999: Leland Wilkinson estabeleu uma grámatica concisa para descrever os componentes de um gráfico. Walmes Zeviani UFPR Visualização de Dados 30

Linha do tempo da Visualização de Dados 1990s 2000: ramificações de abordagem para visualização. 2010s Orientadas aos computadores. Orientadas ao design. Orientados à comunidade científica. Orientados aos negócios. softwares acessíveis + disposição de dados democratiza a prática da visualização. Cria-se uma atmosfera propícia para experiências. Visualização não é mais uma província de experts, é um fenômeno. Walmes Zeviani UFPR Visualização de Dados 31

Linha do tempo da Visualização de Dados Hoje Recursos/ferramentas evoluem. Representações gráficas mais apropriadas são desenvolvidas. Novas dimensões: animação, reatividade e interatividade. Velocidade e acesso: Atualização em tempo real. Relatórios web dinâmicos. Smart things: smartwatch, apps esportivos. Monitoramento com dashboards. Walmes Zeviani UFPR Visualização de Dados 32

Linha do tempo da Visualização de Dados Figura 20. Exemplo de dashboard produzido com o software Power BI. Walmes Zeviani UFPR Visualização de Dados 33

Linha do tempo da Visualização de Dados Figura 21. Exemplo de dashboard feito com o R usando o pacote shiny. Walmes Zeviani UFPR Visualização de Dados 34

O que vimos até aqui A história da visualização de dados em fases: 1. As contribuições pontuais. 2. Os manuais/livros. 3. Os estudos aprofundados. 4. A informatização. 5. Hoje volume, velocidade, variedade: Big Data. Walmes Zeviani UFPR Visualização de Dados 35

Visualização de Dados Walmes Zeviani UFPR Visualização de Dados 36

Definição Visualização de dados A representação e apresentação de dados que exploram nossa habilidade de percepção visual com a finalidade de aumentar a compreensão (KIRK, 2012). Walmes Zeviani UFPR Visualização de Dados 37

Aspectos da definição Representação: como retratar conceitos e dados, a escolha das formas geométricas, variáveis visuais, princípios de design. Apresentação: como comunicar-se usando a visualização. Percepção visual: como percebemos e processamos informação visual. Compreensão: como maximizar a eficiência e efetividade da informação consumida, ter impacto e integridade. Walmes Zeviani UFPR Visualização de Dados 38

Definição alternativa Walmes Zeviani UFPR Visualização de Dados 39

Tipos de visualização Segundo Berinato (2016), dois aspectos determinam o tipo de visualização: 1. A informação é conceitual ou orientada a dados? 2. Está se declarando ou explorando algo? Walmes Zeviani UFPR Visualização de Dados 40

Conceitual ou orientada a dados? Tabela 3. A visualização de dados conforme o que é representado (BERINATO, 2016). Conceitual Orientada a dados Foco Ideias, esquemas. Estatística, padrões. Objetivos Simplificar, ilustrar. Informar, esclarecer, testemunhar. Walmes Zeviani UFPR Visualização de Dados 41

Declarativo ou exploratório? Tabela 4. A visualização de dados do ponto de vista de como é feita (BERINATO, 2016). Declarativo Exploratório Foco Documentar, planejar, Prototipação, iteração, estruturar. interação, automação. Objetivos Fazer afirmações, organizar. Fazer descobertas, afunilar hipóteses. Walmes Zeviani UFPR Visualização de Dados 42

Os 4 tipos de visualização Figura 22. Os 4 tipos de visualização que resultam das respostas às duas perguntas. Fonte: adaptado de Berinato (2016). Walmes Zeviani UFPR Visualização de Dados 43

Os 4 tipos de visualização Figura 23. Visualização com relação ao foco. Fonte: adaptado de Berinato (2016). Walmes Zeviani UFPR Visualização de Dados 44

Os 4 tipos de visualização Figura 24. Visualização com relação às habilidades. Fonte: adaptado de Berinato (2016). Walmes Zeviani UFPR Visualização de Dados 45

Os 4 tipos de visualização Figura 25. Visualização com relação ao tipo de mídia. Fonte: adaptado de Berinato (2016). Walmes Zeviani UFPR Visualização de Dados 46

Os 4 tipos de visualização Figura 26. Resumo dos aspectos dos 4 tipos de visualização. Fonte: adaptado de Berinato (2016). Walmes Zeviani UFPR Visualização de Dados 47

Os 4 tipos de visualização Figura 27. Visualização com relação ao tipo de análise exploratória. Fonte: adaptado de Berinato (2016). Walmes Zeviani UFPR Visualização de Dados 48

Os 4 tipos de visualização Figura 28. Visualização com relação ao fluxo. Fonte: adaptado de Berinato (2016). Walmes Zeviani UFPR Visualização de Dados 49

Visualização conceitual Figura 29. O processo de correção de manuscrito para submissão entre orientado e orientador. Fonte: phdcomics.com. Walmes Zeviani UFPR Visualização de Dados 50

Visualização conceitual Figura 30. O sentimento de ser confundido com um aluno de doutorado em diferentes fases da vida acadêmica. Fonte: phdcomics.com. Walmes Zeviani UFPR Visualização de Dados 51

Visualização conceitual Figura 31. Árvore de organização dos algorítmos de machine learning. Fonte: jixta.files.wordpress.com. Walmes Zeviani UFPR Visualização de Dados 52

Visualização conceitual Figura 32. Ilustração baseada em diagramas de Venn sobre a composição de habilidades de um cientista de dados (esq.) e o fluxo de ações em projetos de ciência de dados. Fonte: o autor. Visite <https://github.com/walmes/tikz>. Walmes Zeviani UFPR Visualização de Dados 53

Visualização conceitual Figura 33. Árvore de organização das disciplinas da Especialização em Data Science & Big Data UFPR. Acesse <http://dsbd.leg.ufpr.br/>. Fonte: o autor. Visite <https://github.com/walmes/tikz>. Walmes Zeviani UFPR Visualização de Dados 54

Visualização orientada a dados vegetative flower bud blossom 10.0 Number of cotton balls 10 5 10 5 fig cotton boll 0 0.250.50.75 1 0 0.250.50.75 1 Defoliation 0 0.250.50.75 1 Sample variance 7.5 5.0 2.5 0.0 n = 5 0.0 2.5 5.0 7.5 10.0 Sample mean Figura 34. O número de capulhos do algodão em função do nível de desfolha artificial e fase de crescimento (esq.) e a relação média-variância observada (dir.). Fonte: o autor. Visite www.leg.ufpr.br/ walmes/papercompanions. Walmes Zeviani UFPR Visualização de Dados 55

Visualização orientada a dados Precipitação mensal (mm) 150 100 50 0 Condições climáticas em Curitiba Média histórica de 30 anos Série max min Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Meses 30 20 10 0 Temperatura ( C) Figura 35. Precipitação e temperatura máxima e mínima mensal em Curitiba. Visite www.climatempo.com.br/climatologia/271/curitiba-pr. Walmes Zeviani UFPR Visualização de Dados 56

Casos mistos Proporção urbana da população 100 75 50 25 0 100 75 50 25 0 100 75 50 25 0 RR AM PA MA CE MT GO BA PE AL MS DF MG SE AP SP RJ ES PR RS SC AC RO TO PI PB RN 1960 1980 2000 100 75 50 25 0 100 75 50 25 0 1960 1980 2000 100 75 50 25 0 100 75 50 25 0 100 75 50 25 0 1960 1980 2000 Ano 1960 1980 2000 1960 1980 2000 1960 1980 2000 Região CO N NE S SE Figura 36. Percentual da população brasileira em residente em zona urbana de 1950 até 2010. Dados extraídos do IPEA. Visite <http://www.ipeadata.gov.br>. Walmes Zeviani UFPR Visualização de Dados 57

Orientada a dados e conceitual Goleiro Zagueiro Meio zaga Meio Meio ataque Atacante Figura 37. Faces de Chernoff para representar medidas resumos (média e desvio-padrão para idade, altura, peso e número de gols) determinadas para jogadores de futebol da liga européia conforme função em campo. Walmes Zeviani UFPR Visualização de Dados 58

Orientada a dados e conceitual 2 1 Função Valor padronizado 0 Goleiro Zagueiro Meio zaga Meio Meio ataque 1 Atacante age_mean age_sd cm_mean cm_sd goal_mean goal_sd kg_mean kg_sd Estatística Figura 38. Gráfico de eixos paralelos para representar medidas resumos (média e desvio-padrão para idade, altura, peso e número de gols) determinadas para jogadores de futebol da liga européia conforme função em campo. Walmes Zeviani UFPR Visualização de Dados 59

Percepção visual Walmes Zeviani UFPR Visualização de Dados 60

Variáveis visuais Figura 39. As 7 variáveis visuais definidas por Bertin. As 7 variáveis visuais: posição, tamanho, forma, saturação, cor, orientação e textura. 3 Walmes Zeviani UFPR Visualização de Dados 61

Variáveis visuais Figura 40. As 7 variáveis visuais conforme o tipo de percepção visual. Fonte: www.researchgate.net. Walmes Zeviani UFPR Visualização de Dados 62

Variáveis visuais Figura 41. As 7 variáveis visuais e sua utilização em pontos, linhas e áreas. Fonte: gistbok.ucgis.org 3 www.axismaps.com Walmes Zeviani UFPR Visualização de Dados 63

Propriedades das variáveis visuais 1. Seletiva. 2. Associativa. 3. Quantitativa. 4. Ordenativa. 5. Dissociativa. Figura 42. As 7 variáveis visuais. Walmes Zeviani UFPR Visualização de Dados 64

Propriedade: seletiva A variável visual é seletiva se rapidamente permite isolar/distinguir um grupo ou unidade pelo valor. Para separar z alto dos demais: Posição ou tamanho? Tamanho ou saturação? Posição (x, y) Posição (z, y) Posição (x, y) + Tamanho (z) Posição (x, y) + Forma (z) Posição (x, y) + Saturação (z) Posição (x, y) + Cor (z) Figura 43. Codificação de 3 variáveis (x, y e z) em variáveis visuais. Walmes Zeviani UFPR Visualização de Dados 65

Propriedade: associativa A variável visual é associativa se rapidamente permite reconhecer grupos de acordo com seu valor. Para reconhecer os grupos em z: Posição ou cor? Cor ou saturação? Cor ou forma? Posição (x, y) Posição (z, y) Posição (x, y) + Tamanho (z) Posição (x, y) + Forma (z) Posição (x, y) + Saturação (z) Posição (x, y) + Cor (z) Figura 43. Codificação de 3 variáveis (x, y e z) em variáveis visuais. Walmes Zeviani UFPR Visualização de Dados 66

Propriedade: quantitativa A variável visual é quantitativa se permite estimar diferenças de valor entre unidades comparadas. A diferença entre os extremos de z com relação ao seu médio: Posição ou tamanho? Tamanho ou saturação? Posição (x, y) Posição (z, y) Posição (x, y) + Tamanho (z) Posição (x, y) + Forma (z) Posição (x, y) + Saturação (z) Posição (x, y) + Cor (z) Figura 43. Codificação de 3 variáveis (x, y e z) em variáveis visuais. Walmes Zeviani UFPR Visualização de Dados 67

Propriedade: ordenativa A variável visual é ordenativa se permite criar uma sequência das unidades baseada em seu valor. Para ordenar conforme a variável z: Posição ou tamanho? Tamanho ou saturação? Posição (x, y) Posição (z, y) Posição (x, y) + Tamanho (z) Posição (x, y) + Forma (z) Posição (x, y) + Saturação (z) Posição (x, y) + Cor (z) Figura 43. Codificação de 3 variáveis (x, y e z) em variáveis visuais. Walmes Zeviani UFPR Visualização de Dados 68

Propriedade: dissociativa A variável visual é mais dissoativa a medida que permite mais precisamente criar um maior número de classes baseado em seus valores. Agrupando em classe de valor z, quantas classes existem considerando: Posição ou tamanho? Cor ou saturação? Posição (x, y) Posição (z, y) Posição (x, y) + Tamanho (z) Posição (x, y) + Forma (z) Posição (x, y) + Saturação (z) Posição (x, y) + Cor (z) Figura 43. Codificação de 3 variáveis (x, y e z) em variáveis visuais. Walmes Zeviani UFPR Visualização de Dados 69

Classificação conforme as propriedades Tabela 5. Classificação das variáveis visuais conforme as propriedades. Fonte: library.ucalgary.ca. Seletiva Associativa Quantitativa Ordenativa Posição Tamanho ± Forma < 5 < 5 Saturação Cor ± ± Orientação Textura <https://library.ucalgary.ca/ld.php?content_id=25052966> Walmes Zeviani UFPR Visualização de Dados 70

Recomendação de uso Figura 44. Ranking de Mackinlay das variáveis visuais para o mapeamento de variáveis quantitativas, qualitativas ordinais e nominais. <https://www.researchgate.net/publication/312530613_images_of_time> Walmes Zeviani UFPR Visualização de Dados 71

Competências em visualização de dados Walmes Zeviani UFPR Visualização de Dados 72

Os 8 chapéus da visualização de dados A visualização de dados é multidiciplinar diferentes competências. Para Kirk (2012) existem 8 chapéus. Figura 45. Os 8 chapeús de Kirk ilustrando as diferentes competências e papéis em visualização de dados. Fonte dos ícones: www.flaticon.com/authors/freepik. Walmes Zeviani UFPR Visualização de Dados 73

Os 8 chapéus da visualização de dados Figura 46. Os 8 chapeús de Kirk considerando os eixos: competência técnica-artística sobre visualização de dados e habilidades de programação (hard skills) e comunicação/gestão (soft skills). Fonte: o autor. Walmes Zeviani UFPR Visualização de Dados 74

Os 8 chapéus da visualização de dados Iniciante A curiosidade disparou interesse pelos dados. Deseja explorar/descobrir problemas, evidências e oportunidades. Auxilia identificar o perfil da audiência. Walmes Zeviani UFPR Visualização de Dados 75

Os 8 chapéus da visualização de dados Cientista de Dados ou Estatístico Minerar dados aquisição, manuseio, preparação dos dados. Lida com dados de ampla variedade e dimensão. Propósito de construir de modelos. Tem o conhecimento estatístico para fazer uma análise visual extensa e profunda. Detectar padrões, fragilidade e ameaças. Antecipar a forma e força de relações. Obter descrição numérica de propriedades dos dados. Especificar e ajustar modelos. Avaliar a qualidade dos modelos. Walmes Zeviani UFPR Visualização de Dados 76

Os 8 chapéus da visualização de dados Jornalista Estabelece a narrativa apoiada nos dados data storytelling. Trabalha na formulação de questões sobre os dados/fenêmeno. Tem mindset para aprofundar e explorar as oportunidades analíticas dos dados. Walmes Zeviani UFPR Visualização de Dados 77

Os 8 chapéus da visualização de dados Cientista da Computação Coloca o projeto em produção web, mobile, dinâmico, dashboard. Competência para lidar com a aquisição, manuseio e produção visual mais eficiente/escalável. Podem acrescentar reatividade e interatividade. Walmes Zeviani UFPR Visualização de Dados 78

Os 8 chapéus da visualização de dados Designer Tem mindset criativo e inovador artista. Cuida dos detalhes visuais. Aspectos de inovação e estilo aumentam o potencial apreciativo da visualização. Ágil com softwares de edição/desenho/fotografia. Walmes Zeviani UFPR Visualização de Dados 79

Os 8 chapéus da visualização de dados Cientista Cognitivo Domina a ciência que explica a eficiência técnica das soluções apresentadas. São experts em percepção visual, comunicação visual e neurocognição. Entendem de teoria das cores, iconografia, etc. Fazer a visualização produzir mais impacto ou ser mais digestível. Walmes Zeviani UFPR Visualização de Dados 80

Os 8 chapéus da visualização de dados Comunicador Está preocupado com a comunicação do projeto. Apresenta os fatos/resultados à audiência. Habilidade para comunicar para diferentes públicos. Walmes Zeviani UFPR Visualização de Dados 81

Os 8 chapéus da visualização de dados Gestor de Projetos É o coordenador de todo o projeto. Tem visão ampla do projeto. Garante coesão, prazos e metas. Preocupa-se com os aspectos sensíveis dos dados/projeto integridade, ética e privacidade. Walmes Zeviani UFPR Visualização de Dados 82

O que vimos até aqui Tipos de visualização: 2 perguntas, 4 tipos. Conceitual ou orientada a dados? Declarativa ou exploratória? Variáveis visuais. As 7: posição, tamanho, forma, satuação, cor, orientação e textura. 5 propriedades: seletiva, associativa, quantitativa, ordenativa e dissociativa. Competências. Visualização de dados é multiciplinar. Componente técnico e artístico. Habilidades instrumentais e interpessoais. 8 chapéus. Walmes Zeviani UFPR Visualização de Dados 83

Considerações finais Walmes Zeviani UFPR Visualização de Dados 84

Recomendações Os números tem uma importante história para contar. Eles dependem de você dar-lhes um clara e convincente voz. Stephen Few Esforce-se para compreender melhor os seus dados: veja-os. Uma apropriada visualização impacta mais do que múltiplas tabelas, testes e índices de ajuste. Invista em recursos para manipulação e visualização de dados: R, Python, Inkscape, Gimp, JavaScript. Walmes Zeviani UFPR Visualização de Dados 85

Próximas aulas 1. Gráficos (próxima). Almanaque de gráficos. Qual usar em cada caso. Anatomia dos gráficos. Características, prós e contras. O que você deve evitar. 2. Confeção de gráficos (próxima). Recursos/softwares para fazer gráficos. Um panorâma de recursos do software R. Exemplos de gráficos estáticos e interativos. Tutorial sobre gráficos com o ggplot2. Walmes Zeviani UFPR Visualização de Dados 86

Agradecimentos Prof. Paulo Justiniano. Laboratório de Estatística e Geoinformação. Departamento de Estatísica. PRPPG. Audiência. Walmes Zeviani UFPR Visualização de Dados 87

Referências BERINATO, S. Good Charts: The HBR Guide to Making Smarter, More Persuasive Data Visualizations. Harvard Business Review Press, 2016. ISBN 9781633690714. Disponível em: <https://books.google.com.br/books?id=\_kjbcgaaqbaj>. KIRK, A. Data Visualization: A Successful Design Process. Packt Pub., 2012. (Community experience distilled). ISBN 9781849693479. Disponível em: <https://books.google.com.br/ books?id=i4qbvlfd3t4c>. Walmes Zeviani UFPR Visualização de Dados 88

Pela oportunidade e atenção, agradeço. Prof. Walmes Zeviani <walmes@ufpr.br> <leg.ufpr.br/~walmes> Walmes Zeviani UFPR Visualização de Dados 89