BIOESTATÍSTICA ESTATÍSTICA DESCRITIVA: Representação Gráfica Guilherme Peña Cespedes Departamento de Estatística Universidade Federal do Amazonas Manaus, AM - Brasil
Utilizamos ferramentas gráficas para transmitirmos informações de forma rápida e clara. As ferramentas gráficas nos possibilitam: a) Observação de padrões; b) Observação de relações; c) Verificação/confirmação de informações sobre os dados; d) Apresentação dos dados. Não podemos esquecer que os gráficos representam fenômenos de diversas áreas do conhecimento, logo, devemos representar suas grandezas. 02/11/2014 Cespedes, G. P. 2
A fonte de informação dos gráficos podem ser: 1) Tabelas de Distribuição de Frequência; 2) Dos próprios dados brutos; 3) Medidas Estatística. 02/11/2014 Cespedes, G. P. 3
QUALITATIVO QUANTITATIVO Retângulos Composição em Setores Mosaico Dispersão Linhas Histograma Ramos-e-folhas Boxplot Pareto 02/11/2014 Cespedes, G. P. 4
GRÁFICO DE RETÂNGULOS BARRAS/COLUNAS O gráfico consiste em construir retângulos em que seu tamanho é proporcional a grandeza que representa, cada coluna espaçada igualmente entre as categorias. O gráfico de retângulos é construído a partir de uma distribuição de frequência. Exemplo 1: Um grupo levantou algumas informações da sua turma de integrantes numa determinada universidade e a partir desses dados descreveram algumas características da sua turma. Tabela 1: Distribuição de Frequência do alunos ingressantes em 2014 na Universidade X no Curso de Estatística por Sexo. Sexo Frequência Absolta Frequência Relativa (proporção) Porcentagem Feminino 17 0,34 34 Masculino 33 0,66 66 Total 50 1,00 100 Fonte: Dados Hipotéticos 02/11/2014 Cespedes, G. P. 5
FREQUÊNCIA ABSOLUTA SEXO DEPARTAMENTO DE ESTATÍSTICA GRÁFICO DE RETÂNGULOS Exemplo 1 (cont.) 35 30 25 Masculino 20 15 10 5 Feminino 0 Feminino SEXO Masculino 0 0.2 0.4 0.6 0.8 Frequência Relativa (a) (b) Figura 1: Gráfico da distribuição de frequência dos alunos da universidade X que ingressaram em 2014 para o curso de estatística por Sexo (a) Colunas com Frequência Absoluta e (b) Barras com Frequência Relativa. 02/11/2014 Cespedes, G. P. 6
FREQUÊNCIA ABSOLUTA DEPARTAMENTO DE ESTATÍSTICA GRÁFICO DE RETÂNGULOS A grandeza representada no gráfico é a Frequência (Absoluta, Relativa ou Porcentagem) 35 30 25 20 15 10 5 É um ótimo gráfico para fazer comparações entre as categorias, pois ficam mais fácil evidenciar, qual categoria é maior ou menor. 0 Feminino SEXO Masculino O espaçamento entre as colunas se deve ao fato de serem variáveis qualitativas, pois, cada categoria é diferente da outra. 02/11/2014 Cespedes, G. P. 7
Título do Eixo Título do Eixo DEPARTAMENTO DE ESTATÍSTICA GRÁFICO DE RETÂNGULOS COLUNAS OU BARRAS 7 6 Título do Eixo 0 1 2 3 4 5 6 7 5 4 3 2 Categoria 1 Categoria 2 Categoria 3 Categoria 4 Categoria 5 1 0 Categoria 6 Categoria 7 Categoria 8 Categoria 9 Título do Eixo Categoria 10 É mais uma questão visual, pois não deve haver confusão no gráfico 02/11/2014 Cespedes, G. P. 8
Frequência DEPARTAMENTO DE ESTATÍSTICA GRÁFICO DE RETÂNGULOS Uma situação em que temos uma variável quantitativa discreta com poucos números distintos podemos representar sua distribuição através do gráfico de retângulos. 25 20 15 10 Exemplo 2: Segue a representação 5 gráfica da distribuição de frequência do número de filhos. 0 0 1 2 Filhos 02/11/2014 Cespedes, G. P. 9
Composição em setores (Pizza) Destina-se a representar a composição, usualmente em porcentagem, de partes de um todo. Também é construído a partir de uma distribuição de frequência. 66% Sexo 34% Feminino Masculino 02/11/2014 Cespedes, G. P. 10
Mosaico É um gráfico utilizado para buscar evidencias de relações entre duas variáveis qualitativas. É muito parecido com o gráfico de retângulos, porém com uma mudança na sua metodologia. Fonte: Figura da Internet 02/11/2014 Cespedes, G. P. 11
FREQUÊNCIA ABSOLUTA DEPARTAMENTO DE ESTATÍSTICA Gráfico de Dispersão Podemos fazer um gráfico de dispersão no plano R 2 (Cartesiano) considerando como um par ordenado o valor observado e sua frequência (x i, F i ). Este pode ser construído a partir de uma Distribuição de Frequência ou dos dados. Mudando o eixo das ordenadas podemos ter diferentes eixos para diferentes funções, veremos posteriormente de acordo com a nossa necessidade. 40 35 30 25 20 15 10 5 0 0 1 2 3 4 FILHOS 02/11/2014 Cespedes, G. P. 12
Linhas É um gráfico muito parecido com o gráfico de dispersão, porém cada um dos pontos é ligado por um segmento de reta, o que indica a característica numérica continua da variável. Outras variantes desse gráfico podem ser feitos apenas com as linhas sem os pontos. Este gráfico é uma boa opção para identificar tendência, padrões e sazonalidade. 02/11/2014 Cespedes, G. P. 13
Frequência DEPARTAMENTO DE ESTATÍSTICA Linhas Exemplo 2: Massa Corporal em kg (Classes) Ponto Médio (x i ) 45 -- 55 50 4 55 -- 65 60 9 65 -- 75 70 24 75 -- 85 80 9 85 -- 95 90 4 Total -- 50 Frequência Absoluta 30 25 20 15 10 5 0 50 60 70 80 90 Massa Corporal (kg) 02/11/2014 Cespedes, G. P. 14
Histograma É um gráfico para variáveis quantitativas contínuas ou discretas com muitos valores distintos. O histograma é um bom gráfico para avaliar padrões de distribuição de uma variável, ele são justapostos, pois representam que os valores são contínuos (uma coluna é continuação da anterior). No eixo das ordenamos podem ser: F i, Frequência Absoluta; f i, Frequência Relativa; F i h i ou f i h i (Densidade de frequência). 02/11/2014 Cespedes, G. P. 15
Histograma Exemplo 3. Histograma de Massa Corporal Massa Corporal (Classes) Ponto Médio (x i ) 45 -- 55 50 4 55 -- 65 60 9 65 -- 75 70 24 75 -- 85 80 9 85 -- 95 90 4 Total -- 50 Frequência Absoluta Frequência 0 5 10 15 20 25 40 50 60 70 80 90 100 Massa Corporal em kg 02/11/2014 Cespedes, G. P. 16
RAMO-E-FOLHAS É um gráfico que busca evidenciar padrões de distribuição das variáveis, porém perdendo o mínimo de informações possível. Para sua construção, inicialmente precisamos: 1) Precisamos observar qual a melhor forma de representar o ramo e as folhas; 2) Ordenar os dados em Rol. 02/11/2014 Cespedes, G. P. 17
RAMO-E-FOLHAS Exemplo 4: Abaixo segue um conjunto de dados da idade de 50 alunos, façamos um gráfico de ramo-e-folhas para esses dados. 19 22 18 35 17 24 27 21 26 20 21 25 25 21 37 31 21 18 48 24 20 17 17 30 21 36 17 24 23 31 20 21 20 21 18 26 22 34 18 17 23 29 25 17 21 21 23 25 41 26 Primeiro definiremos os valor do ramos e das folhas. O ramo serão as dezenas e as folhas serão as unidades. Depois devemos ordenar de forma crescente para facilitar. 02/11/2014 Cespedes, G. P. 18
RAMO-E-FOLHAS Exemplo 4 (cont.): 17 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 21 21 21 21 21 21 21 22 22 23 23 23 24 24 24 25 25 25 25 26 26 26 27 29 30 31 31 34 35 36 37 41 48 Ramo (Dezenas) 1 2 3 4 Ramos-e-Folhas da variável idade As folhas representam as unidades. 7 7 7 7 7 7 8 8 8 8 9 0 0 0 0 1 1 1 1 1 1 1 1 1 2 2 3 3 3 4 4 4 5 5 5 5 6 6 6 7 9 1 1 4 5 6 7 1 8 Folhas (Unidades) 02/11/2014 Cespedes, G. P. 19
RAMO-E-FOLHAS Exemplo 4 (cont.): 17 17 17 17 17 17 18 18 18 18 19 20 20 20 20 21 21 21 21 21 21 21 21 21 22 22 23 23 23 24 24 24 25 25 25 25 26 26 26 27 29 30 31 31 34 35 36 37 41 48 1 2 3 4 Ramos-e-Folhas da variável idade As folhas representam as unidades. 7 7 7 7 7 7 8 8 8 8 9 0 0 0 0 1 1 1 1 1 1 1 1 1 2 2 3 3 3 4 4 4 5 5 5 5 6 6 6 7 9 1 1 4 5 6 7 1 8 Ramos-e-Folhas da variável idade As unidade são representadas pelas folhas. 1 2 2 3 3 4 4 7 7 7 7 7 7 8 8 8 8 9 0 0 0 0 1 1 1 1 1 1 1 1 1 2 2 3 3 3 4 4 4 5 5 5 5 6 6 6 7 9 1 1 4 5 6 7 1 8 02/11/2014 Cespedes, G. P. 20
BOX-PLOT O gráfico de box-plot também conhecido como diagrama de caixa e bigode, é um gráfico que nós podemos avaliar a distribuição, a assimetria e a dispersão dos dados. Fonte: wikipedia 02/11/2014 Cespedes, G. P. 21
PARETO É um gráfico de qualidade que podem ser feitos para variáveis qualitativas ou quantitativas, ele similar ao gráfico de retângulos, porém as classes/categorias são ordenados pela Frequência Absoluta de forma decrescente, ou seja, do maior para o menor. Também é desenhado um gráfico indicando a frequência relativa acumulada (em %) utilizando um gráfico de linhas no mesmo espaço gráfico. É uma ferramenta desenvolvida para definir prioridades. Fonte: wikipedia 02/11/2014 Cespedes, G. P. 22
Estilizando Podemos estilizar o gráfico para que a informação seja transmitida de forma mais clara, mais fácil, podemos deixar os gráficos mais atraentes, e mais elegantes, desde que, não prejudique a clareza. Vejamos alguns exemplos, a seguir, de gráficos disponibilizados no site: www.plot.ly. Como exercício interpretem os gráfico a seguir. 02/11/2014 Cespedes, G. P. 23
Exemplos de estilização de gráficos 02/11/2014 Cespedes, G. P. 24
Exemplos de estilização de gráficos 02/11/2014 Cespedes, G. P. 25
Exemplos de estilização de gráficos 02/11/2014 Cespedes, G. P. 26
Exemplos de estilização de gráficos 02/11/2014 Cespedes, G. P. 27
Exemplos de estilização de gráficos 02/11/2014 Cespedes, G. P. 28
Exemplos de estilização de gráficos 02/11/2014 Cespedes, G. P. 29
REFERÊNCIA MORETTIN, P.A.; BUSSAB, W.O. Estatística Básica 5ª Ed. São Paulo: Saraiva, 2004. 526 p. 02/11/2014 Cespedes, G. P. 30