Estatística Descritiva (II)

Documentos relacionados
Estatística Descritiva (II)

Técnicas Computacionais em Probabilidade e Estatística I. Aula III

Estatística Descritiva (I)

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva

Estatística Descritiva (II)

Estatística Descritiva (II)

Estatística Descritiva (II)

Estatística Descritiva (II)

Análise Exploratória Unidimensional

MAE 116 Estatística Descritiva II Estatística Descritiva II FEA -2º Semestre 2017

Estatística Descritiva (II)

Estatística Descritiva II

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

Estatística Descritiva II

Análise Bidimensional

Tutorial para o desenvolvimento das Oficinas

Grupo A - 1 semestre de 2012 Lista de exercícios 2 - Estatística Descritiva II C A S A (gabarito)

Enrico Antonio Colosimo Depto. Estatística UFMG

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

MAE116 Noções de Estatística

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito)

Capítulo 1. Análise Exploratória de Dados

MAE0219 Introdução à Probabilidade e Estatística I

1 Estatística Descritiva

MAE0219 Introdução à Probabilidade e Estatística I

Associação entre variáveis qualitativas. Tabelas de Contigência

MAE Introdução à Probabilidade e Estatística I 2 o semestre de 2017 Gabarito da Lista de Exercícios 2 - Estatística Descritiva II - CASA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

BIOESTATÍSTICA AULA 2. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

Bioestatística Aula 2

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

Análise de dados em Geociências

Cap. 6 Medidas descritivas

RECURSOS GRÁFICOS TIAGO M. MAGALHÃES. São Paulo, 10 de janeiro de 2013

RECURSOS GRÁFICOS TIAGO M. MAGALHÃES. São Paulo, 13 de janeiro de 2014

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Introdução à análise exploratória de dados

Introdução à análise exploratória de dados

Estatística para Cursos de Engenharia e Informática

Estatística descritiva

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Estatística Descritiva II

Estatística Descritiva (I)

ESTATÍSTICA Medidas de Síntese

Estatística Descritiva (I)

Estatística Descritiva

Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

Autores: Fernando Sebastião e Helena Silva

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Estatística Descritiva

Elementos de Estatística

Estatítica Descritiva e Exploratória

Métodos Quantitativos

Estatística Descritiva

SS714 - Bioestatística

Conceito de Estatística

MAE Introdução à Probabilidade e Estatística I 1 o semestre de 2014 Gabarito da lista de exercícios 1 - Estatística descritiva I - CASA

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística

MAE0219 Introdução à Probabilidade e Estatística I

Aula 2: Resumo de Dados

METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA

Resumo de Dados. Tipos de Variáveis

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

MAE116 Farmácia Estatística Descritiva (I)

Fernando de Pol Mayer

ESTATÍSTICA DESCRITIVA

Estatística Descritiva

Medidas-Resumo. Tipos de Variáveis

INTRODUÇÃO À ESTATÍSTICA

Revisão de estatística descritiva

CONCEITOS BASICOS, ORGANIZAÇÃO E APRESENTAÇÃO DOS RESULTADOS, DISTRIBUIÇÃO DE FREQUÊNCIA

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

Estatística Aplicada. UNIVERSIDADE ESTÁCIO DE SÁ-RECIFE 2013 Prof: Wildson Cruz

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Medidas resumo numéricas

Introdução à análise estatística com SPSS. Guião nº2: Descrição de variáveis estatísticas

Análise Exploratória e Estatistica Descritiva

6 - Apresentação de Dados em Gráficos

Análise descritiva de Dados. A todo instante do nosso dia-a-dia nos deparamos com dados.

Estatística Descritiva (I)

Aula 4: Medidas Resumo

CAP1: Estatística Descritiva para análise da variabilidade uma amostra de dados quantitativos

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Princípios de Bioestatística Estatística Descritiva/Exploratória

ESTATÍSTICA DESCRITIVA

Estatística Aplicada

ANÁLISE EXPLORATÓRIA DE DADOS

APONTAMENTOS DE SPSS

Profa. Lidia Rodella UFPE-CAA

Medidas de Posição. Tendência Central. É um valor que representa uma entrada típica, ou central, de um conjunto de dados. média. mediana.

Universidade Federal de São Paulo. Pró-Reitoria de Graduação. Pró-Reitora: Profa Dra. Maria Angélica Pedra Minhoto

Estatística Computacional Profª Karine Sato da Silva

Estatística Descritiva

Aula 05. Análise Bidimensional. Stela Adami Vayego - DEST/UFPR 1

Lista de Exercícios Cap. 2

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

Bioestatística. Parte I. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

( ) Referem-se aos dados coletados e podem ser

Transcrição:

Estatística Descritiva (II)

Exemplo: Um experimento feito por alunos. Cada um deles registrou sua altura, peso, sexo, hábito de fumar e nível de atividade física. Depois, todos eles jogaram moedas e aqueles que tiraram CARA fizeram corrida estacionária por 1 minuto, registrando a pulsação antes de correr e a pulsação depois de correr. Os demais registraram a pulsação após 1 minuto, mesmo sem ter corrido.

Banco de dados: Information of the worksheet Column Count Name C1 92 Pulse1 C2 92 Pulse2 C3 92 Ran 1- fez corrida 2- não fez corrida C4 92 Smokes 1- fuma 2- não fuma C5 92 Sex 1- masculino 2- feminino C6 92 Height C7 92 Weight C8 92 Activity 0- não tem 1- leve 2- moderada 3- intensa

Planilha (parcial) Row Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity 1 64 88 1 2 1 66,00 140 2 2 58 70 1 2 1 72,00 145 2 3 62 76 1 1 1 73,50 160 3 4 66 78 1 1 1 73,00 190 1 5 64 80 1 2 1 69,00 155 2 6 74 84 1 2 1 73,00 165 1 7 84 84 1 2 1 72,00 150 3 8 68 72 1 2 1 74,00 190 2

Variáveis qualitativas Ran Smokes Sex Activity Nominal Ordinal Variáveis quantitativas Pulse 1 Pulse 2 Height Weight Discreta Contínua

Variáveis Quantitativas Medidas de posição Média (x) - Mediana (md) Quartis (Q1, Q3) Máximo (máx) Mínimo (min) Medidas de dispersão Variância (s 2 ) Desvio padrão (s) Intervalo-interquartil (Q3 Q1) Coeficiente de variação (CV)

Variáveis quantitativas no banco de dados Medidas de posição e de disperção variável N Média Mediana DP Erro médio Pulse1 92 72,87 71 11,01 1,15 Pulse2 92 80,00 76 17,09 1,78 Height 92 68,72 69 3,66 0,38 Weight 92 145,15 145 23,74 2,48 Variável Min Max Q1 Q3 Pulse1 48 100 64 80,0 Pulse2 50 140 68 87,0 Height 61 75 66 72,0 Weight 95 215 125 156,5

Descrevendo a pulsação em repouso segundo o sexo Variável Sex N Média Mediana DP Erro médio Pulse1 1 57 70,42 70 9,95 1,32 2 35 76,86 78 11,62 1,96 Variável Sex Min Max Q1 Q3 Pulse1 1 48 92 63 75 2 58 100 66 86

Os dados também podem ser resumidos construindo-se uma tabela de distribuição de frequências. Distribuição de frequências de uma variável é uma lista dos valores individuais ou dos intervalos de valores que a variável pode assumir, com as respectivas frequências de ocorrência.

No banco de dados Não há perda de informação Summary Statistics for Discrete Variables Pulse1 Count Percent 48 1 1,09 54 2 2,17 58 3 3,26 60 4 4,35 61 1 1,09 62 9 9,78 64 4 4,35 66 5 5,43 68 11 11,96 70 6 6,52 72 6 6,52 74 5 5,43 76 5 5,43 78 5 5,43 80 3 3,26 82 3 3,26 84 4 4,35 86 1 1,09 87 1 1,09 88 3 3,26 90 4 4,35 92 2 2,17 94 1 1,09 96 2 2,17 100 1 1,09 N= 92

Alternativa: construir intervalos de classe Classe de pulsação 48-54 54-60 60-66 66-72 72-78 78-84 84-90 90-96 96-102 frequência 1 5 18 22 16 11 9 7 3 Informações mais resumidas Perda de informação

Exemplo 2: Variável: altura ( height) contínua Distribuição de frequência para altura Construir intervalos de classe Classes de altura f fr 60,25-61,75 61,75-63,25 63,25-64,75 64,75-66,25 66,25-67,75 67,75-69,25 69,25-70,75 70,75-72,25 72,25-73,75 73,75-75,25 Total 1 10 2 13 7 20 7 15 9 8 92 0,011 0,109 0,022 0,141 0,076 0,217 0,076 0,163 0,098 0,087 1

Variáveis Quantitativas Gráficos Dotplot Boxplot Histograma

DOTPLOT Dotplot da pulsação em repouso (PULSE1).. : : : :. : : :.... : : : : : : : : : :.. :. :. : : :.: : : : : : : : : : : :..: : :. :. ---+---------+---------+---------+---------+---------+- 50 60 70 80 90 100 Pulse1

Dotplot da pulsação em repouso (PULSE1) segundo Sexo (SEX) : Sex 1 : : :.. :.. : : : :... : : : : : : : : : : :... :. : : --+---------+---------+---------+---------+---------+- Sex 2.. :...:. : : : : : : : :..:.. :. --+---------+---------+---------+---------+---------+- 50 60 70 80 90 100 Pulse1

Boxplot Representa os dados através de um retângulo construído com os quartis e fornece informações sobre os valores extremos.

Máximo Construção LS=Q3+1,5(Q3-Q1) Q3 Mediana 50% 75% Q1 Mínimo Máximo é o maior valor menor que LS; Mínimo é o menor valor maior que LI. 25% LI=Q1-1,5(Q3-Q1)

Exemplo: Tempo de sobrevivência (dias) Dados ordenados (n=36) 18 21 21 23 23 25 27 29 30 31 32 32 32 34 35 36 38 41 42 42 43 44 45 46 46 47 48 50 54 56 57 58 60 61 98 116 md = 41,5 Q1 = 30,25 Q3 = 49,5 * * 120 100 80 60 Observações discrepantes? 40 LI = Q1-1,5(Q3 - Q1) =1,38 20 LS = Q3 + 1,5(Q3 - Q1) =78,38

Boxplot da pulsação em repouso (PULSE1) Alguns Comentários: não há observações discrepantes; a distribuição dos valores é aproximadamente simétrica.

Boxplots da pulsação em repouso (PULSE1) por sexo (SEX) Alguns Comentários: não há observações discrepantes; as medidas de posição são maiores para o sexo feminino; não há fortes evidências de assimetria nos dois grupos.

Histograma Agrupar os dados em intervalos de classes (distribuição de frequências) Bases iguais Construir um retângulo para cada classe, com base igual ao tamanho da classe e altura proporcional à frequência da classe (f). Bases diferentes Construir um retângulo para cada classe, com base igual ao tamanho da classe e área do retângulo igual a frequência relativa da classe(fr). A altura será dada por h = fr/base (densidade de frequência).

Histograma da altura (Height) Distribuição de frequência para altura Classe de altura f fr 60,25 61,75 61,75 63,25 63,25 64,75 64,75 66,25 66,25 67,75 67,75 69,25 69,25 70,75 70,75 72,25 72,25 73,75 73,75 75,25 Total 1 10 2 13 7 20 7 15 9 8 92 0,011 0,109 0,022 0,141 0,076 0,217 0,076 0,163 0,098 0,087 1 Frequency 20 10 0 61,0 62,5 64,0 65,5 67,0 68,5 Height 70,0 71,5 73,0 74,5

Exemplo: Classes desiguais Vacinação Infantil Classes (meses) f fr h 0-3 140 0,28 0,093 0,10 0,08 0,06 0,04 h 3-12 100 0,20 0,022 12-24 80 0,16 0,013 24-60 180 0,36 0,010 Total 500 1,00 0,02 f 0 3 12 24 60 0 3 12 24 60

Forma da Distribuição

Variáveis Qualitativas Os dados podem ser resumidos construindose uma tabela de distribuição de frequências, que quantifica a frequência das distintas categorias. Variáveis qualitativas no banco de dados Ran Smokes Sex Activity

Variáveis qualitativas no banco de dados Summary Statistics for Discrete Variables Sex Count Percent Smokes Count Percent 1 57 61,96 1 28 30,43 2 35 38,04 2 64 69,57 N= 92 N= 92 Activity Count Percent 0 1 1,09 1 9 9,78 2 61 66,30 3 21 22,83 N= 92

Podemos também construir tabelas de frequências conjuntas (tabelas de contingência), relacionando duas variáveis qualitativas. Exemplo 1: Há indícios de associação entre Sexo e Hábito de fumar? Como concluir? Hábito de Fumar Sexo Fuma Não Fuma Total Masculino 20 37 57 Feminino 8 27 35 Total 28 64 92 Qual o significado dos valores desta tabela?

Verificar associação através da: - porcentagem segundo as colunas, ou - porcentagem segundo as linhas. Hábito de Fumar Sexo Fuma Não Fuma Total Masculino 71,43% 57,81% 61,96% Feminino 28,57% 42,19% 38,04% Total 100% 100% 100% Qual o significado dos valores desta tabela? Como concluir?

Exemplo 2: Dentre os que correram, qual a porcentagem de mulheres? Ran\Sex 1 2 All 1 24 11 35 68,57 31,43 100,00 2 33 24 57 57,89 42,11 100,00 All 57 35 92 61,96 38,04 100,00 Resposta: 31,43%

Variáveis Qualitativas Gráficos Gráfico de setores Gráfico de barras

Gráfico de setores Um círculo é dividido em tantos setores quantas forem as categorias da variável. A área de cada setor é proporcional à frequência da categoria

Gráfico de setores para a variável Ran Pie Chart of Ran 1 (35; 38,0%) 2 (57; 62,0%)

Gráfico de setores para a variável Activity

Gráfico de barras Sobre um eixo, são representados retângulos, um para cada categoria da variável. A altura do retângulo é proporcional à frequência da categoria

Gráfico de barras para a variável RAN 60 50 Count of Ran 40 30 20 10 0 1 Ran 2

Gráfico de barras para a variável Activity 60 50 Count of Activity 40 30 20 10 0 0 1 Activity 2 3