Estatística Descritiva (II)

Documentos relacionados
Estatística Descritiva (I)

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

MAE116 Noções de Estatística

Grupo A - 1 semestre de 2012 Lista de exercícios 2 - Estatística Descritiva II C A S A (gabarito)

Capítulo 1. Análise Exploratória de Dados

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Estatística Descritiva

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Estatística Descritiva

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Estatística Descritiva II

ESTATÍSTICA Medidas de Síntese

Resumo de Dados. Tipos de Variáveis

Estatística Descritiva

Introdução à análise estatística com SPSS. Guião nº2: Descrição de variáveis estatísticas

Estatística Descritiva (I)

Conceito de Estatística

Autores: Fernando Sebastião e Helena Silva

Princípios de Bioestatística Estatística Descritiva/Exploratória

Elementos de Estatística

CAP1: Estatística Descritiva para análise da variabilidade uma amostra de dados quantitativos

Revisão de estatística descritiva

Estatística 1 - Lista de Exercícios Extra Professor José Carlos Fogo

APONTAMENTOS DE SPSS

Elementos de Estatística

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

Profa. Lidia Rodella UFPE-CAA

ESTATÍSTICA DESCRITIVA

Métodos Experimentais em Ciências Mecânicas

Fernando de Pol Mayer

Distribuição de Frequência de Variáveis Quantitativas Contínuas (Tabelas e Gráficos)

Vimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos. Pode ser de interesse apresentar esses dados através d

ESTATÍSTICA DESCRITIVA

Introdução à Probabilidade e Estatística I

(a) Classifique cada uma das variáveis.

Amostragem Aleatória e Descrição de Dados - parte II

Departamento de Estatística

Introdução à análise estatística com SPSS. Guião nº6: Medidas de associação

ESTATÍSTICA: UMA RÁPIDA ABORDAGEM Prof. David B.

Distribuição de Frequência de Variáveis Qualitativas e Quantitativas Discretas (Tabelas e Gráficos)

Lista de Exercícios Cap. 2

Bioestatística CE001 Prof. Fernando de Pol Mayer Departamento de Estatística DEST Exercícios: medidas resumo Nome: GABARITO

Unidade I. Profa. Ana Carolina Bueno

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

Introdução à Estatística Estatística Descritiva 22

Introdução à Bioestatística Turma Nutrição Aula 3 Análise Descritiva: Medidas de Tendência Central Medidas de Variabilidade

(em dias) Agrupados Isolados 58 a a a TOTAL

Unidade III Medidas Descritivas

Princípios de Bioestatística

Introdução à estatística. Prof. Anderson Rodrigo da Silva

Excel INTERMEDIÁRIO Estatística. Prof. Cassiano Isler Turma 3

Prof. Dr. Engenharia Ambiental, UNESP

Estatística Computacional Profª Karine Sato da Silva

REPRESENTAÇÃO GRÁFICA E INTERPRETAÇÃO DE DADOS

Análise Exploratória de Dados

( ) Referem-se aos dados coletados e podem ser

Estatística descritiva básica: Tabelas e Gráficos

Estatística 1. Resumo Teórico

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

Descrevendo Distribuições com Números TADI

LISTA DE EXERCÍCIOS 1 INE PROF. MARCELO MENEZES REIS ANÁLISE EXPLORATÓRIA DE DADOS GABARITO

Distribuição de Frequência de Variáveis Quantitativas Contínuas (Tabelas e Gráficos)

Prof. Lorí Viali, Dr.

AULA 5 MEDIDAS DESCRITIVAS DOCENTE: CIRA SOUZA PITOMBO

CAD. 8 SETOR A AULAS 45-48

Apresentação Caule e Folha. Exemplo. Ramo e Folha. Análise Exploratória de Dados

CURSO DE SPSS AULA 2 MEDIDAS DESCRITIVAS. UFBA/FACED José Albertino Lordello Sheila Regina Pereira

Estatística stica na Pesquisa Clínica

GERÊNCIA DE ENSINO E PESQUISA - GEP SETOR DE GESTÃO DA PESQUISA E INOVAÇÃO TECNOLOGICA ESTATÍSTICA ALICADA NO EXCEL. Estatística Descritiva

BIBLIOGRAFIA INTRODUÇÃO À BIOESTATÍSTICA OBJETIVOS DO CURSO ESTATÍSTICA ESTATÍSTICA ESTATÍSTICA

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

Universidade Federal de Lavras Departamento de Ciências Exatas Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

MEDIDAS DE TENDÊNCIA CENTRAL

Estatística Descritiva: organização dos dados. 1 - Distribuição de frequências

Estatística I Aula 2. Prof.: Patricia Maria Bortolon, D. Sc.

IFF FLUMINENSE CST EM MANUTENÇÃO INDUSTRIAL

Variáveis estatísticas ou variáveis: Os atributos (modalidades) ou magnitudes (valores) que se observam nos indivíduos de uma população.

Análise Descritiva de Dados

Distribuição de frequências:

Princípios de Bioestatística

AT = Maior valor Menor valor

Figura 1: Gráfico de pontos.

RESUMO DE DADOS. Lucas Santana da Cunha Universidade Estadual de Londrina. 24 de abril de 2017

DISCIPLINA: PROBABILIDADE E ESTATÍSTICA TURMA: Informática de Gestão

ESTATÍSTICA USANDO MINITAB

ESTATÍSTICA BÁSICA COM USO DO SOFTWARE R

Unidade I ESTATÍSTICA. Prof. Celso Ribeiro Campos

Transcrição:

Estatística Descritiva (II)

Arquivo PULSE do Minitab Experimento envolvendo alunos. Cada um tem altura, peso, sexo, hábito de fumar e nível de atividade física anotados. Todos jogam moedas: se CARA, é realizada uma corrida estacionária por 1 minuto. As pulsações antes e após a corrida são registradas. Os demais registram a pulsação em dois instantes (intervalo de 1 minuto), sem a corrida estacionária.

Informações do arquivo PULSE MTB > INFO Information of the worksheet Column Count Name C1 92 Pulse1 C2 92 Pulse2 C3 92 Ran 1- fez corrida 2- não fez corrida C4 92 Smokes 1- fuma 2- não fuma C5 92 Sex 1- masculino 2- feminino C6 92 Height C7 92 Weight C8 92 Activity 0- não tem 1- leve 2- moderada 3- intensa

Planilha (parcial) Row Pulse1 Pulse2 Ran Smokes Sex Height Weight Activity 1 64 88 1 2 1 66,00 140 2 2 58 70 1 2 1 72,00 145 2 3 62 76 1 1 1 73,50 160 3 4 66 78 1 1 1 73,00 190 1 5 64 80 1 2 1 69,00 155 2 6 74 84 1 2 1 73,00 165 1 7 84 84 1 2 1 72,00 150 3 8 68 72 1 2 1 74,00 190 2

Variáveis qualitativas Ran Smokes Sex Activity Nominal Ordinal Variáveis quantitativas Pulse 1 Pulse 2 Height Weight Discreta Contínua

Variáveis Quantitativas Medidas de posição Média (x) - Mediana (md) Quartis (Q1, Q3) Máximo (máx) Mínimo (min) Medidas de dispersão Variância (s 2 ) Desvio padrão (s) Intervalo-interquartil (Q3 Q1) Coeficiente de variação (CV)

MTB > describe c1 c6 c7 Descriptive Statistics Variable N Mean Median Tr Mean StDev SE Mean Pulse1 92 72,87 71 72,61 11,01 1,15 Height 92 68,72 69 68,784 3,659 0,382 Weight 92 145,15 145 144,52 23,74 2,48 Variable Min Max Q1 Q3 Pulse1 48 100 64 80 Height 61 75 66 72 Weight 95 215 125 156,5 CV 11,01/72,87=0,15 3,66/68,72=0,05 23,74/145,15=0,16

Pulsação e peso apresentam dispersão em relação à média praticamente iguais e o triplo da dispersão da altura. Alguns comentários: 50% dos indivíduos tem pulsação menor ou igual a 71 batimentos por minuto; 25% dos indivíduos tem altura igual ou menor a 66 pés; 75% dos indivíduos tem peso igual ou menor a 156,5 libras; a variável com menor dispersão em relação à média é a altura;

MTB > describe c1; SUBC > by c3. Variable Ran N Mean Median Tr Mean StDev SE Mean Pulse1 1 35 73,60 70 72,97 11,44 1,93 2 57 72,42 72 72,47 10,82 1,43 Variable Ran Min Max Q1 Q3 Pulse1 1 58 100 64 80 2 48 94 64 81 MTB > describe c2; SUBC > by c3. Variable Ran N Mean Median Tr Mean StDev SE Mean Pulse2 1 35 92,51 88 91,68 18,94 3,20 2 57 72,32 70 72,24 9,95 1,32 Variable Ran Min Max Q1 Q3 Pulse2 1 58 140 76 106 2 50 94 66 79

O grupo que correu apresenta um desvio padrão aproximadamente igual ao dobro do que o grupo que não correu. Alguns comentários: Com relação às medidas de posição, os dois grupos antes de correr têm praticamente os mesmos valores; O grupo que correu (Ran=2) tem média de Pulse2 maior que o grupo que não correu (Ran=1). Com relação às medidas de dispersão, os dois grupos antes da corrida apresentam valores semelhantes;

Descrevendo a pulsação em repouso segundo o sexo MTB > DESCRIBE C1; SUBC> BY C5. Variable Sex N Mean Median TrMean StDev SE Mean Pulse1 1 57 70,42 70 70,27 9,95 1,32 2 35 76,86 78 76,65 11,62 1,96 Variable Sex Min Max Q1 Q3 Pulse1 1 48 92 63 75 2 58 100 66 86

Os dados também podem ser resumidos construindo-se uma tabela de distribuição de freqüências. Distribuição de freqüências de uma variável é uma lista dos valores individuais ou dos intervalos de valores que a variável pode assumir, com as respectivas freqüências de ocorrência.

No arquivo PULSE MTB > tally c1 Não há perda de informação Summary Statistics for Discrete Variables Pulse1 Count Percent 48 1 1,09 54 2 2,17 58 3 3,26 60 4 4,35 61 1 1,09 62 9 9,78 64 4 4,35 66 5 5,43 68 11 11,96 70 6 6,52 72 6 6,52 74 5 5,43 76 5 5,43 78 5 5,43 80 3 3,26 82 3 3,26 84 4 4,35 86 1 1,09 87 1 1,09 88 3 3,26 90 4 4,35 92 2 2,17 94 1 1,09 96 2 2,17 100 1 1,09 N= 92

Alternativa: construir intervalos de classe Classe de pulsação 48-54 54-60 60-66 66-72 72-78 78-84 84-90 90-96 96-102 frequência 1 5 18 22 16 11 9 7 3 Informações mais resumidas Perda de informação

Exemplo 2: Variável: altura ( height) contínua Distribuição de freqüência para altura ( arquivo PULSE) Classes de altura f fr Construir intervalos de classe 60,25-61,75 61,75-63,25 63,25-64,75 64,75-66,25 66,25-67,75 67,75-69,25 69,25-70,75 70,75-72,25 72,25-73,75 73,75-75,25 Total 1 10 2 13 7 20 7 15 9 8 92 0,011 0,109 0,022 0,141 0,076 0,217 0,076 0,163 0,098 0,087 1

Variáveis Quantitativas Gráficos Dotplot Boxplot Histograma

DOTPLOT Arquivo PULSE Dotplot da pulsação em repouso (PULSE1) MTB > DOTPLOT C1.. : : : :. : : :.... : : : : : : : : : :.. :. :. : : :.: : : : : : : : : : : :..: : :. :. ---+---------+---------+---------+---------+---------+- 50 60 70 80 90 100 Pulse1

Arquivo PULSE Dotplot da pulsação em repouso (PULSE1) segundo Sexo (SEX) MTB > DotPlot 'Pulse1' ; SUBC> Same; SUBC> By 'Sex'. : Sex 1 : : :.. :.. : : : :... : : : : : : : : : : :... :. : : --+---------+---------+---------+---------+---------+- Sex 2.. :...:. : : : : : : : :..:.. :. --+---------+---------+---------+---------+---------+- 50 60 70 80 90 100 Pulse1

Boxplot Representa os dados através de um retângulo construído com os quartis e fornece informações sobre os valores extremos.

Máximo Construção LS=Q3+1,5(Q3-Q1) Q3 Mediana 50% 75% Q1 Mínimo Máximo é o maior valor menor que LS; Mínimo é o menor valor maior que LI. 25% LI=Q1-1,5(Q3-Q1)

Exemplo: Tempo de sobrevivência (dias) Dados ordenados (n=36) 18 21 21 23 23 25 27 29 30 31 32 32 32 34 35 36 38 41 42 42 43 44 45 46 46 47 48 50 54 56 Observações discrepantes? 57 58 60 61 98 116 LI = Q1-1,5(Q3 - Q1) =1,38 LS = Q3 + 1,5(Q3 - Q1) =78,38 md = 41,5 Q1 = 30,25 Q3 = 49,5 * * 120 100 80 60 40 20

Arquivo PULSE Boxplot da pulsação em repouso (PULSE1) MTB > BOXPLOT C1 Alguns Comentários: não há observações discrepantes; a distribuição dos valores é aproximadamente simétrica.

Arquivo PULSE Boxplots da pulsação em repouso (PULSE1) por sexo (SEX) MTB > BOXPLOT C1*C5 Alguns Comentários: não há observações discrepantes; medidas de posição tendem a ser maior para o sexo feminino; não há fortes evidências de assimetria nos dois grupos.

Histograma Agrupar os dados em intervalos de classes (distribuição de freqüências) Bases iguais Construir um retângulo para cada classe, com base igual ao tamanho da classe e altura proporcional à freqüência da classe (f). Bases diferentes Construir um retângulo para cada classe, com base igual ao tamanho da classe e área do retângulo igual a freqüência relativa da classe(f A altura será dada por h = fr/base (densidade de freqüência).

Arquivo PULSE Histograma da altura (Height) Distribuição de freqüência para altura (arquivo PULSE) MTB > HIST C6 Classe de altura f fr 60,25 61,75 61,75 63,25 63,25 64,75 64,75 66,25 66,25 67,75 67,75 69,25 69,25 70,75 70,75 72,25 72,25 73,75 73,75 75,25 Total 1 10 2 13 7 20 7 15 9 8 92 0,011 0,109 0,022 0,141 0,076 0,217 0,076 0,163 0,098 0,087 1 F r e q u e n c y 20 10 0 61,0 62,5 64,0 65,5 67,0 68,5 Height 70,0 71,5 73,0 74,5

Exemplo: Classes desiguais Vacinação Infantil Classes (meses) f fr h 0-3 140 0,28 0,093 0,10 0,08 0,06 0,04 h 3-12 100 0,20 0,022 12-24 80 0,16 0,013 24-60 180 0,36 0,010 Total 500 1,00 0,02 f 0 3 12 24 60 0 3 12 24 60

Forma da Distribuição

Variáveis Qualitativas Os dados podem ser resumidos construindose uma tabela de distribuição de freqüências, que quantifica a freqüência das distintas categorias. Variáveis qualitativas no arquivo PULSE Ran Smokes Sex Activity

Variáveis qualitativas no arquivo PULSE MTB > Tally 'Sex' 'Smokes' 'Activity'; SUBC> Counts; SUBC> Percents. Summary Statistics for Discrete Variables Sex Count Percent Smokes Count Percent 1 57 61,96 1 28 30,43 2 35 38,04 2 64 69,57 N= 92 N= 92 Activity Count Percent 0 1 1,09 1 9 9,78 2 61 66,30 3 21 22,83

Podemos também construir tabelas de freqüências conjuntas (tabelas de contingência), relacionando duas variáveis qualitativas. Exemplo 1: 1 Há indícios de associação entre Sexo e Hábito de fumar? Como concluir? Hábito de Fumar Sexo Fuma Não Fuma Total Masculino 20 37 57 Feminino 8 27 35 Total 28 64 92 Qual o significado dos valores desta tabela?

MTB > Table 'Sex' 'Smokes'; SUBC> Counts. Rows: Sex Columns: Smokes 1 2 All 1 20 37 57 2 8 27 35 All 28 64 92

Verificar associação através da: - porcentagem segundo as colunas, ou - porcentagem segundo as linhas. Hábito de Fumar Sexo Fuma Não Fuma Total Masculino 71,43% 57,81% 61,96% Feminino 28,57% 42,19% 38,04% Total 100% 100% 100% Qual o significado dos valores desta tabela? Como concluir?

MTB > Table 'Sex' 'Smokes'; SUBC> ColPercents. (RowPercents/TotPercents) Rows: Sex Columns: Smokes 1 2 All 1 71,43 57,81 61,96 2 28,57 42,19 38,04 All 100,00 100,00 100,00

MTB > Table 'Sex' 'Smokes'; SUBC> Counts; SUBC> RowPercents. Rows: Sex Columns: Smokes 1 2 All 1 20 37 57 35,09 64,91 100,00 2 8 27 35 22,86 77,14 100,00 All 28 64 92 30,43 69,57 100,00 Cell Contents Count - % of Row

Exemplo 2: 2 Dentre os que correram, qual a porcentagem de mulheres? MTB > Table 'Ran' 'Sex'; SUBC> Counts; SUBC> RowPercents. Rows: Ran Columns: Sex 1 2 All 1 24 11 35 68,57 31,43 100,00 2 33 24 57 57,89 42,11 100,00 All 57 35 92 61,96 38,04 100,00 Resposta: 31,43%

Variáveis Qualitativas Gráficos Gráfico de setores Gráfico de barras

Gráfico de setores Um círculo é dividido em tantos setores quantas forem as categorias da variável. A área de cada setor é proporcional à freqüência da categoria

Arquivo PULSE Gráfico de setores para a variável Ran MTB > %Pie c3. Pie Chart of Ran 1 (35; 38,0%) 2 (57; 62,0%)

Arquivo PULSE Gráfico de setores para a variável Activity

Gráfico de barras Sobre um eixo, são representados retângulos, um para cada categoria da variável. A altura do retângulo é proporcional à freqüência da categoria

Arquivo PULSE Gráfico de barras para a variável RAN MTB > Chart C3 60 50 Count of Ran 40 30 20 10 0 1 Ran 2

Arquivo PULSE Gráfico de barras para a variável Activity MTB > Chart C8 60 50 Count of Activity 40 30 20 10 0 0 1 Activity 2 3