3 MEDIDAS RESUMO 3.2 Medidas de dispersão. Silvio Sandoval Zocchi

Documentos relacionados
2 ESTATÍSTICA DESCRITIVA. Silvio Sandoval Zocchi

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo

Elementos de Estatística

Unidade III Medidas Descritivas

Prof. Dr. Lucas Santana da Cunha de abril de 2018 Londrina

NOTAS DE AULA. Medidas Descritivas. Prof.: Idemauro Antonio Rodrigues de Lara

MEDIDAS DE DISPERSÃO. Os dados a seguir referem-se ao índice pluviométrico de três cidades no Estado de São Paulo, em 3 diferentes ocasiões

Estatística. 1 Medidas de Tendência Central 2 Medidas de Posição 3 Medidas de Dispersão. Renata Souza

Fernando de Pol Mayer

MEDIDAS DE DISPERSÃO

Bioestatística. October 28, UFOP October 28, / 57

Bioestatística Medidas de tendência central, posição e dispersão PARTE II Roberta de Vargas Zanini 11/05/2017

MEDIDAS DE DISPERSÃO

Medidas de Dispersão ou variabilidade

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Introdução à Bioestatística Turma Nutrição Aula 3 Análise Descritiva: Medidas de Tendência Central Medidas de Variabilidade

Vimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos. Pode ser de interesse apresentar esses dados através d


Medidas de dispersão. 23 de agosto de 2018

Métodos Quantitativos II

25/08/2016. Estatística. Estatística. Medidas Estatísticas Medidas de Posição. Mariele Bernardes. Mariele Bernardes

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

Métodos Estatísticos Básicos

Estatística Descritiva

Estatística Descritiva

Estatística e Probabilidade

Estatística Aplicada a Negócios

1 Medidas de dispersão

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

Análise Descritiva de Dados

Seção 2.3 Uma Variável Quantitativa: Medidas de Dispersão

Distribuição de frequências:

Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados. Seção 3-1 Visão Geral. Visão Geral. Estatísticas Descritivas

Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

Universidade Federal de Lavras Departamento de Ciências Exatas Prof. Daniel Furtado Ferreira 4 a Aula Prática Medidas de Dispersão

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

Lista de Exercícios Cap. 2

MEDIDAS DE TENDÊNCIA CENTRAL

Estatística Descritiva

Módulo IV Medidas de Variabilidade ESTATÍSTICA

PARTE 3- MEDIDAS DE DISPERSÃO VERSÃO: MARÇO DE 2017

Medidas Descritivas de Posição, Tendência Central e Variabilidade

SS714 - Bioestatística

MAIS SOBRE MEDIDAS RESUMO. * é muito influenciada por valor atípico

Estatística Descritiva

Estatística Aplicada

Medidas de Variação ou Dispersão

Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

2. Estatística Descritiva

PROBABILIDADE E ESTATÍSTICA. Profa. Dra. Yara de Souza Tadano

Medidas de localização (ou de tendência central) Média: definida como o centro de massa (ou ponto de equilíbrio) do conjunto.

Medidas resumo numéricas

3 Estatística p/ Descrição, Exploração e Comparação de Dados (Triola 10 a ed.)

Bioestatística CE001 Prof. Fernando de Pol Mayer Departamento de Estatística DEST Exercícios: medidas resumo Nome: GABARITO

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

Medidas Descritivas de Posição, Tendência Central e Variabilidade

MEDIDAS DE POSIÇÃO. Lucas Santana da Cunha Universidade Estadual de Londrina. 26 de abril de 2017

Medidas de Centralidade

Aula 03. Medidas Descritivas de Variáveis Quantitativas. Parte 1 Medidas de Tendência Central

Unidade III Medidas Descritivas

Probabilidade e Estatística

Estatística Descritiva II

Medidas de Dispersão Prof. Walter Sousa

Aula 03. Medidas Descritivas de Variáveis Quantitativas. Parte 1 Medidas de Tendência Central

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

Introdução à Estatística Estatística Descritiva 22

Introdução à Bioestatística

Introdução à probabilidade e estatística I

Estatística Descritiva

INTRODUÇÃO À ESTATÍSTICA

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Estatística Descritiva

Estatística Descritiva

Estatística Aplicada ao Serviço Social AULA 06. Estatística Descritiva - Medidas de dispersão. Universidade Federal da Paraíba

Estatística Descritiva

Medidas Estatísticas NILO FERNANDES VARELA

Estatística I Aula 3. Prof.: Patricia Maria Bortolon, D. Sc.

André Arruda e Rafael Medeiros

Professora Ana Hermínia Andrade. Período

Lucas Santana da Cunha 12 de julho de 2017

Lucas Santana da Cunha de junho de 2018 Londrina

Bioestatística Aula 2

MEDIDAS DE POSIÇÃO. Lucas Santana da Cunha 10 de maio de Universidade Estadual de Londrina

BIOESTATÍSTICA AULA 2. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

ESTATÍSTICA. June 4, UFOP June 4, / 87

Métodos Estocásticos da Engenharia II

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

n = 25) e o elemento (pois = 19) e terá o valor 8. Verifique que antes e depois do 19 o elemento, teremos 18 elementos.

Medidas de Centralidade

ENGENHARIA DA QUALIDADE A ENG AULA 2 REVISÃO DE ESTATÍSTICA

Transcrição:

3 MEDIDAS RESUMO 3.2 Medidas de dispersão Silvio Sandoval Zocchi 20 de agosto de 2008

Medida de dispersão é um valor que quantifica a variabilidade dos dados. Algumas medidas de dispersão: Amplitude Amplitude Interquartílica Desvio absoluto médio Variância Desvio padrão Coeficiente de variação Índice de diversidade de Shannon-Wiener 1

3.2.1 Amplitude Amplitude ou amplitude total de uma série de dados é a diferença entre o maior e o menor valor observado. Amplitude = x [n] x [1] Exemplo: Resistências de uvas Niágara Produtor 7 Produtor 58 4 4 4 5 02489 5 4 6 134479 6 128 7 0233556666 7 4478 8 0223479 8 22445566667 9 249 9 234 10 044 10 37 11 0 11 034467 12 12 288 13 13 14 14 15 15 16 16 17 17 18 0 18 Legenda: 5 4=0,54 N 2

Produtor 7: Amplitude = 1,80 0,50 = 1,30N Produtor 58: Amplitude = 1,28 0,44 = 0,84N Defeito: a amplitude é muito afetada por dados atípicos extremos, ou seja, é uma medida muito pouco resistente à presença desses dados. 3.2.2 Amplitude Interquartílica Amplitude interquartílica (AIQ) é a diferença entre o terceiro e primeiro quartis. AIQ = Q 3 Q 1 Produtor 7: Q 1 = P 25 = x [9] +x [10] 2 = 0,64+0,67 2 = 0,655N Q 3 = P 75 = x [27] +x [28] 2 = 0,87+0,89 2 = 0,88N AIQ = Q 3 Q 1 = 0,88 0,655 = 0,225N 3

Produtor 58: Q 1 = P 25 = x [9] = 0,78N Q 3 = P 75 = x [26] = 1,10N AIQ = Q 3 Q 1 = 1,10 0,78 = 0,320N Interpretação: O produtor 7 apresentou cachos de uvas mais uniformes (ou menos variáveis) quanto à resistência. A amplitude interquartílica é uma medida de dispersão pouco afetada por dados atípicos extremos. Veremos agora medidas que visam quantificar o grau de variabilidade das observações em relação a um valor central. 4

3.2.3 Desvio absoluto médio Desvio absoluto médio (D m ) de uma série de observações é a média dos valores absolutos dos desvios das observações em relação à média aritmética das mesmas. D m = 1 n ( x 1 x + + x n x ) = 1 n n i=1 x i x Exemplo: Retardantes de crescimento (Tab.7). Tratamento X = Diâmetro vertical maior, em cm Controle 75 60 70 60 57 57 65 57 Clormequat 34 34 35 39 41 35 34 34 Uniconazole 33 32 31 37 28 31 38 32 Daminozide 55 80 65 76 60 70 60 72 Controle: x = 75 + + 57 8 = 62,625 62,6cm 5

75 62,625 + + 57 62,625 D m = 8 12,375 + + 5,625 = = 44,25 8 8 = 5,53125 5,5cm Exercício: Calcular a média e o desvio absoluto médio para os dados relativos aos outros tratamentos. Tratamento Média ( x) D m Controle 62,6 5,5 Clormequat 35,8 2,1 Uniconazole 32,8 2,4 Daminozide 67,3 7,3 Interpretação: Os retardantes de crescimento Clormequat e Uniconazole induziram a plantas mais baixas e com tamanhos mais uniformes (ou menos variáveis) do que as não tratadas (Controle). 6

3.2.4 Variância Variância é a média dos quadrados dos desvios das observações, em relação à média aritmética das mesmas. População conhecida: Seja µ a média dos N dados populacionais. Então, a variância é σ 2 = 1 N [(x 1 µ) 2 + + (x N µ) 2 ] = 1 N N i=1 (x i µ) 2 Como geralmente temos acesso somente uma amostra de n dados extraídos da população, tem-se que um bom estimador de σ 2, chamado variância amostral, é dado por s 2 = 1 n 1 = 1 n 1 = 1 n 1 [ (x1 x) 2 + + (x n x) 2] (1) n i=1 n i=1 (x i x) 2 (2) ( ni=1 x 2 i x i n ) 2 (3) 7

Exemplo: Retardantes de crescimento Controle: s 2 = (75 62,625)2 + + (57 62,625) 2 8 1 = (12,375)2 + + ( 5,625) 2 = 321,875 7 7 = 45,98cm 2 Note que n i=1 n i=1 x i = 75 + + 57 = 501 x 2 i = 75 2 + + 57 2 = 31697 Logo, usando a expressão (3) temos que: ( s 2 = 1 31697 5012 8 1 8 = 321,875 = 45,98cm 2 7 ) 8

Exercício: calcular as variâncias para os outros tratamentos. Controle: s 2 = 45,98cm 2 Clormequat: s 2 = 7,36cm 2 Uniconazole: s 2 = 10,79cm 2 Daminozide: s 2 = 75,64cm 2 Observação: A variância não possui a mesma unidade dos dados originais! Vejamos agora, como calcular as variâncias para dados agrupados em tabelas de freqüências Freqüência j x j f j 1 x 1 f 1 2 x 2 f 2 k x k f k Total n = k f j j=1 9

Exemplo: Avaliação do desempenho de semeadoras manuais (Molin et al, 2001) semeadora manual Um grande número de pequenas propriedades rurais no Brasil utiliza semeadoras manuais para a operação de semeadura Objetivo do trabalho: avaliar as semeadoras existentes no mercado, classificando-as quanto à regularidade de vazão dos seus mecanismos dosadores 10

Método: as semeadoras foram inicialmente reguladas de modo que a cair duas sementes de milho por golpe e em seguida, usando-se um sistema mecanizado, simularam o efeito de uma pessoa operando cada semeadora 150 vezes. Na seqüência, anotaram o número de sementes por golpe. 11

Resultados: Freqüências observadas do número de sementes caídas por golpe para a semeadora manual A Fórmula: N o de sementes por golpe Freqüência j x j f j 1 0 0 2 1 19 3 2 103 4 3 18 5 4 3 k = 6 5 7 Total n =150 s 2 = 1 n 1 = 1 n 1 k j=1 k j=1 f j (x j x) 2 ( kj=1 f j x 2 j f j x j n ) 2 12

Exemplo: k j=1 n i=1 f j x j f j x 2 i = f 1 x 1 + f 2 x 2 + + f k x k = 0 0 + 19 1 + + 7 5 = 326 = f 1 x 2 1 + f 2x 2 2 + + f kx 2 k = 0 0 2 + 19 1 2 + + 7 5 2 = 816 x = 326 150 s 2 = 1 150 1 = 2,173 sementes ( 816 3262 150 = 0,721 sementes 2 ) = 107,49333 149 13

Exercício: calcular a média e a variância dos números de sementes por golpe para as semeadoras B, C e D (Tabela 11) N o de sementes Semeadora por golpe A B C D 0 0 2 14 7 1 19 26 21 19 2 103 70 82 82 3 18 48 27 42 4 3 4 5 0 5 7 0 1 0 Total 150 150 150 150 14

Exemplo: Presença em sala de aula no 1 o semestre do curso, em %, segundo a intenção do estudo (somente para passar, ou não) Estudou só Presença Ponto para passar? (%) médio Não Sim ]60; 70] 65 0 11 ]70; 80] 75 7 30 ]80; 90] 85 22 26 ]90;100] 95 40 25 Total 69 92 Calcular a média e a variância da presença em sala de aula segundo a intenção do estudo Estudou só Presença para passar? (%) Não Sim Média ( x) 89,78 82,07 Variância (s 2 ) 45,91 100,08 15

3.2.5 Desvio padrão Desvio padrão é a raiz quadrada da variância. s = s 2 Tem a vantagem de possuir a mesma unidade dos dados originais. Exemplo: semeadora manual A Variância s 2 = 0,721 sementes 2 Desvio padrão s = 0,721 = 0,849 sementes Nota: Para dados com distribuição unimodal simétrica com formato de sino, espera-se que a grande maioria (aproximadamente 95%) do dados pertençam ao intervalo [ x 2s; x + 2s] 16

3.2.6 Coeficiente de variação CV = s x 100% É uma medida de dispersão relativa. Serve para comparar as dispersões de diferentes variáveis. Exemplo: Qual variável apresenta maior variabilidade? Altura ou Peso? Altura (cm) Peso (kg) Média 172,8 68,1 Desvio padrão 12,1 9,82 CV (%) 7,0 14,4 17

3.2.7 Índice de diversidade de Shannon- Wiener É uma medida de dispersão adequada para variáveis qualitativas. É dada por: H = log n 1 n k j=1 f j log f j sendo: k = número de categorias com freqüências não nulas; f j = freqüência da j-ésima categoria e n = número total de observações. Exemplo: Moradia de 162 alunos segundo o sexo. Sexo Moradia F M Com até 2 colegas 7 27 Com 3 colegas ou mais 21 59 Família 5 15 CEU ou Vila 7 6 Outros 2 13 Total geral 42 120 18

Sexo feminino: H = log42 1 (7log7 + + 2log2) 42 = 0,583 Sexo masculino: H = log120 1 (27log27 + + 13log13) 120 = 0,580 Como o valor máximo que H pode atingir é H max = log k, podemos utilizar para a comparação de variáveis com diferentes números de categorias, o índice H padronizado, também chamado índice de eqüitabilidade, dado por J = H log k Exemplo: Sexo feminino: J = 0,583 log5 = 0,833 Sexo masculino: J = 0,580 log5 = 0,830

Exercício: Comparar as diversidades de gêneros de nematóides antes e depois do plantio. Tabela 10. Números de nematóides de solo, segundo o gênero e a época do ano. Época do ano Antes do Depois da Gênero plantio colheita Total Helicotylenchus 13972 29997 43969 Pratylenchus 1312 1924 3236 Mesocriconema 2044 1164 3208 Trichodorus 1088 970 2058 Scutellonema 720 980 1700 Heterodera 16 332 348 Meloidogyne 48 64 112 Aphelenchoides 108 0 108 Rotylenchulus 0 56 56 Xiphinema 8 0 8 Total 19316 35487 54803 19

Exercício. Qual variedade apresenta intensidade de odor menos variável? Tabela. Distribuição de freqüências da intensidade do odor de pedaços de abacaxi, emitidas por 40 provadores, segundo a variedade. Intensidade Variedade de abacaxi do odor Smooth Cayenne Pérola muito fraco 2 5 fraco 9 14 médio 15 12 forte 10 8 muito forte 4 1 Total 40 40 Resposta: Variedade Estatística Cayenne Pérola H 0,621 0,609 J 0,889 0,872 Apresentam dispersões semelhantes 20

Considerações adicionais Como detectar dados atípicos de uma maneira simples e rápida? Como representar as informações fundamentais de conjuntos de dados por meio de um desenho? Uma solução, proposta por Tukey (1970, 1979), é construir o chamado gráfico de caixa (ou box-plot, em inglês), que fornece as seguintes informações: presença ou não de valores atípicos medida de posição: mediana medidas de dispersão: amplitude interquartílica e amplitude dos dados sem considerar os dados atípicos classificação da distribuição quanto à simetria 21

Procedimento para a construção do gráfico de caixa: 1. Calcular os quartis: Q 1, Q 2 = Md e Q 3 e a amplitude interquartílica AIQ = Q 3 Q 1 2. Verificar se há dados atípicos, isto é, se há valores não pertencentes ao intervalo [Q 1 1,5 AIQ; Q 3 + 1,5 AIQ] 3. Calcular o menor (L 1 ) e maior (L 2 ) valores sem considerar os atípicos 4. Construir o gráfico de caixa seguindo o esquema abaixo L 1 Q 1 Q 2 Q 3 L 2 22

Exemplo: Resistências de uvas Niágara Produtor Estatísticas P7 P58 1 o Quartil (Q 1 ) 0,655 0,780 Mediana (Md) 0,760 0,860 3 o Quartil (Q 3 ) 0,880 1,100 Ampl. interq. (AIQ) 0,225 0,320 Q 1 1,5 AIQ 0,3175 0,300 Q 3 + 1,5 AIQ 1,2175 1,580 Dados atípicos 1,80 não há L 1 0,50 0,44 L 2 1,10 1,28 Produtor P58 P7 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 Resistência (N) 23

Classificação da distribuição quanto ao formato Simétrica Assimétrica à direita Assimétrica à esquerda Bimodal 24

Exemplo: Densidade do solo em função do manejo Densidade 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 Feijão Floresta Pastagem Seringueira Manejo 25