MEDIDAS DE DISPERSÃO lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 31 de maio de 2017
relativo (DPR) São medidas que visam fornecer o grau de variabilidade ou dispersão dos dados; Com elas é possível observar o quanto os valores do conjunto de dados estão dispersos de uma medida central;
relativo (DPR) Dois ou mais conjuntos de dados podem ter a mesma média, mas serem muito diferentes na composição dos seus valores. Por exemplo: Grupo Valores Média A 5 5 5 5 B 4 5 6 5 C 1 5 9 5 A média dos três grupos é a mesma (5), mas no grupo A não há variação entre os dados, enquanto no grupo B a variação é menor que no grupo C.
relativo (DPR) Em geral, um alto grau de uniformidade ou pequena dispersão é desejável. As principais medidas de variabilidade são: ; ; ; ; relativo; Coeficiente de variação.
Amplitude Total relativo (DPR) É a diferença entre o maior e o menor valor da série de dados A T = max(y i ) min(y i ) Sua utilização é limitada, pois se resume apenas aos dados extremos; Dois conjuntos de dados podem apresentar a mesma amplitude total, mesmo que tenham dispersão muito diferente; Não é muito utilizada como medida de dispersão.
relativo (DPR) É a diferença entre o terceiro quartil e o primeiro quartil, ou seja, d q = Q 3 Q 1 Em outras palavras, é o intervalo para 50% dos dados do meio; Supera a dependência dos valores extremos;
relativo (DPR) A variância é a medida de variabilidade que utiliza todos os dados, sendo assim, a mais utilizada; Avalia a dispersão dos dados de forma a complementar as informações contidas na média; Pode-se calcular a variância para dados provenientes de uma população ou amostra e de dados não agrupados (brutos) ou agrupados em classes.
Dados não agrupados relativo (DPR) Para dados populacionais σ 2 = n (y i µ) 2 ; N i=1 Para dados amostrais S 2 = n i=1 (y i ȳ) 2 n 1.
relativo (DPR) Desenvolvendo o quadrado tem-se S 2 = n i=1 y 2 i ( n i=1 y i) 2 n n 1 Exemplo 1 Os pesos, em kg, de 14 coelhos da raça Nova Zelândia Branco foram anotados, obtendo-se os seguintes valores: 3,7 3,8 4,0 4,1 4,2 4,5 4,6 4,8 5,0 5,2 5,4 5,6 5,7 6,0 Calcule a amplitude total, interquartil e a variância para os dados acima.
Dados agrupados relativo (DPR) Para dados agrupados S 2 = k i=1 (y i ȳ) 2 n i n 1 Desenvolvendo o quadrado tem-se S 2 = k i=1 y i 2n i ( k i=1 y i n i) 2 n n 1
relativo (DPR) Exemplo 2 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 1: Distribuição dos pesos (kg) de 30 cães da raça Pastor Alemão. Peso n i f i 5 11 1 0,03 11 17 5 0,17 17 23 8 0,27 23 29 7 0,23 29 35 4 0,13 35 41 5 0,17 TOTAL 30 1,000 Qual a variância dos pesos dessa amostra de cães da raça Pastor Alemão?
relativo (DPR) A variância tem unidade de medida elevada ao quadrado, gerando escalas sem sentido prático. O desvio padrão é, simplesmente, a raiz quadrada da variância, S = S 2 Tem a mesma unidade de medida dos dados observados. Exemplo 3 Calcule o desvio padrão para o conjunto de dados dos exemplos 1 e 2.
DPR relativo (DPR) A interpretação do desvio padrão depende da ordem da grandeza da variável em estudo; O desvio padrão relativo (DPR ou s r ) expressa a variabilidade dos dados de modo independente da sua unidade de medida utilizada: DPR = S r = S ȳ
CV relativo (DPR) Se o desvio padrão relativo é multiplicado por 100%, tal medida é denominada coeficiente de variação, ou seja, CV = S ȳ x100 Quanto menor o coeficiente de variação, mais homogêneo é o conjunto de dados; Essa medida pode ser bastante útil na comparação de duas variáveis ou dois grupos que a princípio não são comparáveis;
relativo (DPR) Pode-se quantificar o grau de variabilidade: Baixa dispersão: CV < 15%; Média dispersão: 15% < CV < 30%; Alta dispersão: CV > 30%
relativo (DPR) Exemplo 4 Os níveis de ácido úrico, em (mg/100 ml), encontrados nos exames bioquímicos de sangue de 16 animais de uma certa raça em um laboratório, são os seguintes: 5,1 4,0 6,4 5,0 6,0 5,5 5,5 6,0 6,2 9,0 5,2 5,5 5,7 7,5 7,0 8,0 Determine o coeficiente de variação. A dispersão dos níveis de ácido úrico é baixa, média ou alta?
relativo (DPR) Exercício 1 O tempo, em meses, entre a remissão de uma doença e a recidiva de 36 animais de uma determinada cĺınica foi registrado. Os dados ordenados são apresentados a seguir, separadamente para machos (M) e fêmeas (F): Machos 2 3 4 4 7 7 8 9 10 12 15 15 16 18 18 22 22 24 Fêmeas 2 3 3 4 5 6 6 7 7 7 8 8 10 10 11 11 12 18 Para o conjunto de dados: a) Calcule a amplitude total, interquartil, a variância e o desvio padrão do tempo para cada gênero; b) Calcule o coeficiente de variação para cada gênero e o interprete.
relativo (DPR) Exercício 2 Calcular a variância, o desvio padrão e o coeficiente de variação das variáveis Altura (cm), Peso (kg) e Idade (anos) do Formulário Iniciação à Estatística. Qual variável apresenta maior variabilidade?