UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS Departamento de Estatística Luiz Medeiros http://www.de.ufpb.br/~luiz/
As medidas de posição apresentadas fornecem a informação dos dados apenas a nível pontual, sem ilustrar outros aspectos referentes à forma como os dados estão distribuídos na amostra. As medidas de dispersão são utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média.
Exemplo: Notas de três turmas de Cálculo das Probabilidades da UFPB Observações importantes i) As três turmas possuem a mesma média. ii) As notas estão distribuídas sob diferentes formas. iii) A média resume o conjunto de dados apenas posição central. iv) A média não fornece informações sobre a variabilidade dos dados. Solução: Apresentar junto da média uma medida que sumarize a variabilidade do conjunto de dados.
Amplitude Total: Uma forma simples de medir a dispersão em um conjunto de observações é através da amplitude total: h = max(x 1,...,X n ) min(x 1,...,X n ) Verifica-se que a amplitude como medida de dispersão é limitada. Essa medida só depende dos valores extremos, ou seja, não é afetada pela dispersão dos valores internos Desvio Médio: Mede a dispersão ou grau de concentração dos valores em torno da média. a) Para dados não agrupados: b) Para dados agrupados:
A variância é definida como a média aritmética do quadrado dos desvios, definidos por X i X. É uma quantidade sempre não negativa e expressa em unidades quadradas do conjunto de dados, sendo de difícil interpretação. Dessa forma, a) Para dados não agrupados: Na prática não conhecemos toda a população. Logo, utilizamos a variância amostral, dada por:
b) Para dados agrupados: Na prática não conhecemos toda a população. Logo, utilizamos a variância amostral,dada por:
Desvio Padrão: O desvio padrão mede o desvio de cada uma das observações X i em relação à média, e é definido da seguinte forma: X σ = σ 2 (Desvio Padrão Populacional) S = S 2 (Desvio Padrão Amostral) Esta definição vale tanto para dados agrupados como para dados não agrupados. Importante: O desvio padrão é uma medida de variabilidade expressa na mesma unidade de medida da variável.
Coeficiente de Variação: É uma medida relativa de dispersão, útil para comparar a variabilidade de observações com diferentes unidades de medida. É definida por: σ CV = 100 µ (populacional) CV S = x 100 (Amostral) É adimensional e frequentemente expresso em percentagem. Exemplo: VALORES MÉDIA D.P. C.V. 1-2 - 3 2 1 0,5 100-200 - 300 200 100 0,5 101-102 - 103 102 1 0,01
ASSIMETRIA Assimetria: A medida de assimetria indica o grau de distorção da distribuição em relação a uma distribuição simétrica. As distribuições podem ser: simétrica, assimétrica positiva ou assimétrica negativa. 1- Quando o desvio padrão e a média estão disponíveis, x Mo A S = ou A S = S x Mo σ 2- Quando a média e o desvio padrão são desconhecidos, Classificação: A S = (Q 3 + Q 1 2M e )/(Q 3 - Q 1 ) 2.1 Se A S = 0 a distribuição é simétrica; 2.2 Se A S > 0, a distribuição é assimétrica positiva; 2.3 Se A S < 0, a distribuição é assimétrica negativa;
CURTOSE Curtose: Mede o grau de achatamento distribuição. As curvas associadas ao achatamento são classificadas como: Para medir o grau de curtose, utilizamos K = (Q 3 Q 1 )/2x(P 90 P 10 ) 1. Se K = 0,263 a curva é mesocúrtica; 2. Se K > 0,263, a curva é platicúrtica; 3. Se K < 0,263, a curva é leptocúrtica. de grau uma de
Exemplo: Calcular o desvio médio, desvio padrão, coeficiente de variação e o grau de assimetria e curtose.
Exemplo: Calcular o desvio médio, desvio padrão, coeficiente de variação e o grau de assimetria e curtose.