Módulo IV Medidas de Variabilidade ESTATÍSTICA
Objetivos do Módulo IV Compreender o significado das medidas de variabilidade em um conjunto de dados Encontrar a amplitude total de um conjunto de dados Encontrar a variância e o desvio padrão de uma amostra Calcular o coeficiente de variação e a variável padronizada e verificar quando e onde podem ser utilizadas.
Medidas de Variabilidade ou Dispersão Invariavelmente as observações individuais irão apresentar alguma dispersão em torno do valor médio. Isso é chamado de variabilidade ou dispersão dos dados. Medidas de variabilidade: indicam como os pontos estão dispersos em torno do valor médio.
Amplitude Total A amplitude total é definida como a diferença entre o maior e o menor valor das observações. A amplitude é fácil de calcular e fornece uma ideia da magnitude da faixa de variação dos dados. Não informa a respeito da dispersão dos valores que caem entre os dois extremos. Quando n < 10 pode resultar em uma medida de variação bastante satisfatória
Amplitude Total Exemplo: Os dados a seguir representam a espessura de uma peça mecânica (em mm). Amplitude total = 29,6 20,4 = 9,2 mm
Desvio Padrão Para uma amostra de n observações, x1,..., xn, o desvio padrão S é definido como: A vantagem do desvio padrão é que trata-se de uma medida de variabilidade que leva em conta toda a informação contida na amostra. A desvantagem é que seu cálculo é mais trabalhoso. Quando a amostra é grande (n > 30) ou quando tratase da população usa-se n no denominador. O desvio-padrão de uma população é representado por σ.
Variância A variância S 2 é definida como o quadrado do desvio padrão. A variância de uma população é representada pela letra grega σ 2
Desvio Padrão / Variância Exemplo: Os salários inicias abaixo listados são para uma filial da empresa em Chicago. A empresa tem várias outras filiais e planeja-se usar os salários iniciais de Chicago para estimar os salários iniciais da população maior. Encontre o desvio padrão dos salários iniciais da amostra. Salários iniciais (milhares de dólares) 41 38 39 45 47 41 44 41 37 42 Lembrar μ = 41,5. (Larson Faber Estatística Aplicada 4ª edição, Pearson, 2010)
Desvio padrão / Variância Salário, x Desvio: x μ Quadrados: (x μ) 2 41 41 41,5 = 0,5 ( 0,5) 2 = 0,25 38 38 41,5 = 3,5 ( 3,5) 2 = 12,25 39 39 41,5 = 2,5 ( 2,5) 2 = 6,25 45 45 41,5 = 3,5 (3,5) 2 = 12,25 47 47 41,5 = 5,5 (5,5) 2 = 30,25 41 41 41,5 = 0,5 ( 0,5) 2 = 0,25 44 44 41,5 = 2,5 (2,5) 2 = 6,25 41 41 41,5 = 0,5 ( 0,5) 2 = 0,25 37 37 41,5 = 4,5 ( 4,5) 2 = 20,25 42 42 41,5 = 0,5 (0,5) 2 = 0,25 Σ(x μ) = 0 (x μ) 2 = 88,5
Desvio Padrão / Variância Variância da Amostra s 2 ( ) x x n 1 2 88,5 10 1 9,8 Desvio Padrão da Amostra s s 2 ( x n 1 x) 2 9,8 3,1 O desvio da amostra é de aproximadamente 3,1 ou $3.100
Interpretando o desvio padrão Desvio padrão é a medida do valor típico que uma entrada desvia da média Quanto mais as entradas estão espalhadas, maior o desvio padrão (Larson Faber Estatística Aplicada 4ª edição, Pearson, 2010)
Interpretando desvio padrão: Regra Empírica (Regra 68 95 99.7) Para dados com uma distribuição em formato de sino (simétrico), o desvio padrão tem as seguintes características: Cerca de 68% dos dados estão dentro de um desvio padrão da média Cerca de 95% dos dados estão dentro de dois desvios padrão da média Cerca de 99,7% dos dados estão dentro de três desvios padrão da média
Interpretando desvio padrão: Regra Empírica (Regra 68 95 99.7) 99,7% dentro de três desvios padrão 95% dentro de dois desvios padrão 68% dentro de um desvio padrão 34% 34% 2.35% 2.35% 13.5% 13.5% x 3s x 2s x s x x s x 2s x 3s
Usando a regra empírica Em uma pesquisa conduzida pelo National Center for Health Statistics, a amostragem média da altura de mulheres nos Estados Unidos (20-29 anos) era de 64 polegadas, com um desvio padrão da amostragem de 2,71 polegadas. Estime a porcentagem de mulheres que estão entre 64 e 69,42 polegadas. (Larson Faber Estatística Aplicada 4ª edição, Pearson, 2010)
Usando a regra empírica 34% 13.5% 55,87 58,58 61,29 64 66,71 69,42 72,13 x 3s x 2s x s x x s x 2s x 3s 34% + 13,5% = 47,5% das mulheres estão entre 64 e 69,42 polegadas.
Coeficiente de Variação É definido como o quociente entre o desvio padrão e a média e, em geral, é expresso em percentual. O coeficiente de variação é uma medida adimensional, útil para comparar resultados de amostras cujas unidades podem ser diferentes. Uma desvantagem do coeficiente de variação é que ele deixa de ser útil quando a média é próxima de zero
Coeficiente de Variação Exemplo Grupo 1: Média=2,49 mm, Desvio Padrão=0,12 mm Grupo 2: Média=3,75 cm, Desvio Padrão=0,15 cm CV1=0,12/2,49 *100 = 4,8% CV2=0,15/3,75 *100 = 4,0% segundo grupo é mais preciso (homogêneo)
Variável Reduzida ou Padronizada Mede a magnitude do desvio em relação à média, em unidades do desvio padrão. Z = 1,5 significa uma observação desviada 1,5 desvios padrão para cima da média.
Variável reduzida ou padronizada A variável reduzida é muito útil para comparar distribuições e detectar dados atípicos. Dados são considerados atípicos quando Z > 3. Distribuição Normal Reduzida ou Padronizada
Variável Reduzida ou Padronizada Exemplo O engenheiro está analisando as espessuras de peças fabricadas em duas máquinas de corte. O operador mediu uma peça da máq. A com espessura de 90 mm e outra peça da máq. B com espessura de 100 mm. O engenheiro deve considerar esses dados reais ou atípicos?
Variável Reduzida ou Padronizada A máq. A possui média 51mm e desvio-padrão de 12mm. A máq. B possui média 72mm e desvio-padrão de 16mm.