UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA ENG C 18 Métodos de Pesquisa Quantitativos e Qualitativos AULA 5 MEDIDAS DESCRITIVAS DOCENTE: CIRA SOUZA PITOMBO
O que vimos até aqui? Análise exploratória de dados: Qualitativos Quantitativos Nas aulas anteriores organização de dados em distribuição de freqüências
MEDIDAS DESCRITIVAS VARIÁVEIS QUANTITATIVAS Conhecer o peso típico de recém-nascidos numa comunidade Média ou Mediana Para se ter idéia da magnitude de variação do peso das crianças Desvio Padrão Nesta aula iremos calcular e interpretar certas medidas que descrevem informações específicas de um conjunto de valores
MÉDIA E DESVIO PADRÃO MÉDIA ARITMÉTICA Soma dos valores dividida pelos valores observados De modo geral, dado um conjunto de n valores observados de uma certa variável X, podemos definir a média aritmética por: X X n X Indica a soma dos valores observados da variável X
MÉDIA E DESVIO PADRÃO MÉDIA ARITMÉTICA Turma Notas Média A 4 5 5 6 6 7 7 8 6,0 B 1 2 4 6 6 9 10 10 6,0 Turma A Turma B Turma C C 0 6 7 7 7 7,5 7,5 6,0 0 1 2 3 4 5 6 7 8 9 10 Diferentes formas de dispersão dos dados
VARIÂNCIA E DESVIO PADRÃO Tanto a variância quanto o desvio padrão são medidas que fornecem informações complementares à informação contida na média aritmética Tais medidas avaliam a dispersão do conjunto de valores em análise Para calcularmos a variância ou o desvio padrão, devemos considerar os desvios de cada valor em relação à média aritmética. Depois construímos uma espécie de média desses desvios.
VARIÂNCIA E DESVIO PADRÃO Valores (notas dos alunos) X 4 5 5 6 6 7 7 8 Média X 6 Desvios X X -2-1 -1 0 0 1 1 2 Desvios quadráticos 2 ( X X ) 4 1 1 0 0 1 1 4 Variância Desvio padrão S 2 ( X X ) n 1 2 S ( X X ) n 1 2 O Desvio padrão será sempre não negativo e será tão maior quanto mais dispersos forem os valores em análise
MÉDIA E DESVIO PADRÃO MÉDIA ARITMÉTICA Turma Notas Média A 4 5 5 6 6 7 7 8 6,0 B 1 2 4 6 6 9 10 10 6,0 C 0 6 7 7 7 7,5 7,5 6,0 Desvio Padrão 1,31 3,51 2,69 Turma A Turma B Turma C 0 1 2 3 4 5 6 7 8 9 10 Diferentes formas de dispersão dos dados
Fórmulas para Média e Desvio padrão Ao calcular o desvio padrão nos casos em que a média X acusar um valor fracionário, os desvios, X X, acumularão erros de arredondamento, que poderão comprometer o resultado final. 2 2 X nx S X 2 n 1 X 2 Soma dos valores quadráticos Média elevada ao quadrado n = número de valores
EXERCÍCIO 1 Calcule a Média, Desvio Padrão e Variância dos dados acima
MÉDIA PONDERADA O Cálculo da média e do desvio padrão por ponderação é feito sempre que precisamos dar mais importância a um caso do que outro X p X n X 7.39 9 ( IDHxPOP) POP 0.82 607500.73 709941 Média Simples 0,855 Média Ponderada
EXERCÍCIO 1 Calcule a Média, Desvio Padrão e Variância dos dados acima
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1
EXERCÍCIO 1 Statistics N Mean Std. Dev iation Variance Valid Missing Números de moradores Renda no domicílio Familiar 20 20 0 0 2. 60 1315.00 1. 231 897.086 1. 516 804763. 2
A MEDIANA A mediana avalia o centro de um conjunto de valores, sob o critério de ser o valor que divide a distribuição ao meio, deixando os 50% menores valores de um lado e os 50% maiores valores do outro lado. {2, 3, 4, 5, 8} Dado um conjunto de n valores, definimos mediana como o valor, Md, que ocupa a posição n+1/2, considerando os dados ordenados crescente ou decrescentemente. Se n+1/2 for fracionário, toma-se como mediana a média dos dois valores de posições mais próximas a n+1/2 {0; 6; 7; 7; 7; 7,5; 7,5 } n 1 2 7 1 2 Posição: 4
EXERCÍCIO 2 Determine a mediana para os exemplos abaixo {5,3,2,8,4} {3,5,6,7,10,11}
EXERCÍCIO 3 Determine a mediana para as variáveis numéricas para o caso abaixo
COMPARAÇÃO ENTRE MÉDIA E MEDIANA Em geral, dado um conjunto de valores, a média é a medida de posição central mais adequada, quando se supõe que estes valores tenham uma distribuição razoavelmente simétrica, enquanto que a mediana surge como uma alternativa para representar a posição central em distribuições muito assimétricas Muitas vezes, calculam-se ambas as medidas para avaliar a posição central sob dois enfoques diferentes. 50% 50% Média = mediana
COMPARAÇÃO ENTRE MÉDIA E MEDIANA Em geral, dado um conjunto de valores, a média é a medida de posição central mais adequada, quando se supõe que estes valores tenham uma distribuição razoavelmente simétrica, enquanto que a mediana surge como uma alternativa para representar a posição central em distribuições muito assimétricas Muitas vezes, calculam-se ambas as medidas para avaliar a posição central sob dois enfoques diferentes. 50% 50%
COMPARAÇÃO ENTRE MÉDIA E MEDIANA Em geral, dado um conjunto de valores, a média é a medida de posição central mais adequada, quando se supõe que estes valores tenham uma distribuição razoavelmente simétrica, enquanto que a mediana surge como uma alternativa para representar a posição central em distribuições muito assimétricas Muitas vezes, calculam-se ambas as medidas para avaliar a posição central sob dois enfoques diferentes. 50% 50%
EXERCÍCIO 3 Determine a mediana para as variáveis numéricas para o caso abaixo
EXERCÍCIO 3 Statistics N Median Valid Missing Números de moradores Renda no domicílio Familiar 20 20 0 0 3. 00 1000.00
QUARTIS E EXTREMOS Chamamos de extremo inferior, Ei, ao menor valor dos dados em análise. Chamamos de extremo superior, Es, ao maior valor dos dados em análise. {5,3,6,11,7} Chamamos de Primeiro Quartil ou Quartil inferior, Qi, ao valor que delimita os 25% menores valores. Chamamos de Terceiro Quartil ou Quartil superior, Qs, ao valor que delimita os 25% maiores valores. Chamamos de Segundo Quartil ou Quartil do meio, Mediana, ao valor que separa os 50% menores valores dos 50% maiores valores.
QUARTIS E EXTREMOS {2,0,5,7,9,1,3,4,6,8} Ordenando : 0 1 2 3 4 5 6 7 8 9 n 1 2 10 1 2 Posição: 5, 5 Média entre a 5ª e 6ª posições = 4,5 - Mediana 0 1 2 3 4 4,5 5 6 7 8 9 n 1 2 5 1 2 Posição: 3 0 1 2 3 4 4,5 5 6 7 8 9 Qs=7 Qi=2 n 1 2 5 1 2 Posição: 3
EXERCÍCIO 4 Determine os extremos e quartis para as variáveis numéricas abaixo
EXERCÍCIO 4
EXERCÍCIO 4
EXERCÍCIO 4 Statisti cs N Percentiles Valid Missing 25 50 75 Números de moradores Renda no domicílio Familiar 20 20 0 0 1. 25 562.50 3. 00 1000.00 3. 75 2000.00
DIAGRAMA EM CAIXAS Box-plot Representação pictória da distribuição dos dados Os limites superior e inferior da caixa marcam os quartis superior e inferior da distribuição dos dados O comprimento da caixa é a distância entre o 25º percentil e o 75º percentil, de forma que a caixa contém 50% dos valores centrais dos dados Quanto maior a caixa, maior a dispersão das observações As linhas que se estendem de cada caixa (chamadas de whiskers) representam a distância à menor e à maior observação que estão a menos de um quartil da caixa
DIAGRAMA EM CAIXAS O boxplot é um gráfico que possibilita representar a distribuição de um conjunto de dados com base em alguns de seus parâmetros descritivos, quais sejam: a mediana (q2), o quartil inferior (q1), o quartil superior (q3) e do intervalo interquartil (IQR = q3 - q1).
DIAGRAMA EM CAIXAS O boxplot permite avaliar a simetria dos dados, sua dispersão e a existência ou não de outliers nos mesmos, sendo especialmente adequado para a comparação de dois ou mais conjuntos de dados correspondentes às categorias de uma variável qualitativa.
DIAGRAMA EM CAIXAS O gráfico acima apresenta a distribuição da variável ilc segundo as categorias da variável situação. Observando o gráfico, verificase que as empresas classificadas como solventes possuem índices de liquidez corrente em geral maiores que os índices das empresas classificadas como insolventes.
EXERCÍCIO 5 Faça diagramas de caixa fazendo o cruzamento entre a variável qualitativa região e as numéricas
EXERCÍCIO 5
EXERCÍCIO 5
EXERCÍCIO 5
EXERCÍCIO 5
EXERCÍCIO 5
EXERCÍCIO 5