Estatística Aplicada às Ciências Sociais Sexta Edição Pedro Alberto Barbetta Florianópolis: Editora da UFSC, 2006 Cap. 6 Medidas descritivas Análise descritiva e exploratória de variáveis quantitativas
Medidas Descritivas Descrevem características importantes de distribuições de valores Exemplo: Famílias Renda média Local observadas (sal. mín.) Monte Verde 40 8,1 Pq. Da Figueira 42 5,8 Encosta do Morro 37 5,0
Exemplo Notas finais dos alunos de três turmas Turma Notas dos alunos A 4 5 5 6 6 7 7 8 B 1 2 4 6 6 9 10 10 C 0 6 7 7 7 7,5 7,5 Qual turma teve melhor desempenho? Vamos calcular as médias X X = n
Exemplo Notas finais dos alunos de três turmas Turma Notas dos alunos Média da turma A 4 5 5 6 6 7 7 8 6,00 B 1 2 4 6 6 9 10 10 6,00 C 0 6 7 7 7 7,5 7,5 6,00 X X = n A média é uma medida-resumo (não fornece todas as informações dos dados)
Diagrama de Pontos A: 4 5 5 6 6 7 7 8 4 5 6 7 8 Média
Diagrama de pontos das três turmas e indicação das respectivas médias Turma A Turma B Turma C 0 2 4 6 8 10 12 notas
Como medira dispersão? Exemplo: Turma A (4 5 5 6 6 7 7 8) 4 5 6 7 8 Distância (desvio) de um valor em relação à média
Desvios quadráticos e a variância Descrição Notação Resultados numéricos Soma Valores (notas dos alunos) X 4 5 5 6 6 7 7 8 48 Média X 6 Desvios X X -2-1 -1 0 0 1 1 2 0 Desvios quadráticos X X 4 1 1 0 0 1 1 4 12 ( ) 2 S 2 ( X X ) = n 1 2 S 2 = (4 + 1 + 1 + 0 + 0 + 1 + 1 + 4) / 7 = 12 / 7 = 1,71
Desvio Padrão: S O desvio padrão (S) é a raiz quadrada da variância. Ex: S = 1,71 = 1,31
Comparação das três turmas pela média e desvio padrão turma notas X S A 4 5 5 6 6 7 7 8 6 1,31 B 1 2 4 6 6 9 10 10 6 3,51 C 0 6 7 7 7 7,5 7,5 6 2,69 Interpretar
Cálculo de S S = X 2 nx n 1 2 X: 4 5 5 6 6 7 7 8 X = 6 X 2 : 16 25 25 36 36 49 49 64 X 2 = 300
Cálculo de S S = X 2 nx n 1 2 X = 6 X 2 = 300 S= 300 8.(6) 7 2 = 300 7 288 = 12 7 =1,31
Outro exemplo TABELA Medidas descritivas das notas finais dos alunos de três turmas Turma Número de alunos Média Desvio padrão A B C 20 40 30 6,0 8,0 9,0 3,3 1,5 2,6 Interpretar
Medidas baseadas na ordenação dos dados 25% 25% 25% 25% Q I M d Q S Quartil inferior mediana Quartil superior
Média e mediana 50% dos valores 50% dos valores 0 10 20 30 40 50 60 70 Md = 22,5 X = 24,7
Média e mediana (a) Distribuição simétrica 50% 50% média = mediana 50% (b) Distribuição assimétrica 50% mediana média
Cálculo da mediana Conjunto de notas da Turma C: {0; 6; 7; 7; 7; 7,5 7,5} Posição da mediana com os dados ordenados: (n+1)/2 posição: (7+1)/2 = 4 M d = 7. E se n for par, fazendo com que (n+1)/2 seja fracionário?
Cálculo da mediana Dados: {2, 0, 5, 7, 9, 1, 3, 4, 6, 8} n = 10 Posição da mediana : (n + 1) / 2 = 5,5 Ordenando os dados: 0 1 2 3 4 5 6 7 8 9 M d = (4+5)/2 = 4,5
Cálculo dos quartis 0 1 2 3 4 5 6 7 8 9 M d = 4,5 E i = 0 E s = 9 Q i = 2 Q s = 7
Exercício: Cálculo dos quartis 0 1 2 3 4 5 6 7 8 9 100 E i = 0 M d = 5 E s = 100 Q i = 2,5 Q s = 7,5
Diagrama em caixas 25% 25% 25% 25% 25% 25% 25% 25%
Diagrama em caixas E S Q S + 1,5(Q S Q I ) Q S M d Q I E I
Diagrama em caixas Renda familiar (sal. mín.) 28 23 18 13 8 3 Interpretar Monte Verde Encosta do Morro
Análise exploratória de dados Análise univariada Variável qualitativa Variável quantitativa Distribuição de freqüências Percentagens Distribuição de freqüências Medidas descritivas (média, desvio padrão, mediana etc.) Tabela Gráfico de barras, colunas ou setores Histograma Ramo-e-folhas
Análise exploratória de dados Análise biivariada Uma variável quantitativa e outra qualitativa Duas variáveis qualitativas Duas variáveis quantitativas Medidas descritivas da variável quantitativa em cada categoria da qualitativa Diagrama em caixas múltiplo Tabela de contingência Diagrama de dispersão Coeficiente de correlação