Sumário dos exemplos: I Representação gráfica para Variáveis Quantitativas II Histograma para variáveis contínuas no soft MINITAB III Tabela de freqüências e histograma para v. contínuas, no Excel IV Exemplo Estatísticas Descritivas de dados contínuos V Estatísticas Descritivas no soft MINITAB VI Estatísticas Descritivas no EXCEL VII Exemplos de Dados Agrupados VIII Representação gráfica para Variáveis Qualitativas IX Histogramas pelo número de observações
I - Representação gráfica para Variáveis Quantitativas: Gráfico de pontos no MINITAB Gráfico de pontos para horas de TV 0 10 horas 0 30 Estatísticas descritivas no MINITAB Descriptive Statistics: horastv Variable N Mean Median TrMean StDev SE Mean horastv 50 10.780 10.000 10.73 6.891 0.974 Variable Minimum Maximum Q1 Q3 horastv 0.000 30.000 5.000 14.000
II - Histograma para variáveis contínuas no MINITAB Histograma de horas de TV 0 Freqüência 10 0 0 6 1 18 4 30 horas Outros limites Histograma de horas de TV 15 Freqüência 10 5 0 0.0 5.5 11.0 16.5.0 7.5 33.0 horas
III - Tabela de freqüências e histograma para v. contínuas, no Excel. Bloco Freqüência 0 1 4.3 6 8.6 13 1.9 15 17.1 7 1.4 4 5.7 Mais Histograma 16 1 Freqüência 8 4 Freqüência 0 0 4.3 8.6 1.9 17.1 1.4 5.7 Mais Bloco
IV - Exemplo Estatísticas Descritivas de dados contínuos: Variável: Renda PC por grupo (exposto e não exposto) Grupo EXP 68 96 100 100 11 11 117 10 10 135 150 160 160 00 60 x ~ reais x ( 8 ) - Mediana: 10-1 o Quartil: Q 1 x (4) 100 reais - 3 o Quartil: Q 3 x (1) 160 reais x n 010 - Média: x 134 reais 15 - Variância: x 30094 s 30094 15 134 x nx ( ) (n 1) ( 15 1) 3160 s 57, 86 14 30094 69340 14 - desvio-padrão: s s 57,86 47, 51 reais
Box-plot renda per capita 50 150 50 Grupo Exposto Freqüência 8 7 6 5 4 3 1 0 35 85 135 185 35 85 Grupo Exposto
Grupo NEXP 36 50 70 84 108 109 10 10 150 150 180 0 50 60 300 x ~ reais x ( 8 ) - Mediana: 10-1 o Quartil: Q 1 x (4) 184 reais - 3 o Quartil: Q 3 x (1) 0 reais x n 07 15 - Média: x 147, 13 reais - Variância: x 413997 s x nx (n 1) 413997 15( 147, 13) ( 15 1) 413997 3473, 7 14 8973, 73 s 14 6376, 695 - desvio-padrão: s s 6376, 695 79, 85 reais
Box-plot renda per capita 0 100 00 300 Grupo Não Exposto 6 5 Freqüência 4 3 1 0 0 66 13 198 64 330 Grupo não Exposto
V - Estatísticas Descritivas no soft MINITAB Descriptive Statistics: EXP; NEXP Variable N Mean Median TrMean StDev SE_Mean EXP 15 134,0 10,0 19,4 47,5 1,3 NEXP 15 147,1 10,0 143,9 79,9 0,6 Variable Minimum Maximum Q1 Q3 EXP 68,0 60,0 100,0 160,0 NEXP 36,0 300,0 84,0 0,0 VI - Estatísticas Descritivas no EXCEL Exp Nexp Média 134 147,13 Erro padrão 1,3 0,6 Mediana 10 10 Modo 160 150 Desvio padrão 47,5 79,9 Variância da amostra 57,86 6376,695 Curtose,6-0,67 Assimetria 1,44 0,54 Intervalo 19 64 Mínimo 68 36 Máximo 60 300 Soma 010 07 Contagem 15 15
VII Exemplos de Dados Agrupados Exemplo 1: dados coletados em entrevistas com 500 pessoas (a) variável número de divórcios por indivíduo (b) variável tempo (em anos) até o primeiro divórcio a) Variável discreta: tabela do número de divórcios por indivíduo. Divórcios x i n i f i x i f i F ac n i x i 1 40 0,480 0,480 0,480 40 15 0,50 0,500 0,730 500 3 81 0,16 0,486 0,89 79 4 48 0,096 0,384 0,988 768 5 6 0,01 0,060 1,000 150 Total 500 1,000 1,910-387 Média amostral: x x i f i 1,910 divórcios Variância amostral: xi nx s ( n 1) s 1,06 divórcios 387 500 (1,910) (500 1) 56,95 499 1,18 Outra representação: Divórcios x i n i f i x i f i F ac (x i x) n i (x i x) 1 40 0,480 0,480 0,480-0,910 198,744 15 0,50 0,500 0,730 0,090 1,013 3 81 0,16 0,486 0,89 1,090 96,36 4 48 0,096 0,384 0,988,090 09,669 5 6 0,01 0,060 1,000 3,090 57,886 Total 500 1,000 1,910 56,950 Média amostral: x Variância amostral: x i f i s 1,910 divórcios ( x x) i ( n 1) 56,95 499 1,18
b) Variável contínua: tabela do tempo até o primeiro divórcio. Anos ponto Casados médio x i n i f i x i f i F ac n i x i 0 ----- 6 3 80 0,56 1,68 0,56 50 6 ----- 1 9 140 0,8,5 0,84 11340 1 ----- 18 15 60 0,1 1,80 0,96 13500 18 ----- 4 1 15 0,03 0,63 0,99 6615 4 ----- 30 7 5 0,01 0,7 1,00 3645 Total 500 1,00 6,90 3760 Média amostral: x x i f i 6,90 anos Variância amostral: xi nx s ( n 1) 3760 500 (6,90) (500 1) 13815 499 7,685 s 5,6 anos Anos x i ptos. médios n i f i x i f i F ac (x i x) n i (x i x) 3 80 0,56 1,68 0,56-3,9 458,8 9 140 0,8,5 0,84,1 617,4 15 60 0,1 1,80 0,96 8,1 3936,6 1 15 0,03 0,63 0,99 14,1 98,15 7 5 0,01 0,7 1,00 0,1 00,05 Total 500 1,00 6,90 - - 13815 Média amostral: x x i f i 6,90 anos Variância amostral: s ( x x) i ( n 1) 13815 499 7,685
Exemplo : Escores GMAT (Graduate Management Apititude Test) aplicado num processo seletivo para a escolha de alunos num programa de graduação. Escores Pto. Médio x i n i f i x i f i n i x i 300 -- 350 35 3 0.035 11.5 316875 350 -- 400 375 7 0.08 30.9 984375 400 -- 450 45 18 0.1 90.0 35150 450 -- 500 475 4 0.8 134.1 5415000 500 -- 550 55 15 0.176 9.6 4134375 550 -- 600 575 10 0.118 67.6 330650 600 -- 650 65 4 0.047 9.4 156500 650 -- 700 675 4 0.047 31.8 18500 Totais 85 1.000 488 079315 Histograma: 0.3 Escores do teste de aptidão GMAT 0.4 0.16 0.08 0 50 300 350 400 450 500 550 600 650 700 750 Q 1 x ~ Q 3
VIII - Representação gráfica para Variáveis Qualitativas: Exemplo1: Pesquisa PNAD 004 Moradores por domicílio Brasil. a) Tabela de uma entrada: Região domicílios % SE 3157114 44.8 NE 1309014 5.3 SE 819866 15.8 CO 3745500 7. NE 356154 6.9 517558 100.0 b) Tabela de dupla entrada: (dados brutos) MOR. Brasil N NE SE S CO 1 5 411 443 9 910 1 190 705 61 431 890 834 44 563 10 06 38 506 597 141 31 4 816 793 1 857 904 739 63 3 1 118 894 747 866 793 05 5 630 78 103 44 843 770 4 1 098 74 791 985 936 946 5 53 907 1 888 06 948 878 5 6 449 038 53 447 1 858 876 68 387 917 583 457 745 6 906 091 308 311 991 114 1 094 518 3 794 189 354 7 1 311 59 161 696 53 787 410 151 131 936 75 0 8 OU + 1 394 490 19 71 645 33 377 145 85 765 66 536 Total 51 75 58 3 561 54 13 090 14 3 157 114 8 198 66 3 745 500 (porcentagens) MOR. Brasil N NE SE S CO 1 10.5 8. 9.1 11.3 10.9 11.3 19.4 14. 16.4 0.8.7 19.7 3 3.4 1.0 1.3 4.3 5.7.5 4 3.4..4 3.9 3.0 5.3 5 1.5 14.9 14. 11.6 11. 1. 6 5.6 8.7 7.6 4.7 3.9 5.1 7.5 4.5 4.1 1.8 1.6.0 8 OU +.7 6. 4.9 1.6 1.0 1.8 Total 100.0 100.0 100.0 100.0 100.0 100.0
Gráfico de setores (pizza): Região Domic. (freq) proporção ângulo SE 3157114 0.447 161 NE 1309014 0.53 91 SE 819866 0.158 57 CO 3745500 0.07 6 NE 356154 0.069 5 517558 1 360 - Para achar o ângulo, deve-se usar a relação: 100% 360 o. - Portanto, se uma categoria tem proporção de 0.447, então, basta multiplicar 0.447 por 360 o para encontrar o ângulo correspondente (regra de três). Logo: 0.447 360 o 161 o 0.07 360 o 6 o 0.53 360 o 91 o 0.069 360 o 5 o 0.158 360 o 57 o Domicílios por região 16% 7% 7% 45% SE NE S CO N 5%
Domicílios por região 45% 7% SE NE S 7% CO N 16% 5% Gráfico de colunas: 5 Moradores por domicílio - regiões SE e N 0 15 10 N SE 5 0 1 3 4 5 6 7 8+
Exemplo: Notas de Português por grupo de estudantes (expostos e não expostos). Nota P Expostos Não Expostos Freq. % ângulo Freq. % ângulo I 5 33% 119 o 3 0% 74 o S 8 54% 194 o 6 40% 144 o PS 5 13% 47 o 6 40% 144 o a) Gráfico de colunas: Notas de Português 0.6 0.5 0.3 0. I S PS 0.0 Exposto Não Exposto Notas de Português 0.6 0.5 0.3 Exposto Não Exposto 0. 0.0 I S PS
b) Gráfico de setores (pizza): Notas de Português - Grupo Exposto I 33% S 54% PS 13% Notas de Português - Grupo Não Exposto PS 40% I 0% S 40%
IX - Histogramas pelo número de observações