Professora Janete Perera Amador 1 8 Meddas Descrtvas Vmos anterormente que um conjunto de dados pode ser resumdo através de uma dstrbução de freqüêncas, e que esta pode ser representada através de uma tabela ou de um gráfco. Se o conjunto refere-se a uma varável QUANTITATIVA há uma tercera manera de resum-lo: as Meddas de Síntese. As Meddas de Síntese, também chamadas de Estatístcas ou Meddas Descrtvas, dvdem-se em Meddas de Posção (Meddas de Tendênca Central), Meddas de Dspersão e Separatrzes. As Meddas de Posção obtém um valor numérco que represente a tendênca do conjunto (valor típco ). As mas mportantes são: Méda, Medana, e Moda. As Meddas de Dspersão obtém uma mensuração da dsposção dos dados no conjunto, da sua varabldade (se estão concentrados em torno de um valor, se dstrbuídos, etc). As mas mportantes são: Intervalo, Varânca, Desvo Padrão e Coefcente de Varação. As Separatrzes são meddas que dvdem o conjunto em um certo número de partes guas: Quarts (4 partes), Decs (10 partes), Cents (100 partes). 8.1 Meddas de Posção As Meddas de Posção procuram caracterzar a tendênca central do conjunto, um valor numérco que represente o conjunto. Esse valor pode ser calculado levando em conta todos os valores do conjunto ou apenas alguns valores ordenados. Méda A méda artmétca é smbolzada por x (lea-se x barra) e consste na soma de todas as observações x do grupo, dvdda pelo número "n" de observações do grupo. x x x 1 x... xn 1 x n n n Ex: A tabela abaxo refere-se às notas fnas de três turmas de estudantes. Calcular a méda de cada turma: n Ao somar os valores em cada turma teremos o mesmo resultado: 48. Como cada turma tem 8 alunos as três turmas terão a mesma méda: 6. No exemplo acma as três turmas têm a mesma méda (6), então se apenas essa medda fosse utlzada para caracterzá-las poderíamos ter a mpressão que as três turmas têm desempenhos dêntcos. Será? Observe atentamente a tabela acma. Na prmera turma temos realmente os dados dstrbuídos regularmente em torno da méda, com a mesma varação tanto abaxo quanto acma. Já na segunda vemos uma dstorção maor, embora a maora das notas sejam altas algumas notas baxas puxam a Caderno Ddátco de Estatístca
Professora Janete Perera Amador méda para um valor menor. E no tercero grupo há apenas uma nota baxa, mas seu valor é tal que realmente consegue dmnur a méda do conjunto. Um dos problemas da utlzação da méda é que, por levar em conta TODOS os valores do conjunto, ela pode ser dstorcda por valores dscrepantes ( outlers ) que nele exstam. É mportante então nterpretar corretamente o valor da méda.o valor da méda pode ser vsto como o ponto central de cada conjunto de dados, ou seja o ponto de equlíbro do conjunto: se os valores do conjunto fossem pesos sobre uma tábua, a méda é a posção em que um suporte equlbra esta tábua. Utlzando um dagrama aproprado vejamos como as notas dos alunos, de cada turma se dstrbuem entorno da méda. A méda dos três conjuntos (Turmas) é a mesma, mas observe as dferentes dsposções dos dados. O prmero grupo (Turma A) apresenta os dados dstrbuídos de forma smétrca em torno da méda. No segundo grupo (Turma B) a dstrbução já é mas rregular, com valores mas dstantes na parte de baxo, e o tercero grupo (Turma B) é claramente assmétrco em relação à méda (que fo dstorcda pelo valor dscrepante 0). Portanto muto cudado ao caracterzar um conjunto apenas por sua méda Outro aspecto mportante a ressaltar é que a méda pode ser um valor que a varável não pode assumr. Isto é especalmente verdade para varáves quanttatvas dscretas, resultantes de contagem, como número de flhos, quando a méda pode assumr um valor "quebrado", 4,3 flhos, por exemplo. É extremamente comum calcular médas de varáves quanttatvas a partr de dstrbuções de freqüêncas representadas em tabelas: smplesmente multplca-se cada valor (ou o ponto médo da classe) pela freqüênca assocada, somam-se os resultados e Caderno Ddátco de Estatístca
Professora Janete Perera Amador 3 dvde-se o somatóro pelo número de observações do conjunto. Na realdade trata-se de uma méda ponderada pelas freqüêncas de ocorrênca de cada valor da varável. Onde k é o número de valores da varável dscreta, ou o número de classes da varável agrupada, e x é um valor qualquer da varável dscreta, ou o ponto médo de uma classe qualquer. Ea: Calcular a méda do número de doadores de sangue contamnados com hepatte B (Quadro1) em 40 bancos de sangue. Observe que NENHUMA resdênca pode ter 4,3 pessoas. Assm, não se esqueça de que a méda pode assumr valores que a varável não pode assumr. Eb: Calcular a méda da taxa de mortaldade nfantl em muncípos do do Norte do Brasl... Classes f.f 9,9 --- 18,6 9 14,6 18,34 18,6 --- 7,34 13,98 98,74 7,34 --- 36,06 7 31,7 1,9 36,06 --- 44,78 4 40,4 161,68 44,78 --- 53,5 0 49,14 0 53,5 --- 6, 1 57,85 57,85 Total 34 868,51 Caderno Ddátco de Estatístca
Professora Janete Perera Amador 4 Quando os dados não estão grupados (Ea) o resultado será dêntco ao que sera obtdo smplesmente somando todos os valores e dvdndo o somatóro pelo número de valores. Contudo, se a tabela estver agrupada em classes (Eb) TODAS as meddas (não somente a méda) serão apenas estmatvas dos valores reas, pos as meddas serão calculadas usando os pontos médos (que são os representantes das classes) e não mas os valores orgnas. No caso do Eb a méda real vale 5,39. Atualmente com as facldades computaconas dsponíves não se calcula mas a méda (ou qualquer outra medda) a partr de uma tabela agrupada em classes se os dados orgnas estão dsponíves: os programas calculam as meddas usando os dados orgnas e as tabelas são apresentadas apenas para dar uma déa da varação dos dados. Medana (Md) A medana é o ponto que dvde o conjunto em duas partes guas: metade dos dados têm valor menor do que a medana e a outra metade têm valor maor do que a medana. Pouco afetada por eventuas valores dscrepantes exstentes no conjunto (que costumam dstorcer substancalmente o valor da méda). A medana de um conjunto ordenado de valores, anotada por Md, é defnda como sendo o valor que separa o conjunto em dos subconjuntos do mesmo tamanho. Assm se n (número de elementos) é ímpar a medana é o valor central do conjunto. Caso contráro a medana é a méda dos valores central do conjunto. Tem-se: Exc: Calcular a medana das fnas de três turmas de estudantes (Ex). Posção medana = (n + 1)/ = (8+1)/ = 4,5 sgnfca que o valor da medana será calculado através da méda entre os valores que estverem na 4 a e na 5 a posção do conjunto. Turma A: Md = (6 + 6)/ = 6 Turma B: Md = (6 + 6)/ = 6 Turma C: Md = (7 + 7)/ = 7 Calcular a medana para o grupo a segur: 10 11 1 13 15 16 16 35 60 Posção medana = (n + 1)/ = (9+1)/ = 5a como o conjunto tem um número ímpar de valores o valor da medana será gual ao valor que estver na 5ª posção. Md = 15 ; x = 0,89 Observe que neste caso méda e medana são dferentes, pos a méda fo dstorcda pelos valores mas altos 35 e 60, que consttuem uma mnora. Neste caso a medda de posção que melhor representara o conjunto sera a medana. Se a méda é Caderno Ddátco de Estatístca
Professora Janete Perera Amador 5 dferente da medana a dstrbução da varável quanttatva no conjunto de dados é dta ASSIMÉTRICA. Calcular a méda da taxa de mortaldade nfantl em muncípos do Norte do Brasl. Calcular a méda da taxa de mortaldade nfantl em muncípos do Norte do Brasl. (Exemplo Eb). Classes f x.f F 9,9 --- 18,6 9 14,6 18,34 9 18,6 --- 7,34 13,98 98,74 7,34 --- 36,06 7 31,7 1,9 9 36,06 --- 44,78 4 40,4 161,68 33 44,78 --- 53,5 0 49,14 0 33 53,5 --- 6, 1 57,85 57,85 34 Total 34 868,51 Procedmentos n 34 1. Calcula-se a posção Md: P Md = = = 17. A Md estará localzada na classe onde F P Md ; Classes f x.f F 3. 18,6 --- 7,34 13,98 98,74 4. 3. Para encontrar o valor da medana aplca-se a segunte equação: n F anteror. h Md L f ( Md) Onde: Md = medana L = lmte nferor da classe da medana; (18,6) n = tamanho da amostra; (34) F = freqüênca acumulada anteror a classe da Md; (9) h = ampltude da classe da Md; (8,7) f = freqüênca smples a classe da Md. (13) 17 9 Md 18,6 8,7 13 Md 3,3 Novamente o valor acma é apenas uma estmatva, a medana real vale: Como n é par a medana Md = 3,6 Moda (Mo) A moda é o valor da varável que ocorre com maor freqüênca no conjunto. É a medda de posção de obtenção mas smples, e também pode ser usada para varáves qualtatvas, pos apenas regstra qual é o valor mas freqüente, podendo este valor ser tanto um número quanto uma categora de uma varável nomnal ou ordnal. Um conjunto dedados pode ter apenas uma Moda, váras Modas ou nenhuma Moda. Encontre a moda das notas das três turmas. Caderno Ddátco de Estatístca
Professora Janete Perera Amador 6 A turma A tem 3 modas: os valores 5, 6 e 7 ocorrem duas vezes cada. A turma B tem duas modas: os valores 6 e 10 ocorrem duas vezes cada. A turma C tem uma moda apenas: o valor 7 ocorre 3 vezes. Para dados agrupados em classes a moda é calculada utlzando a equação 1 Mo ( Mo). h onde; 1 f f 1 Mo Mo ant f f ; post Mo = moda L = lmte nferor da classe modal F = freqüênca acumulada anteror a classe da Md f Mo = freqüênca smples a classe modal f ant = freqüênca smples anteror a classe modal f post = freqüênca smples posteror a classe modal Classe modal = classe de maor f. Calcular a moda do índce produção de produtores ruras que buscaram tecnologa para melhoras no processo produtvo, de acordo com a tabela do Exemplo Eb. Classes f x.f F 9,9 --- 18,6 9 14,6 18,34 9 18,6 --- 7,34 13,98 98,74 7,34 --- 36,06 7 31,7 1,9 9 36,06 --- 44,78 4 40,4 161,68 33 44,78 --- 53,5 0 49,14 0 33 53,5 --- 6, 1 57,85 57,85 34 Total 34 868,51 1 4 Mod 18,6.8,7 = 18,6.8,7, 11 1 4 6 1 13 9 13 7 e 1 4 6 Analsando o conjunto orgnal dos verfcamos que o conjunto de dados é amodal desta forma este valore apenas uma estmação. Caderno Ddátco de Estatístca
Professora Janete Perera Amador 7 Podemos apresentar uma breve comparação das meddas de posção. Fonte: REIS, M. M. & LINO, M. de O., 005. 8. Meddas de Dspersão O objetvo das meddas de dspersão é medr quão próxmos uns dos outros estão os valores de um grupo ou medndo a dspersão de um grupo de dados em torno da sua méda. Varânca (S ) A varânca é uma das meddas de dspersão mas mportantes. É a méda artmétca dos quadrados dos desvos de cada valor em relação à méda: proporcona uma mensuração da dspersão dos dados em torno da méda. S n N n 1 N Amostra População Onde x é um valor qualquer do conjunto. Se os dados referem-se a uma POPULAÇÃO usa-se N (tamanho da população) no denomnador da expressão. A razão da utlzação de n 1 no denomnador é ndspensável para que a varânca da varável na amostra possa ser um bom estmador da varânca da varável na população. A maora dos programas computaconas, porém, costuma calcular o desvo padrão supondo que os dados são provenentes de uma população. Em algumas planlhas eletrôncas há funções pré-programadas para ambos os casos. A undade da varânca é o quadrado da undade dos dados (e portanto o quadrado da undade da méda) causando dfculdades para avalar a dspersão: se por exemplo temos a varável peso com méda de 75 kg em um conjunto e ao calcular a varânca obtemos 1 kg a avalação da dspersão torna-se dfícl. Quanto maor a varânca mas dspersos os dados estão em torno da méda (maor a dspersão do conjunto) Caderno Ddátco de Estatístca
Professora Janete Perera Amador 8 Para fns de Análse Exploratóra de Dados caracterzar a dspersão através da varânca não é muto adequado. Costuma-se usar-se a raz quadrada postva da varânca, o desvo padrão. Desvo padrão (S) É a raz quadrada postva da varânca, apresentando a mesma undade dos dados e da méda, permtndo avalar melhor a dspersão. S n N n 1 N Amostra População As mesmas observações sobre população e amostra fetas para a varânca são váldas para o desvo padrão. É prátca comum ao resumr através de meddas de síntese um conjunto de dados referente a uma varável quanttatva apresentar a méda e o desvo padrão desse conjunto, para que seja possível ter uma déa do valor típco e da dstrbução dos dados em torno dele. Tal como no caso da méda pode haver nteresse em calcular o desvo padrão de varáves quanttatvas a partr de dstrbuções de freqüêncas representadas em tabelas. Tal como no caso da méda os valores da varável (ou os pontos médos das classes), e os quadrados desses valores, serão multplcados por suas respectvas freqüêncas: S f n 1 n. f Ex: Calcule o desvo padrão índce produção de produtores ruras que buscaram tecnologa para melhoras no processo produtvo, de acordo com a tabela do Exemplo Classes f.f 9,9 --- 18,6 9 14,6 18,34 03,3476 1830,184 18,6 --- 7,34 13,98 98,74 58,0804 6865,045 7,34 --- 36,06 7 31,7 1,9 1004,89 7034,3 36,06 --- 44,78 4 40,4 161,68 1633,7764 6535,1056 44,78 --- 53,5 0 49,14 0 414,7396 0 53,5 --- 6, 1 57,85 57,85 3346,65 3346,65 Total 34 868,51 5611,1317 f. f 868,51 5611,1317 S n 34 = 10,19 n 1 34 1 Tal como na méda, o resultado do desvo padrão calculado através de uma tabela agrupada em classes será apenas uma estmatva do valor real (o valor com os dados orgnas fo gual a 10,1. Coefcente de Varação (CV%) f Caderno Ddátco de Estatístca
Professora Janete Perera Amador 9 O coefcente de varação percentual é uma medda de dspersão relatva, pos permte comparar a dspersão de dferentes dstrbuções (com dferentes médas e desvos padrões). Onde S é o desvo padrão da varável no conjunto de dados, e é a méda da varável no mesmo conjunto. Quanto menor o coefcente de varação percentual, mas os dados estão concentrados em torno da méda, pos o desvo padrão é pequeno em relação à méda. E: Calcular o coefcente de varação percentual para as notas das três turmas de estudantes. A turma mas homogênea é a A, pos apresenta o menor coefcente de varação das três. Isso era esperado, uma vez que as notas da turma A estão dstrbuídas mas regularmente do que as das outras. No caso acma a comparação fcou anda mas smples pos as médas dos grupos eram guas, bastara avalar apenas os desvos padrões dos grupos, mas para comparar a dspersão de dstrbuções com médas dferentes é mprescndível a utlzação do coefcente de varação. O coefcente de varação para os dados do número de resdentes no domcílo corresponde a: 1,45 CV % 100 33,7% 4,3 Para os dados do índce produção de produtores ruras que buscaram tecnologa para melhoras no processo produtvo,corresponde a: 1,19 CV % 100 4,66% 5,54 8.3 Meddas de Separatrzes As separatrzes são valores que dvdem a dstrbução em um certo número de partes guas: a medana dvde em partes guas, os quarts dvdem em 4 partes guas, os decs em 10 partes guas e os cents em 100 partes guas. O objetvo das separatrzes é proporconar uma melhor déa da dspersão do conjunto, prncpalmente da smetra ou assmetra da dstrbução. Vamos nos lmtar aos quarts. Caderno Ddátco de Estatístca
Professora Janete Perera Amador 10 0% 5% 50% 75% 100% -------------------- -------------------- -------------------- -------------------- Q1 Q =Md Q3 Ex: Calcular o prmero quartl da taxa de mortaldade nfantl em muncípos do Norte do Brasl. Classes f F 9,9 --- 18,6 9 14,6 9 18,6 --- 7,34 13,98 7,34 --- 36,06 7 31,7 9 36,06 --- 44,78 4 40,4 33 44,78 --- 53,5 0 49,14 33 53,5 --- 6, 1 57,85 34 Total 34 Procedmento: n Calcula-se a posção do quartl através da fórmula: PQ = ; 4 O quartl estará localzado na classe onde, pela prmera vez, F PQ; e para encontrar o seu valor, aplca-se a equação: PQ Fant. Q Lnf. h onde, f L nf = lmte nferor da classe do quartl; h = ampltude de classe; P Q = posção do quartl ; F.ant = freqüênca acumulada anteror a classe do quartl; f Q = freqüênca smples da calasse do quartl. Cálculo do prmero quartl: n 34 PQ = = 1 = 8,5 8 4 4 O prmero quartl ocupa esta ocupando a otava posção correspondente a prmera classe. f F 9,9 --- 18,6 9 14,6 9 Montando a equação para calcular o valor do prmero quartl PQ Fant. 8 0 Q Lnf. h = 9,9 8,7 = 17,65 f 9 Q Interpretando: 5% das taxas de mortaldade encontram-se em até 17,65 e 75% da das taxas encontram-se com valores superores a 17,65. Q Caderno Ddátco de Estatístca
Professora Janete Perera Amador 11 Exercícos 1) Dado o rol de 50 notas de ndvíduos que cursaram a dscplna de estatístca. Construr uma tabela de dstrbução de freqüêncas (com todos os elementos já estudados), construr um hstograma e polígono de freqüêncas, calcular todas as meddas descrtvas. 33 35 35 39 41 41 4 45 47 48 50 5 53 54 55 55 57 59 60 60 61 64 65 65 65 66 66 66 67 68 69 71 73 73 74 74 76 77 77 78 80 81 84 85 85 88 89 91 94 97 ) Os preços do pacote de café, pesando 500g, obtdos em dferentes supermercados locas, são: R$3,50, R$,00, R$1,50 e R$1,00. Com base nessas nformações, julgue (justfcando) os tens que seguem: a) O preço médo do pacote de café de 500 g vale R$,00. b) Se todos os preços tverem uma redução de 50%, o novo preço médo será de R$1,50. c) A varânca dos preços é guala 0,65. d) Se todos os preços tverem um acréscmo de R$1,00, o coefcente de varação não se altera. e) Se todos os preços tverem um acréscmo de R$1,00,o coefcente de varação dos preços será aproxmadamente gual a 31,18%. f) Se todos os preços tverem um aumento de 50%, a nova varânca será exatamente gual à anteror, pos a dspersão não será alterada. g) A varânca fcará multplcada por,5 se todos os preços tverem um aumento de 50% Caderno Ddátco de Estatístca
Professora Janete Perera Amador 1 6) Consdere a dstrbução de freqüêncas a segur para responder às questões de 6.1 a 6.3. Peso (Kg) N o de anmas ---4 9 4 ---6 1 6 --- 8 6 8 ---10 10 ---1 1 6.1) Marque a opção correta: a) 75% das observações têm peso não nferor a 4 Kg e nferor a 10 Kg. b) Mas de 75% das observações têm peso maor ou gual a 4 Kg. c) Menos de 5% das observações têm peso gual a 4 Kg. a) A soma dos pontos médos dos ntervalos de classe é nferor ao tamanho da amostra. e) 8% das observações têm peso no ntervalo de classe 8 ---10. 6.) A méda da dstrbução é gual a : a) 5,7 Kg; d) 5,19 Kg; b) 5,4 Kg; e) 5,30 Kg; c) 5,1 Kg; 6.3) A medana da dstrbução é gual a : a) 5,30Kg; d) 5,10Kg; b) 5,00Kg; e) 5,0Kg; c) um valor nferor a 5,00Kg; 7) O frgorífco Industral Multcorte S. A. recebe de dos cradores propostas de vendas de bovnos para abate. Entretanto, ele exge do Departamento de Inspeção Santára que os anmas a serem compredos passem por um exame. Consdere as amostras seguntes (em Kg), resultantes da realzação do exame de bovnos: Estatístcas Amostra Unvaradas Kote Êmo Méda 600 700 Desvo-padrão 80 140 Total de bos 100 60 Pergunta-se: a) Em qual das amostras houve maor varação absoluta nos pesos dos anmas? b) Em termos relatvos, quem está melhor em peso com relação a seu grupo, o bo Kote ou o bo Êmo? Bblografa FONSECA,J.S. & MARTINS G. de A., P. Curso de Estatístca. 5a. ed. São Paulo: Atlas, 1995. REIS, M. M. & LINO, M. de O. Notas de Aula: Introdução e Análse Exploratóra de Dados. UFSC. Ste: http://www.nf.ufsc.br/~marcelo/ine511.html. Caderno Ddátco de Estatístca
Professora Janete Perera Amador 13 TRIOLA, M. F. Introdução a Estatístca. 9a. ed. Ro de Janero: LTC. 005. Caderno Ddátco de Estatístca