3.1- Introdução. ESTATÍSTICA MEDIDAS DE TENDÊNCIA CENTRAL Como na representação tabular e gráfca dos dados a Estatístca Descrtva consste num conjunto de métodos que ensnam a reduzr uma quantdade de dados bastante numerosa por um número pequeno de meddas, substtutas e representantes daquela massa de dados. Agora passaremos a estudar as prncpas meddas da Estatístca Descrtva, agrupadas em meddas de tendênca central (ou de posção ou de localzação), meddas de dspersão (ou de varabldade) e meddas de assmetra e curtose. Estas últmas serão vstas na aula 4. Um valor para representar a todos. Algumas meddas sugerem uma concentração em torno delas, sendo por sso denomnadas de MEDIDAS DE TENDÊNCIA CENTRAL. Para uma amostra, as três meddas mas conhecdas são a MÉDIA ARITMÉTICA, a MEDIANA e a MODA. 3.2- Méda artmétca. Podemos pensar na méda artmétca como o valor típco do conjunto de dados e é consderada a prncpal medda de tendênca central. Algumas das razões que fazem com que seja a medda de posção mas recomendada são: É defnda rgorosamente e pode ser nterpretada faclmente; Consdera todas as observações efetuadas; e Calcula-se com facldade. Entretanto, esta medda apresenta alguns nconvenentes como o fato de ser muto sensível a valores extremos, sto é, a valores excessvamente pequenos ou excessvamente grandes, em relação às demas observações do conjunto de dados. Exemplo: Estamos nteressados em conhecer o saláro médo mensal de certa empresa com cnco funconáros. Temos o segunte conjunto de saláros mensas, em reas: 123-145 - 210-225 - 2.500. Podemos observar que quatro dos cnco saláros apresentam valores entre 123 e 225 reas, porém a méda salaral de 640,6 reas é bastante dstnta desse conjunto pela nfluênca do saláro de 2.500 que puxou o valor médo para cma. A méda artmétca pode ser calculada de duas formas: méda artmétca smples e méda artmétca ponderada. 3.2.1- Méda artmétca smples. Sejam x, x 2,..., artmétca smples é defnda como: 1 x n, n valores que a varável X pode assumr. A méda X n 1 n x ou, de forma mas smplfcada, por X n x. 1
3.2.2- Méda artmétca ponderada. A méda artmétca ponderada é utlzada quando atrbuímos um peso (ou ponderação) aos valores possíves da varável. Quando os dados aparecem na forma de uma dstrbução de freqüêncas, os ponderadores (w ) serão as freqüêncas absolutas (f ). Sejam x 1, x 2,..., x k, k valores que a varável X assume e w 1, w 2,..., w k os respectvos pesos (ou ponderadores). A méda artmétca ponderada é defnda como: x k 1 k 1 wx w ou, de forma mas smplfcada, por x wx. w Quando os dados estão agrupados numa dstrbução de freqüênca as fórmulas acma podem ser escrtas como: X k 1 k 1 fx f ou, de forma mas smplfcada, por X fx. f 3.2.3- Algumas propredades da méda artmétca. 1ª) Somando-se (ou subtrando-se) um valor constante e arbtráro a cada um dos elementos de um conjunto de dados, a méda artmétca fca adconada (ou subtraída) dessa constante. Exemplo: A cada elemento de um conjunto de 1000 dados adconamos o valor 10. Ao lado, podemos perceber que a méda dos valores da varável X que era 5 passou a ser 15 e o hstograma não apresentou nenhuma alteração na sua forma. 2ª) Multplcando-se (ou dvdndo-se) um valor constante e arbtráro a cada um dos elementos de um conjunto de dados, a méda artmétca fca multplcada (ou dvdda) por essa constante. Exemplo: Neste caso, para o mesmo conjunto de 1000 dados, cada valor fo multplcado por 2. Como resultado, a méda fcou multplcada por 2 e passou de 5 para 10 como podemos observar ao lado. Além da alteração na méda ocorreu também alteração na forma. Veremos o por quê mas adante. Freqüênca Freqüênca 400 300 200 100 0 400 300 200 100 0 0 10 20 Valore de X 0 5 10 15 Valores de X 3.3- Moda 2
A moda é outra medda de tendênca central, mas, dferentemente da méda, não utlzam em seu cálculo todos os valores do conjunto de dados analsado. Defnção: A moda é o valor que ocorre com maor freqüênca na dstrbução. Exemplos: a) X = {2, 3, 3, 5, 5, 5, 6, 7} Mo = 5 b) Y = {10, 12, 17, 21, 32} Mo = não exste, a dstrbução é amodal. c) Z = {2, 2, 5, 5, 7, 7} Mo = não exste, a dstrbução é amodal. d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21} A dstrbução apresenta dos valores modas: 12 e 18 (dstrbução bmodal). Quando a dstrbução apresenta mas de uma moda damos o nome de dstrbução plurmodal. Quando a dstrbução de freqüêncas está organzada por classes de valores, devemos dentfcar a classe modal (classe em que observamos a maor freqüênca). O ponto médo da classe modal será o valor estmado para a moda e será denomnado Moda bruta = MoB. Identfque o valor da moda bruta no gráfco a segur. 16 PROD_B: Produto B 14 12 10 No of obs 8 6 4 2 0-1 0 1 2 3 4 5 Upper Boundares (x <= boundary) Expected Normal 3.4- Separatrzes. As separatrzes são meddas de posção que permtem calcularmos valores da varável que dvdem ou separam a dstrbução em partes guas. Temos quatro tpos de separatrzes: ) a medana, que é também uma medda de tendênca central; ) os quarts; ) os decs; e v) os percents. 3.4.1- Medana. Defnção: Chamamos de medana o elemento do conjunto que ocupa a posção central na dstrbução ordenada (crescente ou decrescentemente). Isto é, dvde a dstrbução em 3
duas partes guas de modo que 50% dos valores observados fcam à sua esquerda e 50% à sua dreta. Assm, a medana será: o valor do elemento do meo se n é ímpar, ou a méda dos dos valores do meo se n é par. Exemplos: a) Comparação entre a méda artmétca e a medana para os conjuntos de saláros (em reas) dados. X = { 200, 250, 250, 300, 450, 460, 510} x = 345,7; Md = 300 Y = { 200, 250, 250, 300, 450, 460, 2.300} y = 601,0; Md = 300 Podemos observar que no caso do conjunto Y a méda não sntetza adequadamente o conjunto de dados, pos apenas um valor é superor a ela. b) Em algumas áreas, as pessoas autuadas por certas nfrações leves de tráfego podem freqüentar um curso de dreção defensva em lugar de pagar uma multa. Se 12 desses cursos foram freqüentados por 40, 32, 37, 30, 24, 40, 38, 35, 40, 28, 32 e 37 ndvíduos determne a medana. 24 28 30 32 32 35 37 37 38 40 40 40 Md = 36 3.4.2- Quarts. Estes elementos dvdem a dstrbução em quatro partes guas. 25% 25% 25% 25% Q 1 Q 2 Q 3 OBS: Q 2 = Md O chamado ntervalo nterquartl ou nterquartílco, é defndo por (Q 1 ; Q 3 ), contém 50% do total de observações localzadas mas ao cento da dstrbução. 3.4.3- Decs. Estes elementos dvdem a dstrbução em dez partes guas. 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% D 1 D 2 D 3 D 4 D 5 D 6 D 7 D 8 D 9 3.4.4- Percents. Estes elementos dvdem a dstrbução em cem partes guas. 1% 1% 1% 1%... 1% 1% 1% 1% P 1 P 2 P 3.... P 97 P 98 P 99 OBS: Q 2 = Md = D 5 = P 50, D 4 = P 40, Q 3 = P 75, você consegue entender porque? 4
Notações: Q = quartl de ordem ; D = decl de ordem ; P = percentl de ordem. 3.5- Relação entre a méda artmétca, a moda e a medana. Podemos observar três tpos de relações entre as três prncpas meddas de tendênca central: 1ª) Quando a dstrbução é smétrca, a méda artmétca, a medana e a moda são Mo Md x. guas: 2ª) Quando a dstrbução tem assmetra postva (assmétrca à dreta), temos a segunte relação: Mo Md x. 3ª) Quando a dstrbução tem assmetra negatva (assmétrca à esquerda), temos a segunte relação: Mo Md x 3.8- Indcações para utlzação das meddas de tendênca central A escolha entre uma das meddas de tendênca central nem sempre é de fácl realzação, depende da natureza do problema a ser estudado e de outros fatores, mutos dos quas não podem abordar-se a nível elementar. 5
RESUMO Fonte: Trola (2008, p 69) EXERCÍCIOS 1. Calcule a méda, a medana e a moda para cada varável da tabela a segur. 2. Dez estudantes foram nterrogados quanto a sua posção sobre a satsfação com seu curso de graduação por meo de uma questão que utlzava uma escala de nível ntervalar de 5 pontos. A resposta deles varou dentre de uma escala de 1 a 5 (1 - Fortemente 6
nsatsfeto, 2 Parcalmente nsatsfeto, 3 Neutra, 4 Parcalmente satsfeto, 5 Fortemente satsfeto) e foram as seguntes: 5, 5, 3, 4, 5, 4, 2, 1, 4 e 4. Calcule a moda, medana e méda dos dados e avale, de modo geral, quão satsfetos estão os estudantes. 3. O total de empregados das 50 maores construtoras do Brasl em 2011 está descrto abaxo (extraído da Base de nformações sobre a construção cvl braslera - cbcdados.com.br). 292 300 578 664 671 693 885 1.022 1.094 1.205 1.250 1.347 1.380 1.382 1.482 1.511 1.587 1.961 1.992 2.134 2.439 2.498 2.678 2.971 3.048 3.211 4.012 4.118 4.290 5.095 5.095 5.824 6.300 6.925 9.000 10.022 10.950 12.974 14.304 14.835 16.862 32.825 43.053 115.205 NI NI NI NI NI NI (NI : Não nformado) Com base nestes dados: a) Construa um hstograma. b) Calcule a medana, a moda e a méda e explque como estas três meddas de localzação central descrevem dferentes característcas dos dados. c) Encontre os quarts Q 1, Q 2 e Q 3 e faça uma avalação sobre o número de empregados das 50 maores construtoras do Brasl. 4. [Adaptado de TRIOLA] As alturas de homens e mulheres são normalmente dstrbuídas, com uma méda de 175,3 cm para os homens (desvo padrão de 7,1 cm) e de 161,5 cm para as mulheres (desvo padrão de 6,4 cm). Abaxo estão duas amostras de alturas (em cm) escolhdas aleatoramente. Homens 151 167 170 172 175 175 176 176 176 176 177 178 180 181 181 181 183 184 191 199 Mulheres 152 154 154 156 158 159 159 160 160 160 162 162 162 164 164 165 166 166 166 170 Com base nos dados amostras e consderando a altura padrão de uma porta como sendo 2 metros, responda: a) Qual a porcentagem dos homens que não passam por uma porta padrão sem se curvarem? Qual porcentagem para mulheres? Por que estes resultados não condzem com a realdade? b) Se um estatístco projeta uma casa de modo que todas as portas tenham altura sufcente para todos os homens, exceto os 10% mas altos, qual sera a altura da porta usada? 5. Os seguntes dados ndcam resstênca à compressão (em ps) de 80 corpos-de-prova de lga de alumíno-líto. 76 120 135 149 157 163 171 178 190 207 87 121 141 150 158 163 171 180 193 208 97 123 142 150 158 165 172 180 194 218 101 131 143 151 158 167 174 181 196 221 7
105 133 145 153 158 167 174 181 199 228 110 133 146 154 160 168 175 183 199 229 115 134 148 154 160 169 176 184 200 237 118 135 149 156 160 170 176 186 201 245 a) Construa um hstograma para esses dados. b) Calcule a méda, a moda e medana e os quarts desses dados. c) Você acha que o corpo-de-prova sobrevverá a uma compressão maor do que 220 ps? Justfque. 6. Na Companha A, olhando todos os saláros de funconáros concluu-se que: a méda dos saláros é de R$10.000,00 e o 3 o quartl é R$5.000,00. Se você se apresentasse como canddato a funconáro e se o seu saláro fosse escolhdo ao acaso entre todos os possíves saláros, o que sera mas provável: ganhar mas ou menos que R$5.000,00? 7. Um professor consdera que sua últma avalação deve ter peso maor por se tratar de um conteúdo mas mportante. Assm os pesos para as quatro avalações são 2, 2, 2 e 3. Se um ndvíduo trou 5,7-8,9-7,8-8,0, qual é sua méda fnal? 8. O consumo de argamassa (em toneladas) em 50 construções em Cuabá é fornecdo na tabela a segur. Consumo Qtde. de construções Percentual Fonte: Dados fctícos Calcule a méda, a moda e a medana destes dados. 9. Numa pesqusa realzada com 100 famílas, levantaram-se as seguntes nformações: Número de flhos 0 1 2 3 4 5 6 ou mas Total Qtde. de famílas 17 20 28 19 7 4 5 100 a) Qual a medana do número de flhos? b) E a moda? c) Que problemas você enfrentara para calcular a méda? Faça alguma suposção e encontre-a. 10. Para se estudar o desempenho de duas construtoras nvestgou-se o número de reclamações de clentes nos últmos anos, para cada construtora. Os dados estão a segur. Construtora Dados sobre a quantdade de reclamações A 45 62 38 55 54 65 60 55 48 56 59 55 54 70 64 55 48 60 B 57 50 59 61 57 55 59 55 52 55 52 57 58 51 58 59 56 53 50 54 56 8
Que nformações revelam esses dados? Respostas 1. Produção (ml t) Consumo aparente (ml t) Consumo Per-Capta (Kg/hab) Exportação (ml t) Importação (ml t) MEDIANA 39901 39710 224 431 223 MÉDIA 43579 43213 235 476 285 MODA NE NE NE NE 223 2. Medana = 4 (parcalmente satsfeto); Méda = 3,7 (entre neutro e pouco satsfeto); Moda = 4 (parcalmente satsfeto). Com base nestes ndcadores, pode-se dzer que os estudantes estão satsfetos, porém não completamente. Analsando os decs, constata-se que apenas 20% dos estudantes estão de, algum modo, nsatsfetos com o curso. 3. a) N. de Funconáros Qtde. 292 -- 16709 40 16709 -- 33126 2 33126 -- 49543 1 49543 -- 65960 0 65960 -- 82377 0 82377 -- 98794 0 98794 -- 115211 1 Total 44 b) Méda = 8227 funconáros; medana = 2588 funconáros; moda = 5095. A prmera medda descreve o número médo de funconáros por construtora e este número é altamente nfluencado pelos valores extremos e dscrepantes (como é o caso da empresa com mas de 115 ml funconáros). A medana, por dvdr os dados em duas partes guas, é pouco nfluencada por valores dscrepantes e, neste caso, ndca melhor a concentração dos dados. c) q 1 = 1299 funconáros; q 2 = 2588 funconáros; q 3 = 6613 funconáros. Os quarts ndcam que 75% das construtoras tem até 6613 funconáros, e as mas empregadoras empregam entre 6,6 e 115 ml funconáros, aproxmadamente. 4. a) 0% e 0%. Porque a amostra é muto pequena para representar a população de alturas de homens e mulheres, anda que seja em um únco país. b) No máxmo 190,9 cm 5. a) Resstênca à compressão (em ps) Qtde. 76 -- 98 3 98 -- 120 5 120 -- 142 10 142 -- 164 24 164 -- 186 21 186 -- 208 10 208 -- 230 5 230 -- 252 2 Total 80 9
b) Méda = 162,7 ps; Medana = 161,5 ps; Moda = 158 ps. Quarts: c) Pela amostra, a chance é 5 em 80, ou seja, 6,3%, aproxmadamente. 6. Embora a méda salaral seja consderada alta (10 ml reas), é mas provável (com 75% de chance) que o saláro escolhdo aleatoramente seja menor que 5 ml reas (tercero quartl). 7. Nota 7,64, aproxmadamente. 8. Moda = 4,35; Medana = 7,05; Méda = 7,27. 9. a) Dos flhos. b) Dos flhos. c) Encontrar o valor numérco da categora 6 ou mas para fazer a méda ponderada. Isto pode ser superado consderando o menor valor (6). Assm, a méda fcará gual a 2,1 flhos. 10. Construtora A Construtora B Os dados ndcam que as duas construtoras tem desempenhos muto semelhantes ( =55,7 e =55,4 reclamações), mas as reclamações ao longo dos anos tem varado mas na construtora A do que na B (A A = 32 e A B = 11 reclamações). Méda 55,7 Méda 55,4 Medana 55 Medana 56 Moda 55 Moda 57 Desvo padrão 7,7 Desvo padrão 3,2 Ampltude 32 Ampltude 11 Mínmo 38 Mínmo 50 Máxmo 70 Máxmo 61 Contagem 18 Contagem 21 Lsta de Exercícos adconal AULA: MEDIDAS DE TENDÊNCIA CENTRAL 1. Nos 12 meses de 1990, uma delegaca regstrou 4, 3, 5, 5, 10, 8, 9, 6, 3, 4, 8 e 7 assaltos à mão armada. Calcule a méda, sto é, o número médo de assaltos por mês. 2. Numa excursão, de um grupo de pessoas que freqüentam a mesma academa, as dades são: 18, 17, 21, 19, 21, 18, 18, 54, 20. Determne a méda das dades e verfque porque esta méda pode ser mal nterpretada. Poderíamos determnar outra medda de tendênca central? Por quê? 3. Em um posto de controle rodováro (onde o lmte de velocdade é de 120 km/h), doze motorstas multados por excesso de velocdade estavam drgndo a: 128, 130, 160, 135, 125, 140, 140, 139, 148, 136, 138 e 145 km/h. a) Em méda em quantos km/h esses motorstas estavam excedendo o lmte? b) Se os motorstas que excedam o lmte em até 20 km/h foram multados em R$ 150,00 e os que excedam em mas de 20 km/h foram multados em R$ 250, 00, qual o valor médo das multas? 4. Ao testarem um novo sstema de freo, engenheros da ndústra automoblístca constataram que 21 motorstas, correndo a 120 km/h conseguram parar dentro das seguntes dstâncas de frenagem (em metros): 58 70 80 46 61 65 75 55 67 56 70 72 75 61 66 58 68 70 68 58 70 a) Determne a medana, a méda e a moda. (67 65,1905 70) 10