MEDIDAS DE POSIÇÃO Lucas Santana da Cunha lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 26 de abril de 2017
Introdução Medidas de posição São utilizadas para sintetizar, em um único número, o conjunto de dados observados da variável em estudo; Usualmente emprega-se uma das seguintes medidas de posição (ou localização) central: Média; ;.
A medida mais utilizada para descrever resumidamente um conjunto de dados, tabelados ou não, é a média aritmética simples. É definida como soma das observações dividida pelo número delas, ou seja: µ = N i=1 y i N (Média Populacional) n i=1 ȳ = y i (Média Amostral) n em que y i é o valor observado do i-ésimo indivíduo, N e n é o tamanho da população e da amostra, respectivamente.
Exemplo 1 As taxas de juros recebidas por uma amostra de 10 ações durante certo período foram (medidas em porcentagem): 2,59 2,64 2,60 2,62 2,57 2,55 2,61 2,50 2,63 2,64 Qual é a taxa de juros média nesse período?
A média aritmética é considerada ponderada se os valores observados tiverem pesos diferentes. De forma genérica tem-se: ȳ = n i=1 y ip i n i=1 p i em que y i é o valor observado do i-ésimo indivíduo e p i é seu respectivo peso.
Exemplo 2 Do plano de ensino da disciplina Estatística Econômica A aplicada à Ciências Econômicas, tem-se que os pesos das provas P 1, P 2, P 3 e P4 são p 1 = 1, p 2 = 2, p 3 = 2 e p 4 = 2. Assim, suponhamos que um aluno tire as notas: P 1 = 8, P 2 = 5, P 3 = 6 e P4 = 7, qual será sua média anual?
Média para dados agrupados A média aritmética para dados agrupados nada mais é que uma média ponderada, assim: ȳ = k i=1 y in i k i=1 n i em que y i é o valor médio da i-ésima classe e n i é a frequência absoluta da i-ésima classe.
Exemplo 3 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 1: Distribuição de frequências do tempo, em minutos, que usuários de Internet gastaram na rede durante sua mais recente sessão. Tempo n i f i 7 20,2 8 0,16 20,2 33,4 11 0,22 33,4 46,6 13 0,26 46,6 59,8 9 0,18 59,8 73,0 4 0,08 73,0 86,2 5 0,10 TOTAL 50 1,000 Qual é o tempo médio gasto na internet por esses usuários?
Exemplo 4 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 2: Distribuição de frequências do numero de filhos das famílias de um bairro de uma cidade qualquer. n o de filhos n i f i 0 5 0,1667 1 7 0,2333 2 11 0,3667 3 6 0,2000 4 1 0,0333 TOTAL 30 1,0000 Qual o numero médio de filhos das famílias desse bairro?
Medidas de posição É uma quantidade que, como a média, também procura caracterizar o centro da distribuição de frequências; É a medida que ocupa a posição central do conjunto de dados, ou seja, 50% das observações estão a cima da mediana e 50% estão a baixo.; Para determinar a mediana é preciso ordenar os dados; Em seguida aplique um dos processos a seguir:
Se n é ímpar, a mediana é dada por M d = y ( n+1 2 ) em que y ( n+1 ) é o valor do elemento que se encontra na posição n+1 2. Exemplo 5 2 Consideremos os seguintes dados que se referem aos salários iniciais, em reais, pagos para uma amostra de 11 economistas: 2350,00 2450,00 2550,00 2380,00 2555,00 2210,00 2390,00 2630,00 2440,00 2420,00 2380,00. Calcule o valor mediano do salário da amostra de economistas.
Se n é par, a mediana é dada por M d = y ( n 2) + y ( n 2 +1) 2 em que y ( n 2 ) e y ( n 2 +1) são os valores dos elementos que se encontram nas posições n 2 e n+2 Exemplo 6 2. Se retirarmos a primeira observação dos dados anteriores, temos: 2450,00 2550,00 2380,00 2555,00 2210,00 2390,00 2630,00 2440,00 2420,00 2380,00. Calcule o novo valor mediano do salário.
para dados agrupados A mediana, para dados agrupados em classes, é dada por: M d = L i + ( n 2 F i 1) em que L i é o limite inferior da classe mediana; a c é a amplitude do intervalo da classe mediana; F i 1 é a frequência acumulada anterior à classe mediana; n i é a frequência absoluta da classe mediana. n i a c
Exemplo 7 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 3: Distribuição de frequências do tempo, em minutos, que usuários de Internet gastaram na rede durante sua mais recente sessão. Tempo n i F i 7 20,2 8 8 20,2 33,4 11 19 33,4 46,6 13 32 46,6 59,8 9 41 59,8 73,0 4 45 73,0 86,2 5 50 TOTAL 50 - Qual é o tempo mediano gasto na internet por esses usuários?
Exemplo 8 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 4: Distribuição de frequências do numero de filhos das famílias de um bairro de uma cidade qualquer. n o de filhos n i F i 0 5 5 1 7 12 2 11 23 3 6 29 4 1 30 TOTAL 30 - Qual o numero mediano de filhos das famílias desse bairro?
Medidas de posição A moda, M o, é definida como a realização mais frequente do conjunto de valores observados. A moda pode ser obtida para variáveis qualitativas. Um conjunto de dados pode ser: amodal (nenhuma moda); unimodal (uma moda); bimodal (duas modas); multimodal (três ou mais modas);
Exemplo 9 O conjunto de números 1, 2, 3, 4, 5 não tem moda (amodal). Exemplo 10 Consideremos as alturas, em cm, de uma amostra de dez alunos do curso de Ciências Econômicas: 165 171 173 173 178 178 178 178 179 182 Temos que a altura modal é 178cm (M o = 178). Exemplo 11 O conjunto de números 1, 2, 2, 3, 3, 4, 5 tem duas modas (bimodal), M o = 2 e M o = 3.
para dados agrupados Para dados agrupados em classes, pode-se utilizar um dos seguintes métodos: bruta: é o ponto médio da classe modal (aquela que apresenta maior frequência); Método de Czuber: a moda é dada por M o = L i + ( δ1 δ 1 + δ 2 ) a c em que L i é o limite inferior da classe modal; a c é a amplitude da classe modal; δ 1 é a diferença entre a frequência absoluta da classe modal e a anterior imediata; δ 2 é a diferença entre a frequência absoluta da classe modal e a posterior imediata.
Exemplo 12 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 5: Distribuição de frequências do tempo, em minutos, que usuários de Internet gastaram na rede durante sua mais recente sessão. Tempo n i f i p i 7 20,2 8 0,16 16 20,2 33,4 11 0,22 22 33,4 46,6 13 0,26 26 46,6 59,8 9 0,18 18 59,8 73,0 4 0,08 8 73,0 86,2 5 0,10 10 TOTAL 50 1,000 100 Qual é o tempo modal gasto na internet por esses usuários? Obs: Calcular pelos dois métodos.
Exemplo 13 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 6: Distribuição de frequências do numero de filhos das famílias de um bairro de uma cidade qualquer. n o de filhos n i f i p i 0 5 0,1667 16,67 1 7 0,2333 23,33 2 11 0,3667 36,67 3 6 0,2000 20,00 4 1 0,0333 3,33 TOTAL 30 1,0000 100,00 Qual o numero modal de filhos das famílias desse bairro?
Exemplo 14 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 7: Distribuição de frequências da cor favorita. cor n i f i p i Amarelo 3 0,1000 10,00 Azul 11 0,3667 36,67 Laranja 1 0,0333 3,33 Marrom 1 0,0333 3,33 Preto 5 0,1667 16,67 Roxo 1 0,0333 3,33 Verde 4 0,1333 13,33 Vermelho 4 0,1333 13,33 TOTAL 30 1,0000 100,00 Qual a cor favorita para o conjunto de dados?
Exercício Tabela 8: Distribuição de frequências do peso, em kg, de crianças de um quarteirão de um bairro qualquer. Pesos n i f i p i 58,0 63,5 3 0,1875 18,75 63,5 69,0 7 0,4375 43,75 69,0 74,5 5 0,3125 31,25 74,5 80,0 1 0,0625 6,25 TOTAL 16 1,0000 100,00 Calcule a média, a mediana e a moda para o conjunto de dados da tabela de distribuição de frequências acima.
Média Medidas de posição é vista como ponto de equiĺıbrio dos dados; utilizada quando a distribuição dos dados é pelo menos aproximadamente simétrica; utilizada ser for necessário obter posteriormente outros parâmetros que podem depender da média, como por exemplo a variância, o desvio padrão, etc.
Medidas de posição é vista como ponto médio dos dados; utilizada quando há valores extremos; utilizada quando deseja-se conhecer o ponto central da distribuição; utilizada quando a distribuição dos dados é muito assimétrica.
Medidas de posição é vista como ponto de máxima frequência dos dados; utilizada quando a medida de interesse é o ponto mais típico ou popular dos dados; utilizada quando precisa-se apenas de uma rápida idéia sobre a tendência central dos dados.