Medidas de Centralidade Prof. Dr. Lucas Santana da Cunha email: lscunha@uel.br http://www.uel.br/pessoal/lscunha/ 28 de março de 2018 Londrina 1 / 26
Medidas de centralidade São utilizadas para sintetizar, em um único número, o conjunto de dados observados da variável em estudo; Usualmente emprega-se uma das seguintes medidas de posição (ou localização) central: ; ;. 2 / 26
aritmética simples A medida mais utilizada para descrever resumidamente um conjunto de dados, tabelados ou não, é a média aritmética simples. Definição Soma das observações dividida pelo número delas: µ = N i=1 y i N ( Populacional) n i=1 ȳ = y i ( Amostral) n em que y i é o valor observado do i-ésimo indivíduo, N e n é o tamanho da população e da amostra, respectivamente. 3 / 26
Exemplo 1 As taxas de juros recebidas por uma amostra de 10 ações durante certo período foram (medidas em porcentagem): 2,59 2,64 2,60 2,62 2,57 2,55 2,61 2,50 2,63 2,64 Qual é a taxa de juros média nesse período? 4 / 26
aritmética ponderada Definição A média aritmética é considerada ponderada se os valores observados tiverem pesos diferentes: ȳ = n i=1 y ip i n i=1 p i em que y i é o valor observado do i-ésimo indivíduo e p i é seu respectivo peso. 5 / 26
Exemplo 2 Do plano de ensino da disciplina Estatística Econômica A aplicada à Ciências Econômicas, tem-se que os pesos das avaliações P 1, P 2, P 3, P4 e T são p 1 = 2, p 2 = 2, p 3 = 2, p 4 = 2 e p T = 1, respectivamente. Suponhamos que um aluno tire as notas: P 1 = 8, P 2 = 5, P 3 = 6 e T = 7, qual a nota mínima que precisa na P 4 para ser aprovado na disciplina? 6 / 26
para dados agrupados Definição A média aritmética para dados agrupados nada mais é que uma média ponderada: ȳ = k i=1 y in i k i=1 n i em que y i é o valor médio da i-ésima classe e n i é a frequência absoluta da i-ésima classe. 7 / 26
Exemplo 3 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 1: Distribuição de frequências do tempo, em minutos, que usuários de Internet gastaram na rede durante sua mais recente sessão. Tempo n i f i 7 20,2 8 0,16 20,2 33,4 11 0,22 33,4 46,6 13 0,26 46,6 59,8 9 0,18 59,8 73,0 4 0,08 73,0 86,2 5 0,10 TOTAL 50 1,000 Qual é o tempo médio gasto na internet por esses usuários? 8 / 26
Exemplo 4 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 2: Distribuição de frequências do numero de filhos das famílias de um bairro de uma cidade qualquer. n o de filhos n i f i 0 5 0,1667 1 7 0,2333 2 11 0,3667 3 6 0,2000 4 1 0,0333 TOTAL 30 1,0000 Qual o numero médio de filhos das famílias desse bairro? 9 / 26
Medidas de centralidade É uma quantidade que, como a média, também procura caracterizar o centro da distribuição de frequências; É a medida que ocupa a posição central do conjunto de dados, ou seja, 50% das observações estão a cima da mediana e 50% estão a baixo.; Para determinar a mediana é preciso ordenar os dados e em seguida verificar se o n é par ou ímpar. 10 / 26
Se n ímpar Medidas de centralidade Definição M d = y ( n+1 2 ) em que y ( n+1 ) é o valor do elemento que se encontra na posição n+1 2. 2 Exemplo 5 Consideremos os seguintes dados que se referem aos salários iniciais, em reais, pagos para uma amostra de 11 economistas: 2350,00 2450,00 2550,00 2380,00 2555,00 2210,00 2390,00 2630,00 2440,00 2420,00 2380,00. Calcule o valor mediano do salário da amostra de economistas. 11 / 26
Se n é par Medidas de centralidade Definição y ( n M d = 2) + y ( n +1) 2 2 em que y ( n 2 ) e y ( n 2 +1) são os valores dos elementos que se encontram nas posições n 2 e n 2 + 1. Exemplo 6 Se retirarmos a primeira observação dos dados anteriores, temos: 2450,00 2550,00 2380,00 2555,00 2210,00 2390,00 2630,00 2440,00 2420,00 2380,00. Calcule o novo valor mediano do salário. 12 / 26
para dados agrupados Definição A mediana, para dados agrupados em classes, é dada por: ( n 2 F i 1) M d = L i + em que L i é o limite inferior da classe mediana; a c é a amplitude do intervalo da classe mediana; F i 1 é a frequência acumulada anterior à classe mediana; n i é a frequência absoluta da classe mediana. n i a c 13 / 26
Exemplo 7 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 3: Distribuição de frequências do tempo, em minutos, que usuários de Internet gastaram na rede durante sua mais recente sessão. Tempo n i F i 7 20,2 8 8 20,2 33,4 11 19 33,4 46,6 13 32 46,6 59,8 9 41 59,8 73,0 4 45 73,0 86,2 5 50 TOTAL 50 - Qual é o tempo mediano gasto na internet por esses usuários? 14 / 26
Exemplo 8 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 4: Distribuição de frequências do numero de filhos das famílias de um bairro de uma cidade qualquer. n o de filhos n i F i 0 5 5 1 7 12 2 11 23 3 6 29 4 1 30 TOTAL 30 - Qual o numero mediano de filhos das famílias desse bairro? 15 / 26
Medidas de centralidade Definição A moda, M o, é definida como o valor mais frequente do conjunto de valores observados. A moda pode ser obtida para variáveis qualitativas. Um conjunto de dados pode ser: amodal (nenhuma moda); unimodal (uma moda); bimodal (duas modas); multimodal (três ou mais modas); 16 / 26
Exemplo 9 O conjunto de números 1, 2, 3, 4, 5 não tem moda (amodal). Exemplo 10 Consideremos as alturas, em cm, de uma amostra de dez alunos do curso de Ciências Econômicas: 165 171 173 173 178 178 178 178 179 182 Temos que a altura modal é 178cm (M o = 178). Exemplo 11 O conjunto de números 1, 2, 2, 3, 3, 4, 5 tem duas modas (bimodal), M o = 2 e M o = 3. 17 / 26
para dados agrupados Para dados agrupados em classes, pode-se utilizar um dos seguintes métodos: bruta É o ponto médio da classe modal (aquela que apresenta maior frequência), ou seja: L i + L s 2 18 / 26
Método Czuber ( ) δ1 M o = L i + a c δ 1 + δ 2 em que L i é o limite inferior da classe modal; a c é a amplitude da classe modal; δ 1 é a diferença entre a frequência absoluta da classe modal e a anterior imediata; δ 2 é a diferença entre a frequência absoluta da classe modal e a posterior imediata. 19 / 26
Exemplo 12 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 5: Distribuição de frequências do tempo, em minutos, que usuários de Internet gastaram na rede durante sua mais recente sessão. Tempo n i f i p i 7 20,2 8 0,16 16 20,2 33,4 11 0,22 22 33,4 46,6 13 0,26 26 46,6 59,8 9 0,18 18 59,8 73,0 4 0,08 8 73,0 86,2 5 0,10 10 TOTAL 50 1,000 100 Qual é o tempo modal gasto na internet por esses usuários? Obs: Calcular pelos dois métodos. 20 / 26
Exemplo 13 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 6: Distribuição de frequências do numero de filhos das famílias de um bairro de uma cidade qualquer. n o de filhos n i f i p i 0 5 0,1667 16,67 1 7 0,2333 23,33 2 11 0,3667 36,67 3 6 0,2000 20,00 4 1 0,0333 3,33 TOTAL 30 1,0000 100,00 Qual o numero modal de filhos das famílias desse bairro? 21 / 26
Exemplo 14 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 7: Distribuição de frequências da cor favorita. cor n i f i p i Amarelo 3 0,1000 10,00 Azul 11 0,3667 36,67 Laranja 1 0,0333 3,33 Marrom 1 0,0333 3,33 Preto 5 0,1667 16,67 Roxo 1 0,0333 3,33 Verde 4 0,1333 13,33 Vermelho 4 0,1333 13,33 TOTAL 30 1,0000 100,00 Qual a cor favorita para o conjunto de dados? 22 / 26
EXERCÍCIO Tabela 8: Distribuição de frequências do peso, em kg, de crianças de um quarteirão de um bairro qualquer. Pesos n i f i p i 58,0 63,5 3 0,1875 18,75 63,5 69,0 7 0,4375 43,75 69,0 74,5 5 0,3125 31,25 74,5 80,0 1 0,0625 6,25 TOTAL 16 1,0000 100,00 Calcule a média, a mediana e a moda para o conjunto de dados da tabela de distribuição de frequências acima. 23 / 26
Medidas de centralidade É vista como ponto de equiĺıbrio dos dados; Utilizada quando a distribuição dos dados é pelo menos aproximadamente simétrica; Utilizada ser for necessário obter posteriormente outros parâmetros que podem depender da média, como por exemplo a variância, o desvio padrão, etc. 24 / 26
Medidas de centralidade É vista como ponto médio dos dados; Utilizada quando há valores extremos; Utilizada quando deseja-se conhecer o ponto central da distribuição; Utilizada quando a distribuição dos dados é muito assimétrica. 25 / 26
Medidas de centralidade É vista como ponto de máxima frequência dos dados; Utilizada quando a medida de interesse é o ponto mais típico ou popular dos dados; Utilizada quando precisa-se apenas de uma rápida idéia sobre a tendência central dos dados. 26 / 26