MEDIDAS SEPARATRIZES Lucas Santana da Cunha email: lscunha@uel.br Universidade Estadual de Londrina 08 de maio de 2017
Para entender bem uma distribuição, pode-se conhecer valores acima ou abaixo dos quais se encontra uma determinada porcentagem dos dados através das medidas separatrizes. Separatriz de uma série de n elementos colocados em ordem crescente de valor, é o elemento da série que a divide em duas partes quaisquer. As principais separatrizes são: Percentis. Decis; Quartis; Mediana;
Percentil Medidas Separatrizes O percentil de ordem j = 100p, em que (0 < p < 1), de um conjunto de valores dispostos em ordem crescente é um valor tal que (j)% das observações estão nele ou abaixo dele e (1 j)% estão nele ou acima dele.
Decis Medidas Separatrizes Os decis, denotados por D 1, D 2, D 3,..., D 9 dividem os dados em 10 grupos com cerca de 10% deles em cada grupo.
Quartis Medidas Separatrizes Assim como a mediana divide os dados em duas partes iguais, os três quartis, denotados por Q 1, Q 2 e Q 3, dividem as observações ordenadas em quatro partes iguais: O primeiro quartil separa os 25% inferiores dos 75% superiores dos valores ordenados; o segundo quartil é a própria mediana; terceiro quartil separa os 75% inferiores dos 25% superiores dos dados.
O percentil generaliza qualquer tipo de medida separatriz, logo: o percentil de ordem 10, 20, 30,..., 90, representados por P 10 = D 1, P 20 = D 2, P 30 = D 3,..., P 90 = D 9, respectivamente, são chamados decis; o percentil de ordem 25, 50 e 75, representados por P 25 = Q 1, P 50 = Q 2 e P 75 = Q 3, respectivamente, são chamados quartis; o percentil de ordem 50, representado por P 50 = Md é a mediana.
O p-ésimo percentil, ou de ordem j, é calculado como: P j = { y(i) +y (i+1) 2, se f = 0; y (i+1), se f > 0. em que i é a parte inteira e f é a parte fracionária de jn 100 = i + f. Aplicam-se aqui os critérios de arredondamento.
Exemplo 1 As taxas de juros recebidas por uma amostra de 25 ações durante certo período foram (medidas em porcentagem): 2,50 2,52 2,53 2,54 2,59 2,60 2,61 2,62 2,64 2,65 2,66 2,68 2,69 2,70 2,72 2,75 2,77 2,80 2,81 2,82 2,83 2,85 2,88 2,89 2,91 Determine os percentis P 17, P 40, P 75, o terceiro decil e o segundo quartil.
Exemplo 2 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 1: Distribuição de frequências do numero de filhos das famílias de um bairro de uma cidade qualquer. n o de filhos n i F i 0 5 5 1 7 12 2 11 23 3 6 29 4 1 30 TOTAL 30 - Determine os percentis: P 10, P 25, P 90, o terceiro decil e o terceiro quartil.
(variável contínua) O p-ésimo percentil, ou de ordem j, é calculado por: P j = L i + ( ) jn 100 F i 1 n i a c em que L i é o limite inferior da classe que se encontra percentil; F i 1 é a frequência acumulada da classe anterior a que se encontra o percentil; n i frequência absoluta da classe que se encontra o percentil.
Exemplo 3 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 2: Distribuição de frequências do tempo, em minutos, que usuários de Internet gastaram na rede durante sua mais recente sessão. Tempo n i F i 7 20,2 8 8 20,2 33,4 11 19 33,4 46,6 13 32 46,6 59,8 9 41 59,8 73,0 4 45 73,0 86,2 5 50 TOTAL 50 - Determine os percentis P 5, P 18 e P 75, o segundo decil e o primeiro quartil.
BoxPlot Medidas Separatrizes Uma aplicação interessante para os quartis é a construção do chamado gráfico de caixa (ou boxplot). Figura 1: Esboço do gráfico de caixas (BoxPlot)
BoxPlot Medidas Separatrizes Figura 2: Esboço do BoxPlot dos pesos dos alunos do curso estatística econômica por sexo.
Construção do gráfico 1 Calcular o primeiro quartil (Q 1), a mediana (M d ) e o terceiro quartil (Q 3); 2 Calcular a amplitude interquartílica (ou distância interquartílica), dada por d q = Q 3 Q 1; 3 Calcular: l i = Q 1 1, 5d q é o limite inferior inicial; l s = Q3 + 1, 5d q é o limite superior inicial 4 Verificar se há observações discrepantes, ou seja observações que estão acima do limite superior inicial ou abaixo do limite inferior inicial. 5 Definir: L I (limite inferior final): é o menor valor dos dados que não esteja abaixo do l i ; L S (limite superior final): é o maior valor dos dodos que não esteja acima do l s.
Exemplo 4 Tabela 3: Distribuição de frequências do peso, em kg, de crianças de um quarteirão de um bairro qualquer. Pesos n i f i p i 58,0 63,5 3 0,1875 18,75 63,5 69,0 7 0,4375 43,75 69,0 74,5 5 0,3125 31,25 74,5 80,0 1 0,0625 6,25 TOTAL 16 1,0000 100,00 Esboce o boxplot da tabela de distribuição de frequências acima. Existem pontos atípicos?
Exercício 1 Para facilitar um projeto de ampliação de rede de esgoto de certa região de Curitiba, as autoridades tomaram uma amostra de tamanho 30 dos 250 quarteirões que compõe a região, e foram encontrados os seguintes números de casas por quarteirão (dados em rol): 10 12 13 13 14 15 15 16 18 18 20 21 22 23 24 25 26 27 28 29 30 31 32 36 40 40 42 42 57 60 Esboce o gráfico de caixas (boxplot) e identifique os possíveis pontos discrepantes.
Exercício 2 Um serviço de teste de consumidores obtém-se as seguintes quilometragens por litro em cinco testes realizados com dois carros de marcas concorrentes, em rol: Carro A: 10,0 11,0 12,0 12,7 12,8 13,0 13,1 13,5 13,6 14,0 Carro B: 11,9 12,0 12,2 12,3 12,5 12,5 12,6 12,7 12,8 13,4 Para o conjunto de dados: a) Faça o boxplot para os dois conjunto de dados; b) Qual carro você escolheria pelas informações do boxplot? Justifique.