MEDIDAS SEPARATRIZES lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 24 de maio de 2017
Para entender bem uma distribuição, pode-se conhecer valores acima ou abaixo dos quais se encontra uma determinada porcentagem dos dados através das medidas separatrizes. Separatriz de uma série de n elementos colocados em ordem crescente de valor, é o elemento da série que a divide em duas partes quaisquer. As principais separatrizes são: & Percentis. Decis; Quartis; Mediana;
Percentil O percentil de ordem j = 100p, em que (0 < p < 1), de um conjunto de valores dispostos em ordem crescente é um valor tal que (j)% das observações estão nele ou abaixo dele e (1 j)% estão nele ou acima dele.
Decis Os decis, denotados por D 1, D 2, D 3,..., D 9 dividem os dados em 10 grupos com cerca de 10% deles em cada grupo.
Quartis Assim como a mediana divide os dados em duas partes iguais, os três quartis, denotados por Q 1, Q 2 e Q 3, dividem as observações ordenadas em quatro partes iguais: O primeiro quartil separa os 25% inferiores dos 75% superiores dos valores ordenados; o segundo quartil é a própria mediana; terceiro quartil separa os 75% inferiores dos 25% superiores dos dados.
O percentil generaliza qualquer tipo de medida separatriz, logo: o percentil de ordem 10, 20, 30,..., 90, representados por P 10 = D 1, P 20 = D 2, P 30 = D 3,..., P 90 = D 9, respectivamente, são chamados decis; o percentil de ordem 25, 50 e 75, representados por P 25 = Q 1, P 50 = Q 2 e P 75 = Q 3, respectivamente, são chamados quartis; o percentil de ordem 50, representado por P 50 = Md é a mediana.
O p-ésimo percentil, ou de ordem j, é calculado como: P j = { y(i) +y (i+1) 2, se f = 0; y (i+1), se f > 0. em que i é a parte inteira e f é a parte fracionária de jn 100 = i + f. Aplicam-se aqui os critérios de arredondamento.
Exemplo 1 Os pesos, em kg, de 24 coelhos da raça Nova Zelândia Branco foram anotados, obtendo-se os seguintes valores: 3,7 3,8 3,9 3,9 4,0 4,1 4,2 4,5 4,5 4,6 4,6 4,8 5,0 5,0 5,1 5,2 5,4 5,4 5,5 5,6 5,6 5,7 5,8 6,0 Determine os percentis P 17, P 40, P 75, o terceiro decil e o segundo quartil.
Exemplo 2 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 1: Distribuição do número de filhotes de cadelas submetidas a inseminação artificial no Hospital Veterinário da UEL em 2005. n o de filhos n i f i 0 1 0,03 1 4 0,13 2 6 0,20 3 10 0,33 4 7 0,23 5 2 0,07 TOTAL 30 1,0000 Determine os percentis: P 10, P 25, P 90, o terceiro decil e o terceiro quartil.
(variável contínua) O p-ésimo percentil, ou de ordem j, é calculado por: P j = L i + ( ) jn 100 F i 1 n i a c em que L i é o limite inferior da classe que se encontra percentil; F i 1 é a frequência acumulada da classe anterior a que se encontra o percentil; n i frequência absoluta da classe que se encontra o percentil.
Exemplo 3 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 2: Distribuição dos pesos (kg) de 30 cães da raça Pastor Alemão. Peso n i f i 5 11 1 0,03 11 17 5 0,17 17 23 8 0,27 23 29 7 0,23 29 35 4 0,13 35 41 5 0,17 TOTAL 30 1,000 Determine os percentis P 5, P 18 e P 75, o segundo decil e o primeiro quartil.
BoxPlot Uma aplicação interessante para os quartis é a construção do chamado gráfico de caixa (ou boxplot). Figura 1: Esboço do gráfico de caixas (BoxPlot)
BoxPlot Figura 2: Esboço do BoxPlot dos pesos dos alunos do curso estatística econômica por sexo.
Construção do gráfico 1 Calcular o primeiro quartil (Q 1), a mediana (M d ) e o terceiro quartil (Q 3); 2 Calcular a amplitude interquartílica (ou distância interquartílica), dada por d q = Q 3 Q 1; 3 Calcular: l i = Q 1 1, 5d q é o limite inferior inicial; l s = Q3 + 1, 5d q é o limite superior inicial 4 Verificar se há observações discrepantes, ou seja observações que estão acima do limite superior inicial ou abaixo do limite inferior inicial. 5 Definir: L I (limite inferior final): é o menor valor dos dados que não esteja abaixo do l i ; L S (limite superior final): é o maior valor dos dodos que não esteja acima do l s.
Exemplo 4 Considere os seguintes dados de peso (kg), em rol: 58 61 61 65 65 66 66 67 67 68 71 71 71 72 73 80 Esboce o boxplot dos pesos, em kg. Existem pontos atípicos?
Exercício Os níveis de ácido úrico, em (mg/100 ml), encontrados nos exames bioquímicos de sangue de 16 animais de uma certa raça em um laboratório, são os seguintes: 5,1 4,0 6,4 5,0 6,0 5,5 5,5 6,0 6,2 9,0 5,2 5,5 5,7 7,5 7,0 8,0 a) Determine os percentis P 5, P 95, o primeiro e o terceiro quartil. b) Construa o gráfico de caixas (box plot);