Prof. Dr. Lucas Santana da Cunha email: lscunha@uel.br http://www.uel.br/pessoal/lscunha/ 18 de abril de 2018 Londrina 1 / 15
Introdução Para entender bem uma distribuição, pode-se conhecer valores acima ou abaixo dos quais se encontra uma determinada porcentagem dos dados através das medidas separatrizes. Separatriz de uma série de n elementos colocados em ordem crescente de valor, é o elemento da série que a divide em duas partes quaisquer. As principais separatrizes são: Percentis Decis Quartis Mediana 2 / 15
Percentil O percentil de ordem j = 100p, em que (0 < p < 1), de um conjunto de valores dispostos em ordem crescente é um valor tal que j% das observações estão nele ou abaixo dele e (1 j)% estão nele ou acima dele. O p-ésimo percentil, ou de ordem j, é calculado como: P j = { y(i) +y (i+1) 2, se f = 0; y (i+1), se f > 0. em que i é a parte inteira e f é a parte fracionária de jn 100 = i + f. 3 / 15
Exemplo 1 Os pesos, em kg, de 24 coelhos da raça Nova Zelândia Branco foram anotados, obtendo-se os seguintes valores: 3,7 3,8 3,9 3,9 4,0 4,1 4,2 4,5 4,5 4,6 4,6 4,8 5,0 5,0 5,1 5,2 5,4 5,4 5,5 5,6 5,6 5,7 5,8 6,0 Determine os percentis P 17, P 40, P 75, o terceiro decil e o segundo quartil. 4 / 15
Decis Os decis, denotados por D 1, D 2, D 3,..., D 9 dividem os dados em 10 grupos com cerca de 10% deles em cada grupo. 5 / 15
Quartis Assim como a mediana divide os dados em duas partes iguais, os três quartis, denotados por Q 1, Q 2 e Q 3, dividem as observações ordenadas em quatro partes iguais: O primeiro quartil separa os 25% inferiores dos 75% superiores dos valores ordenados; o segundo quartil é a própria mediana; terceiro quartil separa os 75% inferiores dos 25% superiores dos dados. 6 / 15
Generalização O percentil generaliza qualquer medida separatriz, ou seja: o percentil de ordem 10, 20, 30,..., 90, representados por P 10 = D 1, P 20 = D 2, P 30 = D 3,..., P 90 = D 9, respectivamente, são chamados decis; o percentil de ordem 25, 50 e 75, representados por P 25 = Q 1, P 50 = Q 2 e P 75 = Q 3, respectivamente, são chamados quartis; o percentil de ordem 50, representado por P 50 = Md é a mediana. 7 / 15
Exemplo 2 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 1: Distribuição do número de filhotes de cadelas submetidas a inseminação artificial no Hospital Veterinário da UEL em 2005. n o de filhotes n i f i 0 1 0,03 1 4 0,13 2 6 0,20 3 10 0,33 4 7 0,23 5 2 0,07 TOTAL 30 1,0000 Determine o primeiro e o ultimo decil, o primeiro e o terceiro quartil. 8 / 15
Se os dados estão em uma tabela de distribuição de frequências, com intervalos nas classes, temos: O p-ésimo percentil, ou de ordem j, é calculado por: ( ) jn 100 F i 1 P j = L i + em que L i é o limite inferior da classe que se encontra percentil; F i 1 é a frequência acumulada da classe anterior a que se encontra o percentil; n i frequência absoluta da classe que se encontra o percentil. n i a c 9 / 15
Exemplo 3 Considere os dados da tabela de distribuição de frequências abaixo: Tabela 2: Distribuição dos pesos (kg) de 30 cães da raça Pastor Alemão. Peso n i f i 5 11 1 0,03 11 17 5 0,17 17 23 8 0,27 23 29 7 0,23 29 35 4 0,13 35 41 5 0,17 TOTAL 30 1,000 Determine os percentis P 5, P 18, P 75, o segundo decil e o primeiro quartil. 10 / 15
BoxPlot Uma aplicação interessante para os quartis é a construção do chamado gráfico de caixa (ou boxplot). Figura 1: Esboço do gráfico de caixas (BoxPlot). 11 / 15
Exemplo 4 Figura 2: Esboço do BoxPlot dos pesos dos alunos da disciplina Estatística Econômica A de 2017 por sexo. 12 / 15
Construção do gráfico 1 Calcular o primeiro quartil (Q 1 ), a mediana (M d ) e o terceiro quartil (Q 3 ); 2 Calcular a amplitude interquartílica (ou distância interquartílica), dada por d q = Q 3 Q 1 ; 3 Calcular: l i = Q 1 1, 5d q é o limite inferior inicial; l s = Q3 + 1, 5d q é o limite superior inicial 4 Verificar se há observações discrepantes, ou seja observações que estão acima do limite superior inicial ou abaixo do limite inferior inicial. 5 Definir: L I (limite inferior final): é o menor valor dos dados que não esteja abaixo do l i ; L S (limite superior final): é o maior valor dos dodos que não esteja acima do l s. 13 / 15
Exemplo 5 Considere os seguintes dados de peso (kg), em rol: 58 61 61 65 65 66 66 67 67 68 71 71 71 72 73 80 Esboce o boxplot dos pesos, em kg. Existem pontos atípicos? 14 / 15
Exercício 1 Os níveis de ácido úrico, em (mg/100 ml), encontrados nos exames bioquímicos de sangue de 16 animais de uma certa raça em um laboratório, são os seguintes: 5,1 4,0 6,4 5,0 6,0 5,5 5,5 6,0 6,2 9,0 5,2 5,5 5,7 7,5 7,0 8,0 a) Determine os percentis P 5, P 95, o primeiro e o terceiro quartil. b) Construa o gráfico de caixas (box plot); 15 / 15