4. Meddas descrtva para dados quanttatvos 4.1. Meddas de Posção da amostra: méda, medana e moda Consdere uma amostra com n observações: x 1, x,..., x n. a) Méda: (ou méda artmétca) é representada por x e é dada soma das observações, dvda pelo número de observações. x n 1 n x Exemplo 1: Sejam os dados:, 3, 6, 3, 5, 4, 3, 4,, 3, 10 logo x 35 x 1 35 10 3.5 Propredade: Se y = ax + b, então, para uma amostra x 1, x,..., x n, temos: y a x b, 1,, n,, e y a x b
Exemplo : Se Y = X 1, então, temos os dados transformados: 3, 5, 11, 5, 9, 7, 5, 7, 3, 5 e y 60 10 1 y 3.5 1 6.0 Note que, para duas varáves x e y, se z = x/y, então: z x y b) Medana: representada por med (x), é dada pela observação que ocupa a posção central das observações ordenadas. Defnção: Estatístca de ordem: a estatístca de ordem é dada pela -ésma observação ordenada, sendo representada por: x (), = 1,,..., n, ou seja: ) x (1) é a prmera estatístca de ordem, ou o valor mínmo da amostra; ) x (n) é a n-ésma estatístca de ordem ou o valor máxmo da amostra. ) x () é a -ésma estatístca de ordem, ou a -ésma observação ordenada; Por exemplo, para =, x () é a segunda estatístca de ordem, ou o segundo menor valor da amostra;
Desta forma, temos que as estatístcas de ordem fornecem a amostra ordenada: x (1) x ()... x (n) Seja a amostra ordenada, x (1) x ()... x (n), então, a posção central é dada pela estatístca de ordem, portanto, med ( x) x n1 Exemplo 3: Sejam os dados:, 3, 6, 3, 5, 4,, 5, (n = 9). Dados ordenados:,,, 3, 3, 4, 5, 5, 6 Então, med ( x ) x 5 3 Notas: ) A medana também é representada por x ~ ; ) Se n é par, a medana é dada pela méda artmétca das duas observações centras. Exemplo 4: Sejam agora:,,, 3, 3, 4, 4, 5, 5, 6 (n = 10). x(5) x(6) 3 4 Então, med ( x) x5.5 3. 5 c) Moda: representada por mo (x), é observação da amostra com maor frequênca, ou seja, a que mas se repete. Um conjunto de dados pode ter mas de uma moda, ou até mesmo, não ter moda.
Classfcação de um conjunto de dados em relação ao número de modas: ) unmodal: quando o conjunto tem uma únca moda; ) bmodal: quando o conjunto tem duas modas; ) multmodal: quando o conjunto tem três ou mas modas; v) amodal: quando o conjunto não tem moda (neste caso, todas as observações aparecem uma únca vez na amostra). Exemplo 5: Com os dados:, 3, 6, 3, 5, 4, 3, 4,, 3 Então, mo ( x) 3 (aparece 4 na amostra) O conjunto é unmodal. O moda pode, anda, ser calculada para varáves categórcas. Neste caso, o resulta será um valor não numérco. Veja o exemplo: Consdere os concetos de n = 10 alunos: D B A B C A A C B B mo(conceto) = B (aparece 4 na amostra) Exemplo 6: Dos alunos de Estatístca 1, dos anos 015, 016 e 017, que pratcam alguma atvdade físca regularmente, seja o número de vezes que pratcam essa atvdade físca na semana. Dados: 3 3 3 3 3 3 3 3 4 5 4 4 5 7 3 1 4 4 3 3 3 1 3 4 3 7 5 5
Dados ordenados: 1 1 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5 7 7 37 ) Méda amostral: 10 1 x, Portanto a méda amostral é: 10 x 3,4 vezes/semana 37 n 1 ) Medana amostral: como n = 37, então 19, logo, a medana é a observação ordenada que ocupa a 19ª posção, ou seja: med ( x ) x 19 3 vezes/semana ) Moda da amostra: da tabela de frequêncas verfca-se que a observação mas frequente na amostra é o 3, que aparece 14 vezes. Desta forma, a moda é: mo ( x) 3 vezes/semana
Podemos resumr as meddas de posção numa tabela: Tabela: Meddas de posção amostral da varável número de vezes que pratca atvdade físca na semana. méda medana moda 3,4 vezes/semana 3 vezes/semana 3 vezes/semana Exemplo 7: Altura (em metros) de n = 30 alunos de Estatístca 1, de 015 a 017. X = altura dos alunos (em metros) Dados ordenados: 1,54 1,57 1,59 1,59 1,60 1,6 1,63 1,65 1,67 1,68 1,70 1,70 1,70 1,7 1,7 1,73 1,74 1,74 1,75 1,75 1,77 1,78 1,78 1,79 1,80 1,83 1,84 1,90 1,90 1,95 30 ) Méda amostral: 51, 75 1 x. 51,73 Portanto a méda amostral é: x 1, 74 metros 30 n 1 ) Medana amostral: como n = 30, então 15, 5, logo, a medana é a observação ordenada que ocupa a posção 15,5, ou seja, é dada pela méda artmétca entre a 15ª e 16ª observações ordenadas:
x(15) x(16) 1,7 1,73 med ( x) x15,5 1, 75 metros ) Moda da amostra: a moda é dada pela observação 1,70m, que aparece 3 vezes na amostra: mo ( x) 1,70 metros Comandos do R para as meddas de posção: altura <- c(1.70, 1.73, 1.83, 1.60, 1.75, 1.84, 1.77, 1.78, 1.74, 1.6, 1.70, 1.67, 1.63, 1.90, 1.54, 1.68, 1.95, 1.90, 1.59, 1.74, 1.80, 1.57, 1.75, 1.7, 1.59, 1.70, 1.65, 1.78, 1.79, 1.7) # soma das observações soma <- sum(altura) soma # meda anostral xbar <- mean(altura) xbar # medana amostral medana <- medan(altura) medana
A moda não tem uma função pronta no R, portanto, podemos programar uma função e utlzá-la sempre que for necessáro. # Função no R para a moda ########################## mo <- functon(v){ tabela <- table(as.vector(v)) m <- names(tabela)[tabela == max(tabela)] f(s.numerc(v)){m <- (as.numerc(m))} f(length(m)==length(v)){ prnt("conjunto não possu moda.")} else{return(m)} } x <- c(1,,,,3,3) mo(x) x <- c("e","s","t","a","t","","s","t","","c","a") mo(x) # moda da varável altura moda <- mo(altura) moda # veja sso! altura[1] <- 1.69 mo(altura) # Crando uma lsta com estatístcas descrtvas # de posção méda, medana e moda. ################################################ descr <- as.matrx(c(mean(altura),medan(altura),mo(altura))) dmnames(descr)[[1]] <- c("méda","medana","moda") dmnames(descr)[[]] <- "altura" round(descr,4)
4.1.1. Méda, Moda e Medana e a Smetra dos dados Consdere o hstograma abaxo: Fgura 4: Função de dstrbução de probabldades sobre o hstograma. O que podemos dzer com relação a smetra da dstrbução de frequêncas representa por este hstograma? Quando uma dstrbução de frequêncas é perfetamente smétrca, teremos que a méda artmétca, a moda e a medana serão guas, ou seja: x = mo(x) = med(x)
E quanto ao exemplo acma (Fgura 4), como podemos classfcá-lo em função da sua falta de smetra? Quando a dstrbução não é smétrca, podemos dstngur duas stuações possíves (Fgura 5): ) A cauda superor da dstrbução é mas alongada, puxando a dstrbução para a dreta. Neste caso, a méda é maor do que a moda e a assmetra é dta à dreta ou postva. ) A cauda nferor da dstrbução é mas alongada, puxando a dstrbução para a esquerda. Neste caso, a méda é menor do que a moda e a assmetra é dta à esquerda ou negatva. Fgura 5: Assmetras à dreta e à esquerda, respectvamente.
Assm, para cada stuação, teremos: ) Quando a smetra é perfeta as três meddas são guas. ) Na stuação em que ocorre a assmetra à dreta, teremos a moda menor do que a medana que é menor do que a méda.
) E, para a assmetra à esquerda, devemos ter a méda menor do que a medana que é menor do que a moda. Observação mportante! As relações apresentadas são consequênca da smetra () ou assmetra () e (), não a causa.
Relação entre méda, moda e medana A Méda : usada para resumr dados contínuos smétrcos ou aproxmadamente smétrcos; aproprada quando o tamanho da amostra é moderado ou grande, mesmo quando a smetra não tão boa; é nfluencada por valores extremos, sendo puxada na dreção da cauda mas alongada (ver Fgura 5), especalmente para amostras pequenas. A Moda é o elemento de maor frequênca, sendo o ponto de máxmo de f(x); a moda é aproprada para dados de contagem; pode ser aplcada a dados qualtatvos, nomnas ou ordnas; quando o tamanho da amostra é grande, é robusta a valores extremos. A Medana está sempre no meo do conjunto, dvdndo-o em duas partes guas, fcando entre as duas meddas anterores; por ser uma medda robusta a valores extremos, é aproprada para resumr dados assmétrcos; pode ser utlzada para dados qualtatvos ordnas.
4.1.. As médas geométrca e harmônca a) Méda Geométrca: MG(x) e é dada pela n-ésma raz do produto das n observações da amostra MG( x) n x 1 1/ n n x 1 x x n Exemplo 8: Sejam os dados:, 3, 6, 3, 5, 4, 3, 4,, 3, 10 logo x 15550 1 MG ( x) 1015550 3,305054 Obs: ) para o cálculo da méda geométrca, os valores devem ser todos postvos e dferentes de zero; ) outra forma de apresentação da méda geométrca é dada pela relação: log( x ) log( x ) log( x MG( x) exp 1 n) n exp 1 n log( x ) n 1
Exemplo 9: Com os dados anterores, log( x ) 11, 95453, e 10 1 11,95453 MG ( x) exp 3,305054 10 Propredades: ) Seja a amostra x 1, x,..., x n, então, MG( a x) a MG( x) ; Exemplo 10: Se y = x: MG( y) 101595480 6.610 MG( x) ) Sejam duas varáves X e Y, então, MG x y MG( x). MG( y) Exemplo 11: Seja a segunte amostra de uma varável y: 10,0 15,0 10,0 5,0 7,5 5,0 7,5 7,5 1,5 7,5, então MG ( y) 8,6636 e, x MG y 0.4 MG( x) MG( y)
b) Méda Harmônca: MH(x) e é dada pelo recíproco da méda artmétca dos nversos das observações MH ( x) 1 1/ x1 1/ x n 1/ x n 1 x 1 1 x n 1 x n n 1 n 1 x Obs: também, para o cálculo da méda harmônca, os valores devem ser todos postvos e dferentes de zero. Exemplo 1: Sejam os dados:, 3, 6, 3, 5, 4, 3, 4,, 3, 10 1 logo 3. x 1 10 MH ( x) 3.15 3. Propredade: Seja a amostra x 1, x,..., x n, então, MH ( a x) a MH ( x)
Exemplo 13: Se y = x: 10 1 então, 1. 6 y 1 10 MH ( y) 6.5 MH ( x) 1.6 4.1.3. Relações entre as meddas deposção ) Relação de desgualdades entre as médas artmétca, geométrca e harmônca MH ( x) MG( x) Se todas as observações forem guas, ( x 1 = x =... = x n ), temos a gualdade MH ( x) MG( x) x x ) Relação empírca entre méda artmétca, medana e moda. Karl Pearson, matemátco famoso, no fnal do século XIX e níco do XX, observou emprcamente, a segunte relação entre as três meddas de posção méda, medana e moda: x mo( x) 3 x med( x) ou, anda mo( x) med( x) x
Observações: 1) Se a dstrbução dos dados for perfetamente smétrca, então x med( x) mo( x) ; ) A relação só se aplca a dstrbuções com boa smetra; 3) Só é valda para casos unmodas; 4) Depende de um tamanho de amostra n elevado.
4.1.4. Exemplos de meddas de posção Exemplo 14: uma grande companha está preocupada com o tempo em que seus equpamentos fcam em manutenção na assstênca técnca. Assm sendo, fez um levantamento do tempo de manutenção (das) de 50 equpamentos para um estudo mas detalhado. X = das em manutenção de equpamentos. 15 13 1 9 5 5 10 6 9 10 3 4 13 1 16 7 6 4 11 8 6 6 10 17 13 9 5 5 9 14 15 3 6 18 3 4 5 7 8 3 10 5 5 4 5 Dados Ordenados: 3 3 3 3 4 4 4 4 5 5 5 5 5 5 5 5 6 6 6 6 6 7 7 8 8 9 9 9 9 10 10 10 10 11 1 13 13 13 14 15 15 16 17 18 1 n = 50 observações Meddas Descrtvas de Posção: n ) Méda: 1 x 39 39 x 7. 84 das ( 8 das) 50
) Medana: Determnando a posção da medana n 1 501 5.5 Logo, a medana é dada pela méda entre a 5ª e 6ª observações ordenadas: x(5) x(6) 6 6 med ( x) 6 das ) Moda: mo(x) = 5 das (aparece 5 na amostra) o conjunto é unmodal. v) Méda geométrca: n 1 x 3.89504610 40 1/ 50 ( x) 3.89504610 6.4835 MG das n Como log( x ) 93. 46311, temos, anda, 1 93.46311 MG ( x) exp e 1.8693 6. 4835 das. 50 40
n 1 v) Méda harmônca: 9.4811 x 1 50 MH ( x) 5.737 das 9.4811 Exemplo 15: Em 1798 o centsta nglês Henry Cavendsh medu a densdade do globo terrestre em 9 ensaos. Os dados foram obtdos do Annals os Statstcs, 1977. X = densdade do globo terrestre (g/cm 3 ). 5.50 5.61 4.88 5.07 5.6 5.55 5.36 5.9 5.58 5.65 5.57 5.53 5.6 5.9 5.44 5.34 5.79 5.10 5.7 5.39 5.4 5.47 5.63 5.34 5.46 5.30 5.75 5.68 5.85 Dados ordenados 4.88 5.07 5.10 5.6 5.7 5.9 5.9 5.30 5.34 5.34 5.36 5.39 5.4 5.44 5.46 5.47 5.50 5.53 5.55 5.57 5.58 5.61 5.6 5.63 5.65 5.68 5.75 5.79 5.85 n = 9 observações Meddas Descrtvas de Posção: n 157.99 ) Méda: 1 x 157. 99 x 5. 448g/cm 3 9 ) Medana: Determnando a posção da medana n 1 30 15
Logo a medana é a 15ª observação ordenada. med x) x ( 5.46g/cm 3 ( 15) ) Moda: mo 1 (x) = 5.9 g/cm 3 e mo (x) = 5.34 g/cm 3 o conjunto é bmodal. v) Méda geométrca: n 1 x.1906510 1 1/ 9 ( x).1906510 5.4435 MG g/cm 3 n Como log( x ) 49.13848, temos, anda, 1 1 49.13848 MG( x) exp e 1.69443 5. 4435g/cm 3. 9 n 1 v) Méda harmônca: 5.331768 x 1 9 MH ( x) 5.4391g/cm 3 5.331768
Exemplo 16: Altura dos alunos das turmas A e B de Estatístca 1 no prmero semestre de 015. X = altura dos alunos (em metros). Dados ordenados 1.5 1.55 1.57 1.58 1.59 1.60 1.60 1.60 1.61 1.63 1.63 1.64 1.65 1.65 1.65 1.67 1.68 1.68 1.68 1.69 1.70 1.70 1.70 1.70 1.70 1.7 1.7 1.73 1.73 1.73 1.73 1.74 1.74 1.74 1.75 1.75 1.76 1.77 1.77 1.78 1.78 1.78 1.79 1.79 1.79 1.80 1.80 1.80 1.83 1.83 1.83 1.83 1.89 1.90 1.95 n = 55 observações Dados: x 94.5; 1 3.094 x Calcule as meddas de posção: médas artmétca, geométrca e harmônca; medana e moda.
Meddas Descrtvas de Posção: 94.5 ) Méda: x = 94.5 x 1. 7185m 55 n 1 56 ) Medana: 8, logo a medana é a 8ª observação ordenada: med ( 8) x) x ( 1.7m ) Moda: mo(x) = 1.70m aparece 5 na amostra, o conjunto é unmodal,
4.. Meddas de Dspersão (ou de varação) a) Ampltude: é dada pela dferença entre o maor e o menor valor da amostra. Sejam x( 1) mn[ x1, x,, xn] e x( n) max[ x1, x,, xn], x então, a ampltude da amostra é defnda por: A x ( x. n) A ampltude A representa o tamanho da regão na qual os dados foram observados. b) Varânca e desvo-padrão amostras: A varânca amostral é defnda pela soma dos quadrados dos desvos das observações em relação à meda amostral x, dvdda por (n 1), ou seja (1) x s 1 n. x x n 1 Mostra-se faclmente que s pode ser escrta como s n 1 x n 1 nx. O desvo padrão amostral, denotado por s, é defndo pela raz quadrada da varânca amostral e é expresso na mesma undade dos dados: s 1 n x x n 1.
c) Ampltude Interquartl: é dada pela dferença entre o 3º e o 1º quarts e representa a regão ocupada pelos 50% das observações centras. Para defnr a ampltude nterquartl, vamos prmero defnr o que são quarts amostras, Quarts amostras são meddas descrtvas que dvdem a amostra ordenada em quatro parcelas guas de 5%, ou seja, 5% 5% 5% 5% ------------ ------------ ------------ ------------ Q 1 Q Q 3 med(x) Assm sendo: ) Q 1 é o prmero quartl; ) Q = med(x), é o segundo quartl, ) Q 3 é o tercero quartl. Desta forma, denotada por A q, é defnda por A q = Q 3 Q 1 A q determna o tamanho da regão em torno da medana que contém 50% das observações centras,
4..1. Métodos para a obtenção dos quarts amostras Para a obtenção dos quarts devemos proceder da mesma forma que para a medana. Uma vez que a medana esteja determnada, temos o conjunto de dados ordenados dvddo em duas partes. Os quarts, então, são dados pelas observações centras destas duas metades. Q 1 med(x) Q 3 Observação central da metade nferor Observação central da metade superor O procedmento para encontrar os quarts é o mesmo usado para a medana, porém, teremos dos procedmentos dependendo do tamanho da amostra n ser par ou ímpar. ) Se o tamanho da amostra n for par: o procedmento é o mesmo da medana, sendo aplcada a cada uma das metades (nferor e superor); Exemplo 17: Dados: 1 1 3 4 5 5 6 6 6 7 8 8 9 n = 14 med ( x) x (7) x (8) 5 6 5.5 A medana med(x) = 5.5 dvde os dados em dos grupos de 7 observações cada um. Assm,
7 1 4 Q 1 é a 4ª observação da metade nferor e, Q 3 é a 4ª observação da metade superor. Desta forma, os quarts serão as observações ordenadas que ocupam as posções 4 e 7 + 4 = 11. 5,5 1 1 3 4 5 5 6 6 6 7 8 8 9 Q 1 x(4) 3 Q 3 x(11) 7 ) Se o tamanho da amostra n for ímpar: devemos optar por nclur, ou não, a medana nos cálculos para a determnação dos quarts..1) se a medana não for ncluída, então teremos dos grupos, nferor e superor à medana, cada um com ( n 1) observações n 1 observações nferores n 1 observações superores Q 1 med(x) Q 3 e os quarts Q 1 e Q 3 são obtdos normalmente.
Exemplo 18: Dados: 1 1 3 4 5 5 6 6 6 7 8 9 n = 13 A medana med x) x ( 5 dvde os dados em dos grupos ( 7) ordenados de 6 observações cada e, os quarts serão as médas entre as observações ordenadas x (3) e x (4) e as observações x (10) e x (11) (7 + 3 = 10). 6 1 3. 5 Q 1 é a méda da 3ª e 4ª observações do grupo nferor e, Q 3 é a méda da 3ª e 4ª observações do grupo superor. 5 1 1 3 4 5 6 6 6 7 8 9 Q x x 3 (3) (4) 1.5 Q x x 6 7 (10) (11) 3 6.5
.) se a medana for ncluída, então, ela deve ser consderada 1 tanto para a obtenção do 1º quartl, na metade nferor como na obtenção do 3º quartl, na metade superor. Desta forma, teremos grupos, com ( n 1) observações cada. grupo nferor grupo superor Q 1 med(x) Q 3 e os quarts Q 1 e Q 3 são obtdos normalmente. Exemplo 19: Dados: 1 1 3 4 5 5 6 6 6 7 8 9 n = 13 A medana med x) x ( 5 dvde os dados em dos grupos ( 7) ordenados de 6 observações cada, Inclundo a medana ao procedmento, teremos uma observação a mas em cada grupo, ou seja, teremos 7 observações 7 1 4 Q 1 é a 4ª observação do grupo nferor e, Q 3 é a 4ª observação do grupo superor, ou seja, a 10ª observação ordenada (6 + 4), 1 Observe que a medana é uma só. Ela é apenas consderada nos dos grupos para as contagens das posções dos quarts.
Q Q 1 1 3 4 5 5 5 6 6 6 7 8 9 1 x(4) 3 x(10) 3 6 ) Outra forma para a obtenção dos quarts é apresentada por Murtera (00), Se a medana ocupa a posção (n + 1)/, então Q 1 deverá ocupar a posção: n 1 1 n 3 4 Para a posção de Q 3 fazemos: ( n 1) n 3 4 3n 1 4 Portanto, Q 1 e Q 3 são dados pelas observações ordenadas que n 3 3n 1 ocupam as posções e, respectvamente, 4 4 n 3 3n 1 Se os valores de e não forem nteros, Q 1 e Q 3 4 4 devem ser obtdos por nterpolação lnear,
Por exemplo, se n 3 4 k, em que k é a parte ntera e a parte decmal, então, Q 1 pertence ao ntervalo x ; x ) e ( ( k ) ( k1) Q 1 x( k ) [ x( k 1) x( k ) Para Q 3 o procedmento é semelhante, ou seja, se 3n 1, 4 então, Q 3 pertence ao ntervalo x ; ) e Q ( ( ) x( 1) 3 x( ) [ x( 1) x( ) Exemplo 0: Dados: 1 1 3 4 5 5 6 6 6 7 8 8 9 n = 14 Para a determnação de Q 1, temos: 14 3 17 posção de Q 1 : 4. 5. 4 4 Como = 0,5, Q 1 é a nterpolação entre a 4ª e 5ª observações ordenadas: Q 3 0.5(4 3) 3.5. 1 ] ] Para a determnação de Q 3, temos:
3141 43 posção de Q 3 : 10. 75. 4 4 Aqu = 0,75 e Q 3 é a nterpolação entre a 10ª e 11ª observações ordenadas: Q 6 0.75(7 6) 6.75. 3 Obs: o tem () com n ímpar é equvalente ao tem (.), Notas: Assm como a medana, os quarts amostras dependem do tamanho da amostra n, fazendo com que nem sempre os quatro grupos tenham o mesmo tamanho; Exstem dversas outras formas para a determnação dos quarts, Nesta dscplna daremos ênfase nos tens () e (.1); Para n pequeno, pode-se, anda, obter os quarts grafcamente pelo hstograma dos dados; Os quarts são casos especas dos quants (ou percents), que são denotados por: x(p) p-ésmo quantl ou quantl de ordem p, Portanto, o quantl x(p) é dado pela observação ordenada que dexa uma frequênca acumulada gual 100p % abaxo de s, Assm sendo temos que: ) Q 1 = x(0.5) quantl de ordem 0.5; ) Q = med(x) = x(0.50) quantl de ordem 0.50; ) Q 3 = x(0.75) quantl de ordem 0.75,
4... Exemplos de meddas de dspersão: Exemplo 1: Número de pessoas com dabetes em 0 grupos de 1000 pessoas cada. Neste caso, foram obtdos os seguntes dados: 7, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 1 n n 1 x 193 e x 1889 1 193 a) Méda: x 9. 65 casos ( 10); 0 x(10 ) x(11) 1010 b) Medana: med ( x) 10 casos c) Moda: mo(x) = 10 casos. d) Varânca e desvo padrão amostral: 1889 0(9.65) 1889186.45 s 01 19 6.55 s 1.397(casos) 19 s 1.397 1.18 casos ( 1)
e) Ampltude amostral: A 17 5 casos f) Ampltude nterquartl: 101 posção de Q 1 : 5. 5, logo, o 1º quartl é dado pela méda entre a 5ª e 6ª observações ordenadas: x(5) x(6) 9 9 Q 1 9 casos. posção de Q 3 : 10 5.5 15. 5, logo o 3º quartl dado pela méda entre a 15ª e 16ª observações ordenadas: x(15) x(16) 1010 Q 3 10 casos. Desta forma, a ampltude nterquartl é: A 10 9 1 caso. q Relação entre as ampltudes amostral e nterquartl: A q A 1 5 0. Ou seja, a metade das observações centras representam 0% da ampltude total dos dados.
Exemplo : Altura dos alunos das turmas A e B de Estatístca 1 no prmero semestre de 015. X = altura dos alunos (em metros). Dados ordenados 1.5 1.55 1.57 1.58 1.59 1.60 1.60 1.60 1.61 1.63 1.63 1.64 1.65 1.65 1.65 1.67 1.68 1.68 1.68 1.69 1.70 1.70 1.70 1.70 1.70 1.7 1.7 1.73 1.73 1.73 1.73 1.74 1.74 1.74 1.75 1.75 1.76 1.77 1.77 1.78 1.78 1.78 1.79 1.79 1.79 1.80 1.80 1.80 1.83 1.83 1.83 1.83 1.89 1.90 1.95 n = 55 observações n Dado: x 94. 5 e x 16.8848 1 94.5 a) Méda: x 1. 7185m; 55 b) Medana: med x) x ( 1. 7m; ( 8) c) Moda: mo ( x) 1. 70. d) Varânca e desvo padrão amostral: 16.8848 55(1.7185) 16.884816.4369 s 0.4479 s 0.00894m 54 551 54
s 0.00894 0. 09107 m e) Ampltude amostral: A 1.95 1.5 = 0.43m f) Ampltude nterquartl: (sem nclur a medana) O prmero quartl é a posção central da metade nferor Q 1 x(14) 1.65m O tercero quartl é a posção central da metade superor Q 3 x(4) 1.78m Desta forma, a ampltude nterquartl é: A 1.78 1.65 = 0.13 q Relação entre as ampltudes amostral e nterquartl: A q A 0.13 0.43 0.30 Metade das observações centras representam 30.% da ampltude total dos dados.
Exemplo 3: Das de manutenção de equpamentos de uma grande companha, (n = 50 observações) X = das em manutenção de equpamentos, Dados Ordenados: 3 3 3 3 4 4 4 4 5 5 5 5 5 5 5 5 6 6 6 6 6 7 7 8 8 9 9 9 9 10 10 10 10 11 1 13 13 13 14 15 15 16 17 18 1 n n 1 x 39 e x 4178 1 a) 39 x 7. 84 das 50 b) x(5) x(6 ) med ( x) 6 das c) mo(x) = 8 das d) Varânca e desvo padrão amostral: 4178 50(7.84) 41783073.8 s.5453 das 501 49 s.5453 4.748 das e) Ampltude amostral: A 1 19 das
f) Ampltude nterquartl: A medana está entre a 5ª e 6ª posção, logo o prmero quartl é a posção central da metade nferor dos dados, ou seja: 51 13, logo o 1º quartl é a 13ª observação ordenada, Q x 4 das, 1 (13) O tercero quartl é a posção central da metade superor 5 13 38, logo o 3º quartl é a 38ª observação ordenada, Q x 10 das, 3 (38) Desta forma, a ampltude nterquartl é: Aq 10 4 5das Relação da ampltude nterquartl com a ampltude total: A 6 q 0.316 A 19. Metade das observações centras representam 31.6% da ampltude total.
Exemplo 4: Dados Cavendsh. X = densdade do globo terrestre (g/cm 3 ). Dados ordenados 4.88 5.07 5.10 5.6 5.7 5.9 5.9 5.30 5.34 5.34 5.36 5.39 5.4 5.44 5.46 5.47 5.50 5.53 5.55 5.57 5.58 5.61 5.6 5.63 5.65 5.68 5.75 5.79 5.85 n = 9 observações x 157.99 e x 86. 0855 157.99 x 5.448g/cm 3 9 a) Varânca amostral: 86.0855 9(5.4479) 1.36638 s 0.04773 (g/cm 3 ) 91 8 Desvo padrão amostral: s 0.04773 0. 1847 g/cm 3 b) Ampltude amostral: A 5.85 4.88 0. 97 g/cm 3 c) Ampltude nterquartl: A medana é 15ª observação ordenada, o prmero quartl (exclundo-se a medana do cálculo) é a posção central da metade nferor dos dados, ou seja:
x(7) x(8) 5.9 5.30 Q 1 5. 95 g/cm 3, x() x(3) 5.61 5.6 Q 3 5.615 g/cm 3 Desta forma, a ampltude nterquartl é: A 5.615 5.95 = 0.3 g/cm 3, q Relação da ampltude nterquartl com a ampltude total: A 0.3 q 0.330 A 0.97. Metade das observações centras representam 33.0% da ampltude total.
4.3. O coefcente de varação amostral: Uma medda utlzada para quantfcar a varabldade dos dados é o coefcente de varação, ou cv. O cv de varação amostral é dado pela razão do desvo padrão da amostra s e a méda amostral x : cv s x Notas: O coefcente de varação compara a magntude do desvo padrão s com a méda x. Se cv 1 s x. O coefcente de varação é uma medda admensonal (é um número puro) também podendo ser expresso em %. Exemplo 5: a) Número de casos com dabetes em 0 grupos de 1000 pessoas: x 9.65 casos/grupo s 1.397 (casos/grupo) s 1.397 1.18 casos/grupo 1.18 cv 0.1 ou 1.% 9.65
b) Altura dos alunos da dscplna Estatístca 1: x 1.7185m s 0.00894m s 0.00894 0.09107 m 0.09107 cv 0.0530 ou 5.30% 1.7185 c) Das de manutenção de equpamentos: x 7.84 das s.5453 das s.5453 4.748 das 4.748 cv 0.606 ou 60.6% 7.84 d) Dados Cavendsh: x 5.448g/cm 3 s 0.1847 g/cm 3 0.1847 cv 00401 ou 4.01%, 5.448
Nos exemplos acma temos os cv s de quatro processos dstntos, sendo o maor deles (das manutenção) 15 vezes maor do que o menor (Cavendsh), ndcando claramente as dferenças na dspersão dos dados. Tabela: Coefcentes de varação dos exemplos. Dados cv cv (%) Manutenção 0.606 60.6% Dabetes 0.1 1.% Alturas 0.053 5.3% Cavendsh 0.040 4.0% Um ponto de grande nteresse, contudo, dz respeto a classfcar o cv e poder dzer se um conjunto de dados tem uma dspersão muto alta, ou não. A segur serão apresentados três crtéros para classfcação do coefcente de varação. 4.3.1. Como classfcar o Coefcente de Varação O cv tem uma característca partcular de ser ntrínseco a cada processo, tendo sdo muto estudado na área agrícola, mas especfcamente, na expermentação agronômca. Város autores ndcam dferentes métodos para se classfcar o coefcente de varação. A segur, são apresentadas três classfcações.
I) Classfcação segundo Pmentel Gomes (1985), baseada em ensaos agrícolas. Faxa cv dspersão menor ou gual a 10% baxo baxa dspersão dos dados entre 10% e 0% médo méda dspersão dos dados entre 0% e 30% alto alta dspersão dos dados maor do que 30% muto alto dspersão dos dados muto alta II) Classfcação segundo Ferrera, F.V. (1991), Estatístca Expermental Aplcada à Agronoma, classfca com respeto à precsão do processo. Faxa cv precsão Abaxo de 10% muto baxo ótma entre 10% e 15% baxo boa entre 15% e 0% médo regular entre 0% e 30% alto rum maor do que 30% muto alto muto rum (ou péssma) III) Classfcação obtda no ste www.datalyser.com.br, muto utlzada em CEP - Controle Estatístco do Processo. Faxa cv dspersão menor ou gual a 15% baxo baxa dspersão dos dados entre 15% e 30% médo méda dspersão dos dados maor do que 30% Alto alta dspersão dos dados
Exemplo 6: a) Dabetes: 1.18 cv 0.1 (1.%) cv baxo a médo. 9.65 b) Aturas dos alunos: cv (5.3%) cv baxo. c) Das de manutenção de equpamentos: 4.748 cv 0.606 (60.6%) cv alto ou muto alto. 7.84 d) Dados Cavendsh: 0.1847 cv 0.0401 (4.01%) cv baxo. 5.448
4.4. O dagrama box-plot Representação gráfca da dspersão dos dados em torno da medana, é construído com as 5 meddas ordenadas: mínmo, Q 1, med(x), Q 3 e máxmo. As cnco meddas podem ser apresentadas pela representação dos cnco números: med(x) Q Q 1 Q 3 E mín(x) max(x) Observações: ) A representação dos cnco números, além da construção do box-plot, ajuda na comparação da assmetra das caudas; ) Outros percents podem ser ncluídos, amplando a representação. O dagrama box-plot fornece uma vsão smplfcada da dspersão e smetra dos dados, além de ndcar possíves valores fora do padrão (valores dscrepantes). Além dsso, pode ser utlzado na comparação de dferentes processos quanto à centraldade (posção) e varabldade (dspersão). O nome box-plot refere-se à caxa construída para representar a metade das observações centras entre os quarts.
O box plot é consttuído de 3 partes: caxa central, braços e valores dscrepantes. ) A caxa central representa a metade das observações centras entre os quarts Q 1 e Q 3. A medana é destacada na caxa por uma lnha que a dvde em duas partes. Com sso, pode-se avalar a smetra na regão central da dstrbução dos dados; ) Os braços são construídos a partr da caxa central, representando as caudas da dstrbução. A construção dos braços é baseada nos valores dos quarts e, o tamanho dos braços serve para avalar a smetra das caudas. ) Valores dscrepantes são valores fora do padrão de dspersão, aparecendo muto dstantes da maora dos dados, podendo ndcar grande forte assmetra ou varabldade (ou ambos). Os valores dscrepantes nem sempre estão presentes, sendo representados ndvdualmente a partr das caudas. Valores dscrepantes Valores dscrepantes Q 1 1.5A Q Q 1 med(x) Q 3 Q 3 + 1.5A Q
4.4.1. Procedmento para a construção do box-plot ) Construr a caxa ou box com os valores de Q 1 e Q 3 ; ) Com uma lnha, demarcar a medana na caxa, dvdndo-a em duas partes; ) Calcular os lmtes nferor (L I ) e superor (L s ): L I = Q 1 1.5A q L S = Q 3 + 1.5A q Os lmtes L I e L s são utlzados para se dentfcar valores dscrepantes. Valores dscrepantes são observações menores do que L I ou maores do que L S e são destacados ndvdualmente no boxplot com pontos além desses lmtes. v) Para os braços do box-plot, traçar lnhas a partr dos centros das lateras nferor e superor da caxa, obedecendo ao segunte crtéro: traçar uma lnha da lateral nferor da caxa até o menor valor que não seja dscrepante ou até mn(x); marcar os pontos dscrepantes menores do que L I, caso exstam; traçar uma lnha da lateral superor da caxa até o maor valor que não seja dscrepante ou até max(x); marcar os pontos dscrepantes maores do que L S, caso exstam.
Exemplo 7: varável: horas gastas por semana assstndo TV. 0,,,,, 3, 4, 5, 5, 5, 5, 5, 5, 5, 6, 7, 7, 8, 8, 8, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 1, 1, 1, 1, 14, 14, 14, 14, 14, 15, 16, 18, 0, 0, 0, 5, 5, 8, 30 10 Q 5 14 E 0 30 Fgura.: Box-plot s para a varável horas de TV, nas posções vertcal e horzontal. Comandos do R para o box-plot: x <- c( 0,,,,, 3, 4, 5, 5, 5, 5, 5, 5, 5, 6, 7, 7, 8, 8, 8,10,10,10,10,10,10,10,10, 10,10,10,1,1,1,1,14,14,14,14,14,15,16, 18,0,0,0,5,5,8,30) boxplot(x, col="bsque", man="horas assstndo TV", ylab="horas", pch=19)
Freqüênca Freqüênca Exemplo 8: varável Renda PC por exposção de cranças à volênca doméstca (grupos exposto e não exposto). Grupo exposto não exposto 68 96 100 100 11 11 117 10 10 135 150 160 160 00 60 36 50 70 84 108 109 10 10 150 150 180 0 50 60 300 Estatístcas descrtvas (reas), por grupo. Grupo n x med(x) s s Q 1 Q 3 Exposto 15 134.00 10.00 57.9 47.51 100 160 Não exposto 15 147.13 10.00 6376.70 79.85 184 0 8 6 7 6 5 5 4 4 3 3 1 1 0 0 35 85 135 185 35 85 0 66 13 198 64 330 Grupo Exposto Grupo não Exposto Box-plot renda per capta Box-plot renda per capta 50 150 50 0 100 00 300 Grupo Exposto Grupo Não Exposto Fgura.: Hstogramas e box-plot s ndvduas
Fgura.3: box-plot s por grupo lado-a-lado. Comandos do R para o box-plot lado-a-lado: exp <- c(68,96,100,100,11,11,117,10,10,135,150,160, 160,00,60) nexp <- c(36,50,70,84,108,109,10,10,150,150,180,0, 50,60,300) renda <- c(nexp,exp) gr <- c(rep("nexp",length(nexp)), rep("exp",length(exp))) boxplot(renda~gr, pch=19, col=c("medumseagreen","lghtcoral")) # para o box-plot horzontal boxplot(renda~gr, pch=19, horzontal=t, col=c("medumseagreen","lghtcoral"))
Exemplo 9: Peso da carne de mexlhões (g) provenentes de dos locas em Santa Catarna: Sambaqu e Manguezal Exemplo 30: Total de pontos obtdos pelos alunos ngressos na UFSCar no ano de 007, nos dferentes cursos.