Uiversidade de Brasília Departameto de Estatística 1 a Lista de PE Solução 1. a) Qualitativa omial. b) Quatitativa discreta. c) Quatitativa discreta. d) Quatitativa cotíua. e) Quatitativa cotíua. f) Qualitativa ordial. g) Quatitativa cotíua. h) Qualitativa omial.. O item (c) seria a melhor opção. 3. O ambiete a ser escolhido deveria ser um bar, item (b). Isto porque os outros ambietes ão deve haver fumates em potecial para observação. 4. a) Segue abaixo a distribuição de frequêcias para a variável Estado civil. Estado civil ( i ) relativa (f i ) Solteiro 16,4444 Casado,5556 Total 36 1, b) Segue abaixo a distribuição de frequêcias para a variável Região de procedêcia. Região de procedêcia ( i ) relativa (f i ) Iterior 1,3333 Capital 11,356 Outra 13,3611 Total 36 1, c) Segue abaixo a distribuição de frequêcias para a variável Número de filhos. Número de filhos ( i ) relativa (f i ) 4, 1 5,5 7,35 3 3,15 5 1,5 Total 1,
d) Segue abaixo a distribuição de frequêcias para a variável Idade. Idade ( i ) relativa (f i ) 5,556 5 3 6,1667 3 35 1,778 35 4 8, 4 45 8, 45 5,556 Total 36 1, 5. a) Seção: Variável qualitativa omial. Admiistração: Variável quatitativa cotíua. Direito: Variável quatitativa cotíua. Redação: Variável quatitativa cotíua. Estatística: Variável quatitativa cotíua. Política: Variável quatitativa cotíua. Ecoomia: Variável quatitativa cotíua. Iglês: Variável qualitativa ordial. Metodologia: Variável qualitativa ordial. b) A distribuição dos dados para a variável Direito é uiforme (todos os fucioários obtiveram mesmo desempeho) equato a distribuição dos dados para as variáveis Estatística e Política é mais dispersa. c) Para costruirmos o histograma com 8 classes para a variável Redação precisamos ates determiar a amplitude das classes para em seguida obtermos a frequêcia relativa e a altura de cada um dos blocos. Para facilitar a visualização desses resultados é sempre iteressate recorrermos à distribuição de frequêcias dos dados em questão. Lembre-se que calculamos a altura dos blocos pela fórmula h i f i / i, ode i é a amplitude das classes. Em osso caso, deveremos ter 8 classes de amplitude,5, ou seja, i é costate e igual a,5 ou i, 5. Redação ( i ) relativa (f i ) Altura (h i ) 6, 6, 5 1,4,8 6, 5 7, 1,4,8 7, 7, 5 4,16,3 7, 5 8, 5,,4 8, 8, 5 4,16,3 8, 5 9, 8,3,64 9, 9, 5 1,4,8 9, 5 1, 1,4,8 Total 5 1, Segue abaixo o histograma para a variável Redação.
.7 Histograma da variável R (Redação).6.5.4.3. 6 6.5 7 7.5 8 8.5 9 9.5 1 Notas de Redação d) O primeiro passo é obtermos a distribuição de frequêcias da variável em questão, ou seja, Metodologia. Metodologia ( i ) relativa (f i ) A 7,8 B 8,3 C 1,4 Total 5 1, Tedo em vista que a ossa variável é qualitativa ordial, tato o gráfico em barras quato o gráfico em pizza são recomedáveis para represetar a distribuição dos dados. Como exemplo, iremos costruir o gráfico em pizza da variável. 8% Grafico Pizza A B C 4% 3%
e) Sorteado ao acaso um dos 5 fucioários, a probabilidade de que ele teha obtido grau A em Metodologia está explicitado a tabela de distribuição de frequêcias, ou seja, 8%. f) A probabilidade é meor, pois seriam 4 possibilidades um total de 6, ou seja, a probabilidade seria de 7%. 6. a) É fácil observar que a taxa de crescimeto geométrico aual é uma variável quatitativa cotíua. Como a amplitude dos itervalos já foi especificada, vamos costruir um histograma com 5 classes de mesma amplitude e, ovamete, precisaremos da frequêcia relativa e da altura. Taxa de Cresc. ( i ) relativa (f i ) Altura (h i ) 4,1333,667 4 9,3,15 4 6 1,4, 6 8 3,1,5 8 1,667,333 Total 3 1, b) À partir dos resultados obtidos o item a) segue o histograma para a variável Taxa de crescimeto.. Histograma da variável T (Taxa de crescimeto) 8 6 4.8.6.4. 1 3 5 7 9 Taxa de crescimeto 7. a) Como em todos os exemplos ateriores, utilizamos a distribuição de frequêcias para facilitar a costrução do histograma: Classes de Aluguéis ( i ) relativa (f i ) Altura (h i ) 3 1,5,5 3 5 4,,1 5 7 8,4, 7 1 5,5,8 1 15,1, Total 1,
A difereça este caso é que as classes ão possuem mesma amplitude. Desse modo teremos h i f i / i ode 1 1,, 3, 4 3 e 5 5. O histograma resultate segue abaixo:. Histograma da variável Zu (Classes de aluguéis para a zoa urbaa) 8 6 4.8.6.4. 3 5 7 1 15 Classes de aluguéis De maeira aáloga obtemos a distribuição de frequêcias para a Zoa rural: Classes de Aluguéis ( i ) relativa (f i ) Altura (h i ) 3 3,3,3 3 5 5,5,5 5 7 15,15,8 7 1 5,5, 1 15,, Total 1 1, e o histograma resultate segue abaixo:.35 Histograma da variável Zr (Classes de aluguéis para a zoa rural).3.5. 5.5 3 5 7 1 15 Classes de aluguéis
b) Pode-se observar claramete à partir dos histogramas que as classes de aluguéis para a zoa urbaa possuem distribuição bem mais simétrica em relação à zoa rural, ode as classes de aluguéis decaem muito rapidamete à medida que aumetamos o seu valor. Outro poto a se destacar é a frequêcia zero para classes maiores do que 1. 8. Para respodermos grade parte dos ites, basta costruirmos a tabela de distribuição de frequêcias. Sedo x i s os potos médios dos itervalos de classe, segue abaixo a tabela: x i f i f i x i x i x (x i x) f i (x i x) 3,56 1,68-3,9 15,1 8,5 9,8,5,1 4,41 1,3 15,1 1,8 8,1 65,61 7,87 1,3,63 14,1 198,81 5,96 7,1,7,1 44,1 4,4 1, x 6, 9 Var(X) 7, 6 a) Pela tabela acima podemos ver que a média é x 6, 9. Para o cálculo da mediaa, ote que a mesma está situada o primeiro itervalo de classe e assim aplicamos o pricípio estudado sobre as alturas dos histogramas de tal forma que 56% 6 5% x. Resolvedo a equação obtemos x 5, 35. b) Da tabela temos que Var(X) 7, 6, etão D(X) 5, 6. c) Lembre-se que calculamos a altura dos blocos pela fórmula h i f i / i, ode i é a amplitude das classes. Em osso caso, temos 5 classes de amplitude 6, ou seja, i 6. As respectivas alturas são h 1, 93, h, 47, h 3,, h 4, 5 e h 5,. O histograma segue abaixo: Histograma da variável A (Aos de casameto).9.8.7.6.5.4.3..1 3 9 15 1 7 Aos de casameto
d) Note que q 1 q(, 5) está situado o primeiro itervalo de classe e assim aplicamos o pricípio estudado sobre as alturas dos histogramas de tal forma que 56% 6 5% q 1. Resolvedo a equação obtemos q 1, 68. Agora, veja que q 3 q(, 75) está situado o segudo itervalo de classe e aplicado o mesmo pricípio temos que 8% 1 6 19% q 3 6. Resolvedo a equação obtemos q 3 1, 7. e) Ao observamos o histograma já podemos verificar que os dados são assimétricos. Se desejarmos uma medida algébrica, basta otar que x q 1, 67 é bem meor que q 3 x 4, 7. 9. a) Se cada observação é multiplicada por, as estatísticas de ordem permaecem as mesmas posições, porém multiplicadas por e, portato, a mediaa é x. A média será dada por x 1 + + x x. O desvio padrão será (x1 x) + + (x x) (x1 x) + + (x x) D(X). b) Somado-se 1 uidades à mediaa, a mesma apeas será trasladada assim como as outras estatísticas de ordem, matedo a posição cetral e, portato, seu valor é 1 + x. A média, por sua vez, será (1 + x 1 ) + + (1 + x ) 1 + x 1 + + x 1 + x. Por fim, o desvio padrão será (1 + x1 (1 + x)) + (1 + x (1 + x)) D(X). c) Por argumetos aálogos aos ites ateriores a mediaa será x x. A média dos dados será 1 (x i x) 1 x i x i1 O desvio padrão obviamete ão será alterado, visto que a média acima é zero. ( ) x d) Após padroizarmos os dados teremos o cojuto 1 x,, x x. A mediaa D(X) D(X) será simplesmete dada por x x. D(X) A média, como o caso aterior, será zero. i1
O desvio padrão, por sua vez, será ( ) ( ) + + x 1 x D(X) x x D(X) 1 (x1 x) + + (x x) D(X) 1 1. a) Z é a ota dos fucioários com posição e escala corrigidas, ou seja, ormalizada. Pelo item d) da Questão 9 é de se esperar que a média seja zero e o desvio padrão seja 1. b) A ota de cada fucioário ormalizada segue a tabela abaixo em ordem crescete segudo as coluas: c) z e D(Z) 1.,58 1,35 1,35 -,95 -,95,58 -,18 -,95 -,18 -,18 -,18 -,18 -,95,58 1,35 -,18,58,58-3,6,58,58 -,18,58 -,95,58 d) Cosiderado o desvio padrão obtido, o itervalo em questão será (, ) e, portato, o fucioário 19 é um caso atípico, pois z 19 3, 6. Para os dados origiais, sua ota foi 4, e está bem abaixo das demais. e) Para a variável Direito ão temos variabilidade, etão devemos observar as variáveis Estatística e Política. Para Estatística já calculamos sua ota ormalizada o item b) e esta é dada por,58. A média da variável Política é p 7, 76 e o seu desvio padrão é D(P ) 1, 64. Segue que a ota ormalizada do fucioário em Política é,76 e esta represeta seu melhor desempeho relativo. 11. Primeiramete, observe que Var(X) i1 (x i x) i1 x i i1 x i i1 x i i1 x x i + x + x x i1 (x i x i x + x ) i1 x Se separássemos os valores segudo suas frequêcias, teríamos Var(X) k i1 ix i x k f i x i x. i1 1. a) Temos sete itervalos de classe com amplitude e as respectivas alturas dos blocos são h 1, 439, h, 951, h 3, 488, h 4, 69, h 5, 195, h 6, 171 e h 7, 488. O histograma segue abaixo:
.5 Histograma da variável S (Salários). 5.5 1 3 5 7 9 11 13 Salários b) Sedo x i s os potos médios dos itervalos de classe, a tabela com os valores ecessários segue abaixo: x i f i f i x i x i f i x i 1,4878,4878 1,4878 3,19,576 9 1,7118 5,976,488 5,44 7,537,3759 49,6313 9,39,351 81 3,159 11,341,3751 11 4,161 13,976 1,688 169 16,4944 1, x 3, 917 31,54 A média já está a tabela e seu valor é 3,917. Pela fórmula ecotrada a Questão 11, a variâcia é dada por Var(X) 31, 54 (3, 917) 15, 759 e, etão, o valor do desvio padrão é 3,9631. c) O Bairro A é mais homogêeo, pois tem desvio padrão meor. d) Para ecotrarmos a faixa dos 1% mais ricos basta ecotrarmos o quatil q(, 9). Note que este quatil está situado o sexto itervalo de classe e etão 3, 41% 1 1 3, 17% q(, 9) 1. Resolvedo a equação ecotramos q(, 9) 11, 859 e a faixa salarial dos 1% mais ricos é [11, 859 ; 14, ]. e) Para ecotrarmos a riqueza total basta multiplicarmos a média pelo total de observações. No osso caso, esse valor é aproximadamete 8.3,6. 13. a) x(, 1) 1, 84 e x(, 5) 1, 5. b) A iteção do autor é elimiar a cotribuição exagerada que valores atípicos proporcioam à média aritmética.
14. a) Ordeado ambas as variáveis, as mediaas ecotradas são x x () + x (1) + e ỹ y () + y (1) + 3, 5. Desse modo iremos cosiderar baixa rotatividade valores meores que e baixo salário valores meores que,5. A distribuição cojuta das duas variáveis segue abaixo: Y \ X Baixo Alto Total Baixo 1 19 Alto 7 13 Total 8 3 4 b) 1/4, 5%. c) /4 5%. d) 1/8 1, 5%. e) Bastate modificada; observe que maioria das pessoas que gaham pouco tem alta rotatividade. f) Parece haver uma associação etre alta rotatividade e baixos salários. 15. Para avaliar essa afirmação fazemos as tabelas com a distribuição relativa. Primeiramete, segue abaixo a tabela em relação ao total de coluas: Duração do efeito de dedetização Compahia Meos de De 4 a 8 Mais de Total 4 meses meses 8 meses A 33% 35% 38% 34% B 53% 51% 5% 5% C 14% 14% 1% 13% Total 1% 1% 1% 1% Agora, temos a tabela em relação ao total de lihas: Duração do efeito de dedetização Compahia Meos de De 4 a 8 Mais de Total 4 meses meses 8 meses A 3% 6% 8% 1% B 35% 58% 7% 1% C 34% 6% 6% 1% Total 34% 59% 7% 1% É fácil otar que ão há difereça etre as 3 empresas.
16. Lembrado, ovamete, o resultado obtido a Questão 11, ou seja temos que Var(x) 1 x i x, 1 i ( xi x D(x) ) ( ) yi y D(y) 1 (xi y i xy i yx i + xy) ( 1 x i x ) ( 1 y i y ) 1 xi y i x y i y x i + xy ( ) ( ) x y i y i x xi y i xy yx + xy ( x i x ) ( y i y ) xi y i xy ( x i x ) ( y i y ). 17. a) Abaixo segue o diagrama de dispersão do Setor primário versus o Ídice de aalfabetismo para as Regiões metropolitaas em questão: 4 Dispersão das regiões metropolitaas 35 Ídice de aalfabetismo 3 5 15 4 6 8 1 1 14 Setor primário b) O gráfico idica uma depedêcia liear positiva etre as variáveis. c) Utilizado a equação obtida a Questão 16, o valor do coeficiete de correlação é aproximadamete,87. d) Se observarmos a liha de tedêcia liear, as regiões de Porto Alegre e Fortaleza parecem fugir à curva. Calculado o coeficiete de correlação ao suprimir esses valores obtemos aproximadamete,99.