aculdade de Economia da Universidade ova de Lisboa 1304 Análise de Dados e robabilidades ernando Brito Soares Graça Silva edro Chaves Teste Intermédio A Data: 14 de Abril de 2007, 11.00 Duração: 2 horas ota: A utilização de máquinas científicas e gráficas só será permitida depois de feito o respectivo reset. Atenção: Responda a cada grupo numa folha separada. Apresente todos os cálculos e/ou justificações para as suas respostas. I (50%) 1. Considere os seguintes dados classificados referentes ao tempo de internamento (em dias) na unidade de cuidados intensivos do Hospital Rápidas Melhoras de Lisboa, de uma amostra de 120 doentes: úmero de dias de internamento úmero de doentes 0-10 20 10-20 40 20-30 26 30-40 20 40-50 14 a) (7,5%) Construa a tabela de frequências e represente graficamente a distribuição através de um histograma de área. b) (5%) Determine o tempo médio de internamento. c) (5%) Qual a percentagem de doentes cujo tempo de internamento é superior à média? d) (5%) Sabendo que f.x utilizando este resultado. 655, calcule a variância da variável em estudo, e) (10%) Determine o coeficiente de Bowley e comente a assimetria da distribuição. f) (7,5%) Calcule o índice de Gini e comente o resultado obtido. 2. ara o Hospital Rápidas Melhoras do orto a média e a variância do tempo de internamento na unidade de cuidados intensivos obtidos para uma amostra de 100 doentes foram os seguintes: x 26 e s 158. a) (5%) Determine a variância dos tempos de internamento dos dois Hospitais. b) (5 %) Comente, quantificando, a seguinte afirmação: o Hospital Rápidas Melhoras do orto os tempos de internamento são mais dispersos. 1
1304 Análise de Dados e robabilidades II (35%) os Hospitais Rápidas Melhoras de Lisboa e do orto, organizados da mesma forma, existem 3 especialidades: Oftalmologia, Dermatologia e isiologia. Cada hospital tem o direito de determinar os seus próprios preços, mas é obrigado a fixar um preço único para cada especialidade, em cada ano. A seguinte informação encontra se disponível: Ano Lisboa Oftalmologia Dermatologia isiologia º Consultas reço º Consultas reço º Consultas reço 2002 350 12 550 10 100 20 2003 400 17 300 12 150 22,5 2004 375 20 500 15 200 25 2005 500 20 350 10 225 37,5 Ano orto Oftalmologia Dermatologia isiologia º Consultas reço º Consultas reço º Consultas reço 2002 75 15 300 8 200 15 2003 150 21 325 15 350 20 2004 100 22 200 22 500 25 2005 200 25 175 20 300 30 a) (7,5%) Calcule o índice elo de preços das consultas de Dermatologia de Lisboa. b) (10%) Sabendo que, no que diz respeito à especialidade de isiologia do orto, I / 2,5 e I / 0,5, calcule um índice simples de quantidades, com base em 2000, para esta especialidade no orto. c) (10%) Calcule o índice de Laspeyres de preços das consultas de Lisboa no ano de 2005 com base em 2004. Calcule o índice de aasche de quantidades de Oftalmologia, nos mesmos anos. Como interpreta estes valores? d) (7,5%) Sabendo que o índice de Laspeyres de preços das consultas de Oftalmologia de 2006 com base em 2005 é 1,1 e que as consultas desta especialidade no orto ficaram 20% mais caras de 2005 para 2006, calcule o preço das consultas de Oftalmologia em Lisboa em 2006. III (15%) a) (5%) Se lhe dessem a opção de o cálculo da sua média de Licenciatura ser feito utilizando a média aritmética ou a média harmónica, qual escolheria? orquê? E para calcular a média dos lucros e prejuízos anuais de uma empresa ao longo de vários anos, que tipo de média escolheria: a média aritmética ou a média geométrica? orquê? b) (5%) orque razão a última classe de uma distribuição de frequências não é considerada no cálculo do índice de Gini? Justifique a sua resposta. c) (5%) Se o índice de Laspeyres de preços for inferior ao índice de rendimento, que pode concluir sobre o valor do índice de aasche de quantidades? Justifique a sua resposta. 2
aculdade de Economia da Universidade ova de Lisboa 1304 Análise de Dados e robabilidades ernando Brito Soares Graça Silva edro Chaves Correcção Teste Intermédio A I (50%) 1. a) (7,5%) úmero de dias de internamento úmero de doentes x j S j f j j * x j.f j h j n j /h j 0-10 20 5 20 0,1(6) 0,1(6) 0,8(3) 10 2 10-20 40 15 60 0,(3) 0,5 5 10 4 20-30 26 25 86 0,21(6) 0,71(6) 5,41(6) 10 2,6 30-40 20 35 106 0,1(6) 0,88(3) 5,8(3) 10 2 40-50 14 45 120 0,11(6) 1 5,25 10 1,4 O histograma pretendido é o de área, logo temos de colocar no eixo dos yy (n j /h j ): n j /h j 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 Histograma de Área 0-10 10-20 20-30 30-40 40-50 Classes b) (5%) O tempo médio de internamento é dado por x f.x 22,3 dias. c) (5%) X 22, 3 1 22, 3 1 0,5505 0,4494 O tempo médio de internamento pertence à classe ]20,30]. or interpolação linear, temos que: 1
1304 Análise de Dados e robabilidades 30 20 30 20 22, 3 0,5505 30 22, 3 0,716 0,5 30 22, 3 10 0,716 22, 3 7, 6 d) (5%) A variância pode ser calculada pela seguinte expressão: s f.x x 655 22, 3 156, 2 dias. g e) (10%) O coeficiente de assimetria de Bowley é definido pela seguinte expressão: Q M M Q Q M M Q O primeiro quartil é dado por: Q 0,25. Através das frequências relativas acumuladas apresentadas no quadro da alínea a), podemos concluir que Q se situa na classe ]10,20]. or interpolação linear, temos que: 20 10 20 10 Q Q 10 10 0,5 0,16 10 0,25 0,16 Q 10 Q 12,5 O segundo quartil, ou mediana, é dado por Q 0,5. Através das frequências relativas acumuladas apresentadas no quadro da alínea a), podemos concluir que Q 20. O terceiro quartil é dado por Q 0,75. Através das frequências relativas acumuladas apresentadas no quadro da alínea a), podemos concluir que Q se situa na classe ]30,40]. or interpolação linear, temos que: 40 30 40 30 Q Q 30 30 0,883 0,716 10 0,75 0,716 Q 30 Substituindo os valores encontrados na expressão anterior temos que: g 32 20 20 12,5 32 20 20 12,5 0,231 Q 32 Através da observação do histograma e face ao resultado obtido para o coeficiente de Bowley, podemos concluir que a distribuição é assimétrica positiva ou enviesada à direita. f) (7,5%) O índice de Gini pode ser obtido pela seguinte expressão: G p q ; p n ; q p t t onde t j representa o total do atributo na classe j q j valores relativos acumulados do atributo (dias de internamento) p j frequências relativas acumuladas dos elementos (doentes) 2
1304 Análise de Dados e robabilidades O quadro seguinte apresenta de forma resumida o cálculo de q j e p j para cada uma das classes: úmero de dias de internamento úmero de doentes x j f j j *= p j t j t j r q j 0-10 20 5 0,1(6) 0,1(6) 100 0,037 0,037 10-20 40 15 0,(3) 0,5 600 0,224 0,261 20-30 26 25 0,21(6) 0,71(6) 650 0,243 0,504 30-40 20 35 0,1(6) 0,88(3) 700 0,261 0,765 40-50 14 45 0,11(6) 1 630 0,235 1 120-1 - 2680 1 - Utilizando os valores do quadro anterior, obtemos: G p q p 0,700 2,26 0,309 O valor obtido para o índice de Gini revela que a concentração dos doentes nos períodos de internamento é reduzida. 2. a) (5%) Estatística Hospital Rápidas Melhoras de Lisboa Hospital Rápidas Melhoras do orto Dimensão da amostra 120 100 Tempo médio de internamento (dias) Variância do tempo de internamento (dias 2 ) 22,(3) 26 156,(2) 158 O tempo médio de internamento do conjunto dos dois hospitais é dado por: x.x 120.223 100.26 4ª propriedade da média 24 dias 220 A variância do tempo de internamento do conjunto dos dois hospitais é dada por: s.s. x x 2ª propriedade da variância 120.156, 2 100.158 120. 22, 3 24 100. 26 24 160, 363 dias 220 b) (5 %) Lisboa: v s 156, 2 0,560 x 22, 3 orto: v s x 158 26 0,483 3
1304 Análise de Dados e robabilidades A afirmação é falsa, os tempos de internamento são mais dispersos no Hospital Rápidas Melhoras de Lisboa (coeficiente de dispersão mais elevado). II (35%) a) (7,5%) D I L p D L D p L 12 10 1,2; I D L p D L D p L 15 12 1,25; I D L p D L D p L 10 15 0,6 I / I / I / b) (10%) 3,5; I / 0,5 q q 2,5 q q c) (10%) q 0,5q 500 0,5q 250 q 1; I / 500 q q L p L / p 20000 20000 1 / O p 2,5250 2,5q 100 q 2,5; I / q 200 100 5; I / L L.q L.q L O O.q O p O.q q q q 300 100 3 p O L O.q L D p L D.q L p 100 2; I / L.q L O p L O.q L D p L D.q L p L.q p O L O.q L O p O.q O p L O.q L O p O.q q 350 100 q 20.375 10.500 37,5.200 L 20.375 15.500 25.200 20.500 25.200 20.375 25.100 15000 10000 1,5 R: O valor do índice de Lapeyres indica nos que, entre 2004 e 2005, os preços no Hospital de Lisboa, apesar de terem evoluído de forma diferente em cada especialidade, no geral e ponderados pelas quantidades de 2004, não se alteraram. O valor do índice de aasche indicanos que, no mesmo período, o número de consultas de Oftalmologia, apesar de ter variado de forma diferente para cada hospital, no geral e ponderado pelos preços de 2005, aumentou 50%. 4 O d) (7,5%) Consultas no orto ficam 20% mais caras de 2005 para 2006 I / 1,2 O p L 1,1 500.20 500.20 200.25.I O O.q O p O.q O L 1,1% Despesa O O.I 1,1 200.25 500.20 200.25.1,22 3.I O L 1 3. 1,2 1,1 I O L 1,05
1304 Análise de Dados e robabilidades O I L 1,05 p O L O L O p L 1,05p 20 1,05p O L 21 III (15%) a) (5%) Se me dessem a opção de calcular a minha média de licenciatura, eu utilizaria a média aritmética pois, para o mesmo conjunto de observações, o seu valor é sempre superior ou igual ao da harmónica, sendo natural que eu pretendesse obter a maior média de licenciatura possível. o cálculo do lucro médio de uma empresa ao longo dos anos, eu também utilizaria a média aritmética, pois existe a possibilidade de ocorrência de prejuízos, que mais não são são do que observações negativas, o que inviabiliza a correcta utilização da média geométrica, só utilizada quando todas as observações são positivas. b) (5%) A última classe de uma distribuição de frequências não é considerada no cálculo do Índice de Gini, de forma a que o seu valor se encontre compreendido entre 0 e 1, sendo 0 quando estamos perante uma distribuição igualitária da variável em causa e 1 se a variável for perfeitamente concentrada. Atentemos na situação de total concentração, descrita pela seguinte tabela: x j n j f j p j t j t j r q j 0 n 1 n 1 / n 1 / 0 0 0 a n 2 n 2 / 1 a.n 2 1 1 1 - a.n 2 1 - Utilizando a última classe no índice de Gini, vem G p q 1 p q 1 01 p n 1 n n 1 Assim, para garantir que uma distribuição perfeitamente concentrada apresenta um Índice de Gini de valor 1, a sua última classe deve ser ignorada no cálculo desta medida. c) (5%) L /./ I / I/ L / / I / L / I / L / 1 / 1 R: osso concluir que o índice de aasche de quantidades vai ser superior a 1, ou seja, que as quantidades, no geral e ponderadas pelos preços do ano corrente, vão aumentar. 5