Caros concurseiros, Como havia prometido, seguem comentários sobre a prova de estatística do ICMS RS. Em cada questão vou fazer breves comentários, bem como indicar eventual possibilidade de recurso. Não vou escrever o recurso propriamente dito. Vou tentar explicar o que achei das questões, aí vocês mesmos, se concordarem, escrevem os recursos da maneira que preferirem. QUESTÃO 67 A probabilidade de um gaúcho falar inglês é 0,20, de um carioca é 0,25 e de um mineiro é de 0,15. Um gaúcho, um carioca e um mineiro estão em uma mesa de um restaurante. Uma pessoa falando inglês aproxima-se desta mesa e pede uma informação. A probabilidade de ela receber algum tipo de resposta, em inglês, é: a) 0,49 b) 0,70 c) 0,60 d) 0,51 e) 0,40 Sejam A, B e C os eventos relacionados ao gaúcho falar inglês, ao carioca falar inglês e ao mineiro falar inglês. Temos: P( A B C) = P( A) + P( B) + P( C) P( A B) P( A C) P( B C) + P( A B C) P( A B C) = 0,20 + 0,25 + 0,15 0,20 0,25 0,20 0,15 0,15 0,25 + 0,20 0,25 0,15 P ( A B C) = 0,49 Outra forma de resolução é pensar no evento complementar. O estrangeiro não receberá nenhum tipo de reposta em inglês quando nenhum dos três falar inglês. Isto é dado por: P ( A B C) = (1 0,20) (1 0,25) (1 0,15) = 0,51 Se a probabilidade de ele não receber resposta em inglês é 51%, então a probabilidade de receber alguma resposta em inglês é 49%. Creio que seja possível entrar com recurso pela falta de previsão do assunto no edital. O programa, em nenhum momento, menciona probabilidade. O conhecimento de probabilidade é pré-requisito para que se possa estudar o conceito de variáveis aleatórias (previsto no item 1 do edital) e distribuição normal (item 17 do edital). 1
Para que se possa entender o conceito de variável aleatória, é suficiente saber os conceitos mais básicos de probabilidade. É suficiente que o candidato entenda a abordagem frequentista, que associa a probabilidade à freqüência relativa obtida num número muito grande de experimentos. Igualmente, para que se possa estudar o comportamento da distribuição normal, é suficiente que o candidato saiba da abordagem frequentista e como consultar uma tabela de função densidade de probabilidade. Ocorre que o assunto probabilidade envolve diversos temas, como a probabilidade da união, probabilidade da intersecção, probabilidade condicional, teorema de bayes, probabilidade do evento complementar, probabilidade de eventos independentes, eventos mutuamente exclusivos, entre outros. Nenhum desses assuntos era necessário para que o candidato pudesse estudar os tópicos efetivamente previstos no edital. Por isso, é cabível recurso para anulação da questão. Particularmente, acho que eles não vão anular. Acho que devem se apegar ao argumento de que probabilidade é pré-requisito para estudo de variáveis aleatórias. Apesar de ser possível este entendimento, eu não concordo com ele. É inviável conhecer tudo o que gera um dado resultado. Se assim fosse, o simples fato de ser cobrada a distribuição normal iria exigir que o candidato conhecesse o teorema do limite central, sua demonstração, entendesse as ferramentas de cálculo envolvidas (limite, derivada, integral) etc. E não é isso que ocorre. Questão 68 Seja X uma variável aleatória contínua, com função densidade de probabilidade dada por f(x) = 1+ cx, se -1 <= x <= 0, f(x) = 1 cx, se 0 < x <= 1, f(x) = 0 se x < -1 ou se x > 1. O valor da média de x é: a) 0,5 b) 0 c) 2/3 d) 1 e) 1/3 O gráfico da função densidade de probabilidade é um triângulo isóceles, centrado em zero. A figura é simétrica. Quando isso ocorre, a média corresponde ao ponto do eixo x por onde passa o eixo de simetria. A média é igual a zero. Sobre variáveis aleatórias, os únicos tópicos previstos foram: 1) o conceito e a classificação em discreta e contínua (item 1 do edital) 2) a variável aleatória normal (item 17). 2
A função densidade de probabilidade acima não é de uma variável aleatória normal. Logo, não poderia ser cobrada, por falta de previsão no edital. Questão 69 Um conjunto de N valores observados da variável X tem como valor mínimo 3 e valor máximo 9. Os possíveis valores para moda, mediana, média, desvio padrão e coeficiente de variação, respectivamente, são: a) 3, 3, 8, 1 e 1/8 b) 3, 3, 8, 2 e 2/8 c) 3, 3, 4, 2 e 0,5 d) 9, 9, 4, 3 e 0,5 e) 3, 9, 4, 1 e 0,25 Vamos começar pela letra D, que é a única que indica a moda valendo 9. Nesta alternativa, moda e mediana seriam iguais a 9, que é justamente o valor máximo. Ou seja, metade dos valores são iguais a 9. Vamos tentar baixar a média ao máximo. Mesmo que todos os demais valores sejam iguais a 3 (valor mínimo), a média ficaria: 3 + 9 = 6 2 A média não seria igual a 4. A alternativa D está errada. Eliminando-se a alternativa D, já sabemos que a moda é igual a 3. Moda = 3 Vamos agora para a alternativa E. Ela aponta que a mediana é 9. Como 9 é justamente o valor máximo, então metade dos valores são iguais a nove. Com isso, a moda, certamente, também seria igual a 9, e não igual a 3. A alternativa está errada. Descartando-se as alternativas D e E, já sabemos que a moda é igual a 3 e a mediana é igual a 3. mediana = 3 Como 3 é justamente o valor mínimo, então metade dos dados são iguais a 3. Vamos tentar elevar ao máximo a média. Vamos supor que a outra metade é igual a 9. Neste caso, o valor máximo para a média seria 6. Com isso, descartamos A e B. Por exclusão, a resposta é letra C. Nesta questão eu não vi possibilidade de recurso. 3
Questão 70 Os salários dos funcionários da empresa AMJ, em setembro de 2009, em reais têm média de 2000 e desvio padrão de 400. A empresa oferece 5 (cinco) propostas de reajuste, P1...,P5, para todos os funcionários, em outubro de 2009, a saber: P1: reajuste de 20% mais um fixo de 100. P2: reajuste de 25% P3: reajuste de 15% mais um fixo de 200. P4: reajuste de 10% mais um fixo de 300. P5: um valor fixo de 500. A proposta de menor coeficiente de variação é: a) P1 b) P2 c) P3 d) P4 e) P5 A tabela abaixo apresenta a nova média e o novo desvio-padrão para cada proposta. inicial p1 p2 p3 p4 p5 Média 2000 2500 2500 2500 2500 2500 DP 400 480 500 460 440 400 CV 0,2 0,192 0,2 0,184 0,176 0,16 A proposta de menor coeficiente de variação é a P5. Na verdade, não precisaria fazer todas estas contas. Multiplicações não interferem no coeficiente de variação (pois produzem o mesmo efeito, tanto na média, quanto no desvi padrão). Somas aumentam a média e mantém inalterado o desvio padrão. Assim, uma soma reduz o coeficiente de variação. Quanto maior a soma, maior a redução. Na proposta 5, temos uma soma de 500,00, a maior entre as propostas. Nesta questão eu não vi possibilidade de recurso. 4
Questão 71 Em relação às variáveis X, definida pela cotação média diária do dólar e Y definida pelo valor máximo do índice BOVESPA no dia, obteve-se para um período de 30 dias a equação de regressão linear de y sobre x: é y= 66720 + bx. Para uma cotação média do dólar em 200 a reta de regressão permitiu estimar pontualmente um BOVESPA igual a 66480 e o teste do coeficiente angular de regressão mostrou uma relação linear estatisticamente significativa entre duas variáveis para um nível de significância de 0,05. A afirmativa falsa é: a) Para uma cotação média de 220, o índice BOVESPA estimado é de 66456. b) Para um nível de significância de 0,05, a correlação linear é estatisticamente significativa entre X e Y. c) O coeficiente de correlação linear é positivo. d) Através dos valores da covariância entre x e y e dos desvios padrões de x e y, pode-se obter a correlação entre x e y. e) Através dos valores do coeficiente de correlação, dos desvios padrões e das médias de x e y, pode-se obter a reta de regressão de y sobre x. Quando x = 200, y = 66480. Logo: Letra A. Letra B. Correto. y = 66720 + bx 66480 = 66720 + b 200 b = 1, 2 y = 66720 1,2 220 = 66456 Letra C. Observem que o sinal de b é negativo, o que indica uma relação linear inversa (quando x aumenta, y diminui, e vice-versa). Com isso, o coeficiente de correlação será negativo. Alternativa errada. Para marcar a alternativa C, o candidato precisaria saber que, se o coeficiente de correlação é negativo, as variáveis em estudo têm uma relação inversa. Isso estava previsto no edital. Contudo, tanto o enunciado quanto uma das alternativas remetem a assuntos não previstos no edital. As expressões nível de significância e estatisticamente significativo remetem a teste de hipóteses. 5
O edital prevê regressão linear simples. E só. Não contempla teste de hipóteses (com nenhuma das distribuições usuais normal, distribuição T, distribuição binomial, F). Não contempla análise de variância. Ora, diante deste contexto, seria natural esperar que regressão linear se referisse apenas ao estudo de como obter a reta de regressão. Supõe-se que duas variáveis X e Y tenham uma relação dada por: Y = α + β + ε i X i Onde α e β são constantes do modelo e ε é um erro aleatório. A partir de uma amostra, obtém-se os valores de a e b, que estimam α e β, utilizando o método de mínimos quadrados. Com este procedimento, é possível obter uma reta que estima a verdadeira relação entre X e Y. Ou seja, o candidato deveria saber como é feito o cálculo de a e b. Só isso. Eu, se tivesse dado um curso para este concurso, com base neste edital, pararia neste ponto, de consciência tranqüila. E que o que é que vem em seguida? Bom, em seguida, você pode testar a hipótese de que β é igual a zero. Caso ele seja significativamente diferente de zero, você pode afirmar que há relação linear entre X e Y. Você está testando uma hipótese. Este teste pode ser feito com o uso da distribuição T, ou com a análise de variância da regressão. Ou seja, o candidato precisaria saber: - o que é um teste de hipóteses (o que significam as regiões crítica e de aceitação, bem como determiná-las) - como fazer teste de hipóteses com a distribuição T. - o que é uma análise de variância - como fazer teste de hipóteses a partir dos quadrados médios obtidos na análise de variância - aplicar a análise de variância à reta de regressão linear. Nada disso estava previsto no edital. É forçar a barra supor que regressão linear já contemple, automaticamente, todos esses tópicos aí de cima. i Questão 72 Seja Z uma variável aleatória contínua normalmente distribuída com média zero e desvio padrão um. Seja P (Z<-1) = 0,1587 e P (Z>2) = 0,0228. Seja X uma variável aleatória contínua normalmente distribuída com média 200 e desvio padrão 20, então P(180<X<240), é: a) 0,9772 b) 0,8413 c) 0,3413 d) 0,8185 6
e) 0,4772 P ( 180 < X < 240) =? 180 200 X 200 240 200 = P ( < < ) 20 20 20 = P ( 1 < Z < 2) = 1 0,1587 0, 0228 = 81,85% Nesta questão eu não vi possibilidade de recurso. A tabela a seguir representa a distribuição de freqüências da idade de uma amostra de moradores de um asilo. Utilize para resolver as questões 73 e 74. Xi fi 70 --- 74 7 74 --- 78 19 78 --- 82 13 82 --- 86 11 86 --- 90 6 90 --- 94 4 Total 60 A idade aproximada da mediana é: a) 78,22 b) 80,00 c) 79,38 d) 78,55 e) 79,23 Questão 73 Xi fi F 70 --- 74 7 7 74 --- 78 19 26 7
78 --- 82 13 39 82 --- 86 11 50 86 --- 90 6 56 90 --- 94 4 60 Temos: D 78 30 26 = D = 79,23 82 78 39 26 Nesta questão eu não vi possibilidade de recurso. Questão 74 O valor da moda pelo método de King é: 72,8 76,6 80,0 76,0 19,0 13 M = 74 + 4 = 76,6 13 + 7 Nesta questão eu não vi possibilidade de recurso. Questão 75 Sabendo que a correlação estatisticamente significativa entre o preço do vinho e a quantidade vendida é de -0,70 pode-se dizer que: a) 70% da variabilidade da quantidade vendida é determinada pelo preço do vinho. b) Quanto maior o preço do vinho, maior a quantidade vendida. c) Há uma redução de 30% na quantidade vendida para um aumento de R$ 1,00 no preço. d) Da variabilidade total da quantidade vendida, 49% é explicada pelo preço do produto. e) Para um aumento de R$ 1,00 no preço do vinho, há uma redução de 0,7 na quantidade vendida.. 8
O coeficiente de determinação é igual ao quadrado do coeficiente de correlação. r 0,7 2 2 = = Nesta questão eu não vi possibilidade de recurso. 0,49 Questão 76 O índice de preços de Laspeyres, para um conjunto de produtos, é 120 e o de Paasche é 110. A afirmativa correta é: a) O coeficiente de correlação entre preço e quantidade, para tais produtos, é negativo. b) O aumento médio dos prelos dos produtos foi de 15%. c) A redução média nos preços dos produtos foi de 20%. d) O coeficiente de correlação entre preço e quantidade, para tais produtos, é nulo. e) O aumento médio dos preços dos produtos foi de 115%. A relação entre os índices de Laspeyres e Paasche é dada por: IL IP r sp s = 1 V / V Onde: - r é o coeficiente de correlação linear entre o relativo de preços e o relativo de quantidade. - s P é o desvio-padrão do relativo de preços - s Q é o desvio-padrão do relativo de quantidade - V t é o valor monetário das vendas no ano de interesse, considerando preços do ano de interesse e quantidade do ano de interesse. - V 0 é o valor monetário das vendas no ano base, considerando preços do ano base e quantidades do ano base. t 0 Q Nesta equação aparece o coeficiente de correlação linear entre o relativo de preços e o relativo de quantidades. Prestem bem atenção. O que importa é a correlação linear entre dois índices: um para quantidade, outro para preços. Calculamos a relação entre os preços no ano de interesse e no ano base (índice relativo de preços). Calculamos a relação entre as quantidades no ano de interesse e no ano base (índice relativo de quantidades). Fazemos a correlação linear entre ambos. E é esse valor que entra na fórmula. Quando r = 0, temos: IL = IP 9
Se r > 0, temos: IL < IP Se r < 0, temos: IL > IP Como, neste caso, IL > IP, o coeficiente é negativo. Por este motivo, indicou-se a letra A como resposta, o que está errado. De fato, se IL > IP, então r < 0. Pergunta: qual coeficiente de correlação é menor que zero? Resposta: o coeficiente de correlação entre o índice relativo de preços e o índice relativo de quantidade. Nada podemos afirmar sobre a correlação entre quantidade e preço. Por isso a alternativa está errada. Como não há alternativa correta, a questão deve ser anulada. Para reforçar a argumentação, segue um contra-exemplo. Considere a seguinte tabela, referente a dois produtos: Ano base Ano de interesse Produtos preço qdade preço qdade a 200 457 100 1875 b 100 800 200 2500 Se você calcular os dois índices, chegará a: IL = 120 IP = 110 São exatamente os índices fornecidos pelo enunciado. Calculando os valores dos relativos de preço e quantidade, temos: produto relativo preço relativo qdade a 0,5 4,102844639 b 2 3,125 Como se pode observar, quando o relativo de preço aumenta, o relativo de quantidade diminui, o que indica uma relação inversa, o que implica em coeficiente de correlação linear negativo. Ou seja, a correlação linear entre o relativo de preço e o relativo de quantidade é negativa. Mas o que a questão afirmou não foi isso. A questão afirmou que o coeficiente de correlação entre preço e quantidade é negativa. Ora, isto é incorreto. Vide produto B: Preço Quantidade 100 800 200 2500 Quando o preço do produto B aumenta, a quantidade também aumenta. É uma relação direta. Isto implica em coeficiente de correlação positivo. Conseguimos construir um exemplo em que IL = 120, IP = 110 e, mesmo assim, um dos produtos apresenta correlação positiva entre quantidade e preço. Este exemplo mostra que a conclusão da alternativa A está errada. 10
Creio que cabe anulação da questão, conforme comentários acima. Questão 77 Na revista Seleções de setembro de 2009 foram publicados os resultados da 8ª edição da Pesquisa Marcas de Confiança, também apresentados através de alguns tipos de gráficos, dentre eles, os dois primeiros que estão abaixo, sendo os outros dois fictícios. A seqüência correta dos gráficos abaixo é, respectivamente: a) Polígono, colunas, histograma, barras. b) Histograma, colunas, barras, polígono c) Colunas, barras, histograma, polígono d) Histograma, polígono, barras, colunas e) Barras, colunas, histograma, polígono Sem comentários. Não vi possibilidade de recurso. Questão 78 Uma pesquisa indica que a distribuição do tempo que os candidatos de um concurso levam para entregar uma prova é aproximadamente normal, com tempo médio de 1,5 horas e desvio padrão de 15 minutos. Sabendo que P ( μ < X < μ + 2σ ) = 0, 4772 e P ( μ σ < X < μ + σ ) = 0,6827, o número esperado de candidatos que levam entre 1 e 2 horas para entregar a prova, de um total de 10.000 candidatos, é: a) 5.228 b) 9.972 c) 9.544 d) 6.827 e) 3.173 11
1 1,5 = 2 0,25 2 1,5 = 2 0,25 P( 2 < Z < 2) = 2 0, 4772 = 95,44% Nesta questão eu não vi possibilidade de recurso. Questão 79 Sejam fac(k) a função de autocorrelação para k=0,1,2,... e facp(k) a função de autocorrelação parcial para k=0,1,2,..., respectivamente de uma ARMA(p,q). Considere as afirmações abaixo: para um ARMA (0,1), fac(k) só difere de 0 para k = 1. Para um ARMA (1,1), fac(k) difere de 0 para k=1 e 2 e facp(k) difere de 0 para k=2. Para um ARMA (2,0), facp(k) difere de 0 para k=1 e 2. Quais estão corretas? a) Apenas I b) Apenas II c) Apenas I e II d) Apenas I e III e) Apenas II e III Aqui vem um detalhe que eu não tinha reparado da primeira vez que vi a prova. A primeira frase tem uma palavrinha que não aparece nas demais frases. Olhem só a primeira frase: para um ARMA (0,1), fac(k) só difere de 0 para k = 1. E isto está errado. De fato, para k = 1, fac é diferente de zero. Mas há um outro valor de k para o qual fac é diferente de zero. Trata-se de k = 0. Seja γ k a covariância entre Z t e Z. t k 12
A fac é dada por: Se k=0, então: fac = γ k γ 0 γ o fac = = 1 0 γ 0 A primeira frase está errada. Pessoal, a análise das demais frases eu vou ficar devendo. O modelo ARIMA é um assunto que eu não estudo há muitos anos. A última vez foi na faculdade. Nos cursos de estatística que já dei, nunca precisei abordar esta matéria. O fato é que eu simplesmente não me lembro do que se trata a função de autocorrelação parcial. Não terei tempo de, antes do término da fase de recursos, conseguir um livro que trate do assunto, estudar novamente a matéria, e depois postar comentários aqui. De todo modo, supondo que as demais frases estão de acordo com o indicado pelo gabarito preliminar teríamos: - frase 2 errada - frase 3 correta. Ou seja, a única frase correta seria a 3. Não há alternativa que contemple esta opção. A questão deve ser anulada. s Ver comentários acima. Questão 80 Conhecendo apenas o índice de Laspeyres de preço e o índice de Paasche de quantidade, o cálculo utilizado para obter o índice de valor é: a) divisão b) multiplicação c) média geométrica d) média aritmética e) média harmônica Sem comentários. Não vi possibilidade de recursos. Bom, era isso. Espero que estes comentários ajudem vocês a formularem os recursos 13
Recebi e-mails pedindo também a análise da prova de matemática financeira. Infelizmente, não terei tempo de olhar a prova antes do término do prazo dos recursos. Boa sorte!! 14