INTRODUÇÃO ÀS PROBABILIDADES E ESTATÍSTICA EXERCÍCIOS

Documentos relacionados
Capítulo 2. Noções básicas de probabilidade

Noções básicas de probabilidade

Distribuições conjuntas de probabilidade e complementos

Variáveis aleatórias discretas

PROBABILIDADES E ESTATÍSTICA. LEIC+LEE+LERCI (TagusPark) EXERCÍCIOS. Instituto Superior Técnico

PROBABILIDADES E ESTATÍSTICA (I)

Instituto Superior Técnico Departamento de Matemática Probabilidades e Estatística

Departamento de Matemática Secção de Estatística e Aplicações. Probabilidades e Estatística EXERCÍCIOS

x, x < 1 f(x) = 0, x 1 (a) Diga o que entende por amostra aleatória. Determine a função densidade de probabilidade

Probabilidades e Estatística 2004/05. Colectânea de Exercícios. Testes de hipóteses LEIC, LERCI, LEE

Exercícios de Probabilidades e Estatística

Probabilidades e Estatística

ESCOLA SUPERIOR DE TECNOLOGIA

ESCOLA SUPERIOR DE TECNOLOGIA

Instituto Politécnico de Leiria Escola Superior de Tecnologia e Gestão Componente Prática de Estatística Aplicada Contabilidade e Finanças

a) o time ganhe 25 jogos ou mais; b) o time ganhe mais jogos contra times da classe A do que da classe B.

PRINCIPAIS DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE

Departamento de Matemática - IST(TP)

ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

ESCOLA SUPERIOR DE TECNOLOGIA

INSTITUTO POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

UNIVERSIDADE DOS AÇORES Curso Serviço Social Estatística I 1º Ano 1º Semestre 2005/2006

Universidade da Beira Interior Departamento de Matemática

UNIVERSIDADE DA BEIRA INTERIOR. Verde Castanho Vermelho Azul Branco Total

Peso (mg) Número de cigarros [760,780[ 3 [780,800[ 7 [800,820[ 19 [820,840[ 25 [840,860[ 17 [860,880[ 12 [880,900[ 8

1073/B - Introdução à Estatística Econômica

Distribuições conjuntas de probabilidades e complementos

ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

ESCOLA SUPERIOR DE TECNOLOGIA

Experiências Aleatórias. Espaço de Resultados. Acontecimentos

Ano Lectivo 2006/2007 Ficha nº4

Ano Lectivo 2006/2007 Ficha nº5

4. Distribuições de probabilidade e

PRO 2271 ESTATÍSTICA I. 3. Distribuições de Probabilidades

INSTITUTO POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

ESCOLA SUPERIOR DE TECNOLOGIA

2 Distribuições Teóricas Discretas

Escola Superior de Tecnologia de Viseu. Probabilidades e Estatística 2007/2008 Ficha nº 2

UNIVERSIDADE FEDERAL DA PARAÍBA. Cálculo das Probabilidades e Estatística I. Terceira Lista de Exercícios

Probabilidades e Estatística

EELT-7035 Processos Estocásticos em Engenharia. Variáveis Aleatórias. EELT-7035 Variáveis Aleatórias Discretas. Evelio M. G.

ESCOLA SUPERIOR DE TECNOLOGIA

Exercícios Funções Multivariadas, Exponencial e Outras

ESCOLA SUPERIOR DE TECNOLOGIA

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Nome: N. o : f(u) du para todo o x (V) d) Se F (x) tiver pontos de descontinuidade, então X é discreta (F)

2. EXERCÍCIOS PROPOSTOS SOBRE V.A. E DISTRIB.PROBAB.

3 a Lista de PE. Universidade de Brasília Departamento de Estatística

Escola Secundária com 3º ciclo D. Dinis 12º Ano de Matemática A Tema I Probabilidades e Combinatória. 1º Teste de avaliação.

CONHECIMENTOS ESPECÍFICOS

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2006

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%

Ribeirão Preto, 2º semestre de 2012 PROBABILIDADE E ESTATÍSTICA APLICADA II

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Probabilidades e Estatística LEE, LEIC-A, LEIC-T, LEMat, LERC, MEBiol, MEBiom, MEEC, MEFT, MEMec, MEQ

ESTATÍSTICA I 2. o Ano/Gestão 1. o Semestre Época de Recurso Duração: 2 horas. 1. a Parte Teórica N. o de Exame: RESOLUÇÃO

3 NOÇÕES DE PROBABILIDADE

Probabilidades e Estatística TODOS OS CURSOS

ESTATÍSTICA I 2. o Ano/Gestão 1. o Semestre Época de Recurso Duração: 2 horas. 1. a Parte Teórica N. o de Exame: abcde

2. Lança-se ao acaso uma moeda 4 vezes e conta-se o número de faces obtidas. Escreva o espaço amostral da experiência.

Probabilidades e Estatística - LEIC + LERCI + LEE 2 o semestre 2004/05

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

1 Distribuições Discretas de Probabilidade

6.3 Valor Médio de uma Variável Aleatória

Lista de exercícios 2 Métodos Estatísticos Básicos

1. Num universo S os acontecimentos A e B são incompatíveis.

3. O departamento de pessoal de uma pequena empresa fez o levantamento dos salários dos seus 120 funcionários, obtendo os seguintes resultados

Probabilidade e Estatística

Lista 1 de Exercícios Estatística II-CE003

Estatística para Cursos de Engenharia e Informática

Amostragem e distribuições por amostragem

Inferência Estatistica

FOLHA 3 - Inferência

Probabilidades e Estatística LEAN, LEE, LEGI, LEMat, LETI, LMAC, MEAmb, MEAer, MEBiol, MEBiom, MEEC, MEFT, MEQ

{ C(1 x 2 ), se x ( 1, 1), f(x) = Cxe x/2, se x > 0, x + k, se 0 x 3; 0, c.c. k, se 1 < x 2; kx + 3k, se 2 < x 3;

4ª LISTA DE EXERCÍCIOS - LOB1012. Variáveis Aleatórias Contínuas, Aproximações e TLC

Probabilidades e Estatística LEGM, LEIC-A, LEIC-T, MA, MEMec

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Ministério da Educação. Nome:... Número:

LISTA DE EXERCÍCIOS 1 ESTATÍSTICA E PROBABILIDADES

Folha 1 PROBABILIDADES E ESTATÍSTICA

TÓPICOS DE RESOLUÇÃO - Exame de Época de Recurso (Diurno) 2009/2010. Primeira Parte. F (b) F (a) =P (a <X<b) P (a <X<b)=

1 Definição Clássica de Probabilidade

PRINCIPAIS DISTRIBUIÇÕES DE PROBABILIDADES

FICHA DE TRABALHO N. O 9

1 a Lista de Exercícios Estatística p/ Administração II Profª Ana Cláudia

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 09

Transcrição:

DEPARTAMENTO DE MATEMÁTICA - SECÇÃO DE ESTATÍSTICA E APLICAÇÕES INTRODUÇÃO ÀS PROBABILIDADES E ESTATÍSTICA EXERCÍCIOS Os exercícios consistem maioritariamente em adaptações de exercícios de PE, DM-IST, e de testes e exames de IPE de anos anteriores (incluindo do Prof. João Amaral). Em Apêndice resume-se a teoria salientado os conceitos principais. MESTRADO INTEGRADO EM ARQUITECTURA INSTITUTO SUPERIOR TÉCNICO Setembro, 2018 1

Conteúdo 1 Probabilidades 3 2 Variáveis aleatórias discretas 9 3 Variáveis aleatórias contínuas 13 4 Vectores aleatórios, combinações lineares e TLC 16 5 Estimação Pontual 20 6 Intervalos de Confiança 22 7 Testes de Hipóteses 25 8 Regressão Linear Simples 29 A Probabilidade, Variáveis e Vectores Aleatórios, Teorema do Limite Central 32 A.1 Probabilidade.................................................. 32 A.2 Variáveis aleatórias discretas......................................... 32 A.3 Variáveis aleatórias contínuas......................................... 33 A.4 Vectores Aleatórios Bivariados Discretos.................................. 33 A.5 Combinações Lineares de Variáveis Aleatórias Independentes..................... 34 A.6 Teorema do Limite Central.......................................... 34 A.7 Processo de Poisson.............................................. 35 B Estimação e Testes de Hipóteses 36 B.1 Estimação Pontual............................................... 36 B.2 Intervalos de confiança (IC).......................................... 37 B.3 Testes de Hipóteses (TH)............................................ 38 C Regressão Linear Simples 40 2

Capítulo 1 Probabilidades Experiência aleatória, espaço de resultados Ω, acontecimentos, probabilidade e cálculo combinatório 1. Num lançamento de um dado viciado, a probabilidade de ocorrer cada número ímpar é o dobro da probabilidade de ocorrer cada número par. (a) Indique qual o espaço de resultados e calcule a probabilidade de cada acontecimento elementar. (b) Calcule a probabilidade de que o número de pontos obtido no lançamento do dado seja superior a 3. (c) Calcule a probabilidade de que o número de pontos obtido no lançamento do dado seja um quadrado perfeito. 2. Admita que um lote contém peças pesando 5, 10, 15, 20 g e que existem pelo menos 2 peças de cada peso. Retiram-se 2 peças do lote. Seja X o peso da 1 a peça retirada e Y o peso da 2 a peça retirada. Identifique e utilizando o plano x y marque: (a) O espaço de resultados. (b) O acontecimento A = {(x, y) : x = y}. (c) O acontecimento B = {(x, y) : y > x}. (d) O acontecimento C = A 2 a peça é duas vezes mais pesada do que a 1 a. (e) O acontecimento D = A 1 a peça pesa menos 10g do que a 2 a. (f) O acontecimento E = O peso médio das duas peças é menor que 15 g. (g) Calcule as probabilidades dos acontecimentos em (b) (f) supondo a equiprobabilidades de todos os acontecimentos elementares. 3. Uma lotaria tem 10000 bilhetes numerados de 0000 a 9999. O número do primeiro prémio é o número do bilhete saído numa extracção ao acaso. (a) Um jogador comprou um bilhete com o número 6789. Qual a probabilidade de lhe sair o primeiro prémio? (b) Se o jogador comprar todos os bilhetes cujos números têm todos os algarismos iguais, qual a probabilidade de lhe sair o primeiro prémio? (c) Qual a probabilidade do número premiado ter todos os algarismos diferentes? 4. De um grupo de 50 alunos do IST (10 alunos por ano) é escolhida ao acaso uma comissão coordenadora de 4 pessoas. Qual a probabilidade de: (a) Ser escolhido um e um só aluno do 1º ano? (b) Serem escolhidos um aluno (e só um) do 1º ano e um aluno (e só um) do 5º ano? (c) Serem escolhidos no máximo dois alunos do 1º ano? 3

(d) Serem todos do mesmo ano? 5. Numa fila de espera de autocarro estão 4 homens, 3 mulheres e 2 crianças. Qual a probabilidade de: (a) As pessoas, dentro de cada um daqueles três grupos, estarem de seguida? (b) As 2 crianças estarem juntas? 6. Uma urna contém 5 bolas brancas e 5 bolas pretas. Dois jogadores, A e B, tiram alternadamente e um de cada de vez uma bola da urna. O jogador que tirar a primeira bola branca ganha a partida. (a) Considere a experiência aleatória associada a este jogo e escreva o correspondente espaço de resultados. (b) Calcule a probabilidade de cada jogador ganhar a partida sabendo que o jogador A é o primeiro a tirar a bola de urna. (c) Responda novamente às alíneas (a) e (b) mas agora considerando que as bolas são extraídas com reposição. 7. Considere um dado equipamento que é constituído por 10 transístores dos quais dois são defeituosos. Suponha que dois transístores são seleccionados ao acaso, com reposição. (a) Escreva o espaço de resultados correspondente a esta experiência aleatória e calcule as respectivas probabilidades. (b) Calcule as probabilidades dos seguintes acontecimentos: A 1 Sair um transístor defeituoso na 1 a tiragem. A 2 Sair um transístor defeituoso na 2 a tiragem. A 3 Sair pelo menos um transístor defeituoso. A 4 Sair exactamente um transístor defeituoso. (c) Responda às mesmas questões de (a) e (b) mas agora considerando que não houve reposição. 8. Uma bolsa contém moedas de prata e cobre em igual número. Extrai-se ao acaso e sem reposição duas moedas. Calcule a probabilidade de que: (a) A segunda moeda extraída seja de prata, sabendo que a primeira era de cobre. (b) Saia uma moeda de prata na 2 a tiragem. (c) Uma e uma só das moedas seja de prata. (d) Pelo menos uma das moedas seja de cobre. 9. Considere o lançamento de 3 dados perfeitos, sendo um branco, outro preto e outro verde. Determine a probabilidade de obter uma soma de pontos igual a 10. 10. Um grupo de apostadores do totobola decidiu jogar todas as apostas possíveis contendo 7 vitórias em casa, 4 empates e 2 vitórias fora. Calcule a probabilidade desse grupo ganhar o totobola. 11. Suponha que uma cidade tem n +1 habitantes e que um deles conta um boato a outro, que por sua vez o repete a um terceiro, e assim sucessivamente. Em cada passo, a pessoa que ouve o boato é escolhida ao acaso de entre as n restantes. Determine a probabilidade de que um boato seja contado r vezes: (a) Sem antes voltar a ser contado à pessoa que lhe deu início. (b) Sem que ninguém o ouça mais do que uma vez. 4

Probabilidade, propriedades básicas e operações entre acontecimentos 12. Sejam A e B acontecimentos tais que P(A) + P(B) = x e P(A B) = y. Determine em função de x e de y a probabilidade de: (a) Não se realizar nenhum dos dois acontecimentos. (b) Que se realize um e um só dos dois acontecimentos. (c) Que se realize pelo menos um dos dois acontecimentos. (d) Que se realize quanto muito um único acontecimento. 13. Uma colecção de 100 programas de computador foi examinada para detectar erros de sintaxe, input/output e de outro tipo diferente dos anteriores. Desses 100 programas, 20 tinham erros de sintaxe, 10 tinham erros de input/output e 5 tinham erros de outro tipo, 6 tinham erros de sintaxe e de input/output", 3 tinham erros de sintaxe"e de outro tipo, 3 tinham erros de input/output"e de outro tipo"e 2 tinham os três tipos de erros considerados. Um programa é seleccionado ao acaso desta colecção. Determine a probabilidade de que o programa seleccionado tenha: (a) Exclusivamente erros de sintaxe. (b) Pelo menos um dos três tipos de erros. 14. Numa clinica dentária há 3 gabinetes A, B e C que são usados preferencialmente por cada um dos médicos que aí trabalham. Admita que durante um determinado período num dia típico as probabilidades de cada gabinete estar ocupado são 0.5 para o A, 0.4 para o B e 0.3 para o C. Considere ainda que as probabilidades de cada um dos gabinetes B ou C estar ocupado quando A está ocupado são ambas iguais a 0.2 e que a probabilidade de C estar ocupado quando B está ocupado é 0.75. Se a probabilidade de todos os gabinetes estarem simultaneamente ocupados for 0.15 determine: (a) A probabilidade de pelo menos um dos gabinetes estar ocupado. (b) A probabilidade de A estar ocupado sabendo que pelo menos um dos outros gabinetes está ocupado. 15. Num parque natural há três percursos pedonais recomendados com durações e graus de dificuldade distintos: A, B e C. Admita que 60% dos visitantes optam pelo percurso A, 30% pelo percurso B (podendo também já ter escolhido o percurso A) e 10% pelo percurso C. Contudo, 10% acabam por fazer os percursos A e B; e, 30% dos que começaram por fazer o percurso A, 20% dos que inicialmente fizeram o percurso B e 10% dos que já fizeram os percursos A e B fazem também o percurso C. (a) Qual é a probabilidade de um visitante fazer pelo menos um dos percursos? (b) Sabendo que um visitante fez pelo menos um dos percursos A e B, qual é a probabilidade de ele fazer também o percurso C? 16. Mostre que: (a) Se A e B são acontecimentos tais que A B então P(A) P(B). (b) Para quaisquer acontecimentos C e D tem-se i=1 P(C D) P(C ) P(C D). n n (c) P( A i ) P(A i ), n N i=1 5

Lei da Probabilidade Total e Teorema de Bayes 17. (a) Em determinado local observaram-se 150 dias de chuva num ano (considere 365 dias). Obtenha (uma estimativa para) a probabilidade de chover num dia arbitrário do ano. (b) Sabe-se que 50 destes dias foram durante os meses Março Setembro. Obtenha a probabilidade de chover: i. num dia (arbitrário) de Março Setembro, ii. num dia (arbitrário) de Outubro Fevereiro. (c) Obtenha a probabilidade de chover num dia arbitrário do ano (i.e. novamente (a)) a partir dos resultados em (b). [Lei da Probabilidade Total] 18. Suponha que 5% da população portuguesa numa determinada faixa etária sofre de obesidade e que de entre estes, 75% têm elevado nível de colestrol. De entre os não obesos, 30% têm elevado nível de colestrol. (a) Qual a percentagem de pessoas com elevado nível de colestrol? (b) Qual a percentagem de pessoas que tendo elevado nível de colestrol são obesos? 19. Num parque de estacionamento subterrâneo de uma superfície comercial com três pisos, um potencial cliente procura um lugar atendendo a dois critérios: profundidade do piso e proximidade do elevador. A probabilidade de encontrar um lugar em cada um dos pisos é igual a 0.3 para o piso 1, a 0.5 para o piso 2 e a 0.2 para o último piso. A probabilidade de esse lugar se encontrar próximo do elevador é 0.05 no piso 1, 0.1 no piso 2 e 0.2 no último piso. (a) Qual é a probabilidade desse cliente conseguir um lugar junto ao elevador? (b) Supondo que esse cliente conseguiu um lugar junto ao elevador, qual é a probabilidade desse lugar se situar no piso 1? 20. Um teste é constituído por uma pergunta com n alternativas. O indivíduo que o faz ou conhece a resposta ou responde ao acaso. Seja p a probabilidade de um indivíduo conhecer a resposta. Admitindo que a probabilidade de um indivíduo responder correctamente à questão dado que conhece a resposta é 1 e que a probabilidade de responder correctamente dado que responde ao acaso é 1/n: (a) Verifique que a probabilidade de um indivíduo não ter respondido ao acaso dado que respondeu correctamente é np/(1 + (n 1)p). (b) Calcule a probabilidade de uma pessoa escolhida ao acaso não responder correctamente à questão, supondo n = 5 e p = 0.2. 21. Registos efectuados levaram a concluir que os motoristas que circulam em determinada estrada podem cometer dois e só dois tipos de transgressões ditas do tipo I e do tipo II, não se notando nenhum caso em que o motorista cometa ambas as transgressões. De entre 500 motoristas multados verificou-se serem 100 por transgressões do tipo I. Sabendo que 10% dos motoristas que cometem transgressões do tipo I são multados; que 1% cometem transgressões do tipo I e que 2% cometem transgressões do tipo II, calcule a probabilidade de que um motorista que circule nessa estrada e cometa uma transgressão do tipo II seja multado. 22. Um barco pesqueiro desapareceu e presume-se que o seu desaparecimento se deva a uma das três possíveis causas: C 1 - afundou-se quando experimentava um sofisticado sistema de pesca para o qual não estava minimamente apetrechado; C 2 - foi sequestrado por transportar um carregamento de material nuclear; C 3 - foi destruido por um temporal. 6

Três brigadas de busca e salvamento, B 1, B 2 e B 3 foram enviadas com a missão de procurar o barco, investigando cada uma delas uma das causas (i.e. a brigada B i investiga a causa C i ). Suponha que: i) as três causas do desaparecimento são igualmente prováveis; ii) a probabilidade da brigada B i ser bem sucedida quando de facto o barco desapareceu devido à causa C i é α i (α 1 = 0.1, α 2 = 0.7, α 3 = 0.8). Sabendo que a investigação da brigada B 2 resultou infrutífera, calcule a probabilidade: (a) Do barco ter sido sequestrado. (b) Do barco ter sido destruido por um temporal. Independência 23. Considere A e B tais que: P(A) = 1/4, P(B) = 1/3, P(A B) = 0. (a) Poderão ser A e B incompatíveis? (b) São A e B independentes? 24. A execução de um projecto de construção de um edifício no tempo programado está relacionada com os seguintes acontecimentos: E = escavação executada a tempo F = fundações executadas a tempo S = superestrutura executada a tempo supostos independentes e com probabilidades iguais a, respectivamente, 0.8, 0.7 e 0.9. Calcule a probabilidade de: (a) O edifício ser terminado no tempo previsto, devido ao cumprimento dos prazos nas três actividades referidas. (b) O prazo de execução ser cumprido para a escavação e não ser cumprido em pelo menos uma das outras actividades. 25. Um certo tipo de motor eléctrico quando avariado pode apresentar quatro tipos de falhas, denotadas por F 1, F 2, F 3 e F 4, cujas probabilidades de ocorrência são iguais. Seja A = {F 1,F 2 }, B = {F 1,F 3 }, C = {F 1,F 4 } e D = {F 2,F 3 }. (a) Mostre que os acontecimentos A, B e C são independentes aos pares. (b) Mostre que P(C A B) é diferente de P(C ). (c) Comente a afirmação: Como a ocorrência simultânea de C e D é impossível, C e D são necessariamente dependentes. 26. Considere o seguinte troço de um circuito eléctrico A 1 2 3 B 7

e designe por F i o acontecimento o interruptor i está fechado (i = 1,2,3). Suponha que F 1 e F 2 são independentes, com probabilidades iguais a 1/2 e que F 3 tem uma probabilidade condicional de 1/8 quando os interruptores 1 e 2 estão fechados e uma probabilidade condicional de 1/10 quando apenas o interruptor 1 está fechado. (a) Prove que F 1 e F 2 são independentes. (b) Calcule a probabilidade de o interruptor 2 estar fechado dado que há corrente entre os terminais A e B. Exercícios Variados 27. Para um certo tipo de cancro a taxa de prevalência (proporção de doentes na população em geral) é 0.005. Um teste diagnóstico para esta doença é tal que: a probabilidade do teste resultar positivo quando aplicado a um indivíduo com cancro (sensibilidade do teste) é 0.99; a probabilidade do teste resultar negativo quando o indivíduo não tem cancro (especificidade do teste) é 0.95. (a) Calcule o valor preditivo do teste, isto é, a probabilidade de um indivíduo ter cancro sabendo que o teste resultou positivo. (b) Supondo que o teste foi aplicado duas vezes consecutivas ao mesmo doente e que das duas vezes o resultado foi positivo, calcule a probabilidade do doente ter cancro (admita que, dado o estado do indivíduo, os resultados do teste em sucessivas aplicações, em qualquer indivíduo, são independentes). 8

Capítulo 2 Variáveis aleatórias discretas Funções de probabilidade e distribuição; momentos e outros parâmetros 1. Considere a variável aleatória discreta X com a seguinte função de probabilidade: { ax 2, x = 2, 1,0,1,2 P(X = x) = 0 caso contrário, a R. (a) Determine a e desenhe o gráfico da função. (b) Determine a função de distribuição de X e represente-a graficamente. (c) Determine a moda, a (classe) mediana, os quartis e o valor esperado de X. (d) Calcule, caso existam, a variância, o devio padrão e o coeficiente de variação de X. 2. Considere a variável aleatória discreta X com a seguinte função de probabilidade: { cx, x = 1,2,3 P(X = x) = 0, caso contrário sendo c uma constante real. (a) Determine c e desenhe o gráfico da função. (b) Determine a função de distribuição de X e represente-a graficamente. (c) Determine a moda, a (classe) mediana e o valor esperado de X. (d) Calcule, caso existam, a variância, o devio padrão e o coeficiente de variação de X. 3. Considere a variável aleatória discreta X com a seguinte função de distribuição: F X (x) = P(X x) = 0, x < 0 1/6,0 x < 2 1/4,2 x < 4 1/2,4 x < 6 1, x 6. (a) Determine a função de probabilidade de X. (b) Calcule: i. P(X 1). ii. P(X > 5). iii. P(0 < X 2). iv. P(2 X < 6). v. P(0 X 2). vi. P(2 < X < 6). 9

4. Seja X uma variável aleatória discreta X com a seguinte função de probabilidade: P(X = x) = (a) Determine o valor de c. (1 + 3c)/4, x = 1 (1 c)/4, x = 2 (1 + 2c)/4, x = 3 (1 4c)/4, x = 4 0, x 1,2,3,4 (b) Calcule o valor esperado e a variância de X. Uniforme Discreta 5. Considere a variável aleatória discreta X cujos resultados possíveis {1,2,3,4} são equiprováveis. (a) Determine a função de distribuição de X e represente-a graficamente. (b) Calcule a moda, o valor esperado, a mediana, os quartis e a variância de X. 6. Considere a variável aleatória discreta X cujos resultados possíveis {1,2,3,4,5} são equiprováveis. (a) Determine a função de distribuição de X. (b) Calcule a moda, o valor esperado, a mediana, os quartis e a variância de X. Bernoulli 7. Considere a variável aleatória discreta X com a seguinte função de probabilidade: { 1 p, x = 0, P(X = x) = p, x = 1, p [0,1] (por exemplo com X = 0 a representar insucesso e X = 1 a representar sucesso com probabilidade p). (a) Determine a função de distribuição de X. (b) Calcule a moda, a mediana, o valor esperado, a variância e o coeficiente de variação de X. Interprete estes parâmetros consoante o valor de p. Hipergeométrica, Binomial e Geométrica 8. Uma caixa contêm 5 lápis dos quais 2 estão partidos. Pretende-se avaliar o número de lápis partidos e, retiram-se ao acaso e sem reposição 3 lápis da caixa. (a) Determine: i. o espaço de resultados associado à experiência aleatória. ii. a probabilidade de obter quando muito um lápis partido? iii. se nas 3 extracções apenas houve um lápis partido, qual a probabilidade de ter sido o segundo? (b) Seja X a v.a. que representa o número de lápis partidos nas 3 extracções. i. Caracterize a v.a., determine a sua função de probabilidade e represente-a graficamente. ii. Obtenha a função de distribuição cumulativa de X e represente-a graficamente. (c) Responda novamente às alíneas (a) e (b), admitindo que as 3 extracções são feitas com reposição. 9. Numa sala existem três lâmpadas "iguais", que funcionam independentemente. A probabilidade de cada lâmpada fundir num dado espaço de tempo é 0.1. Seja X a v.a. que representa o número de lâmpadas que findo esse período de tempo estão a funcionar. Determine: 10

(a) A função de probabilidade de X. (b) A função de distribuição de X. (c) O valor esperado, moda, mediana e variância de X. 10. No final de uma visita a um parque, os visitantes são convidados a indicar os percursos feitos. Em 30 respostas 20 mencionaram ter completado apenas o percurso A. (a) Escolhidos ao acaso e sem reposição 2 dessas 30 respostas, qual é a probabilidade de pelo menos uma referir ter feito apenas o percurso A? (b) Responda à questão anterior admitindo que a escolha é feita com reposição. 11. Um atirador acerta num alvo com probabilidade 1/3 e considere os sucessivos tiros independentes. (a) Qual a probabilidade de ele acertar ao fim do 3º tiro? (b) Quantos tiros são necessários em média para acertar no alvo? 12. Num armazém encontra-se um lote de 5000 janelas para serem distribuídas mas, 100 destas têm defeito. (a) É efectuada uma inspecção sobre uma amostra de 10 janelas escolhidas ao acaso sem reposição. A inspecção rejeita o lote se forem encontradas mais do que uma janela com defeito nessa amostra. i. Caracterize a v.a. ii. Qual a probabilidade de rejeição do lote? iii. Qual o número esperado de janelas defeituosas? (b) Responda às alíneas anteriores admitindo as extracções com reposição. Compare com os resultados anteriores. (c) Suponha que as janelas são inspeccionadas sucessivamente e com reposição até ser encontrada uma defeituosa. i. Qual a probabilidade de ser necessario inspeccionar 3 ou mais janelas? ii. Qual o número esperado de janelas inspeccionadas? 13. Num lote de 500 interruptores existem 50 defeituosos. Desse lote retiram-se ao acaso e com reposição uma amostra. O lote é rejeitado se tal amostra incluir mais do que dois interruptores defeituosos. Calcule: (a) A probabilidade de rejeição do lote se a amostra tiver dimensão 10. (b) A dimensão que a amostra deve ter para que a probabilidade de rejeição seja inferior a 0.05. 14. 2000 pessoas de entre as 60000 que constituem a população de uma cidade estão a assistir a um programa de televisão. Escreva a expressão que lhe permitiria calcular a probabilidade exacta de que, entre 250 pessoas seleccionadas ao acaso e sem reposição da população da cidade, menos de 5 estejam a ver esse programa. Poisson 15. O número de partículas emitidas por uma fonte radioactiva, num dado período de tempo, é uma variável aleatória com distribuição de Poisson. Sabendo que a probabilidade de não ser emitida qualquer partícula nesse período de tempo é 1/3: (a) Calcule a probabilidade de que nesse período de tempo a fonte emita pelo menos 2 partículas. (b) Determine o valor esperado do número de partículas emitidas pela fonte radioactiva durante esse período de tempo. 11

Exercícios Variados 16. Uma máquina electrónica de venda de chocolates e bebidas dá um lucro de 12 dezenas de euros por semana se não tiver avarias durante a semana. Se a máquina tiver x (x 1) avarias durante a semana o custo da reparação é de (x + 1) 2 dezenas de euros. Suponha que o número de avarias numa semana, X, é uma variável aleatória de Poisson de parâmetro λ = 3/2. (a) Calcule a probabilidade de numa semana - não haver avarias. - haver uma avaria, sabendo que de facto ocorreram avarias nessa semana. (b) Determine, em dezenas de euros, o lucro esperado por semana. 17. Considere uma variável aleatória Poisson para descrever o número de visitantes não-residentes ao Jardim Guerra Junqueiro durante as 10h-11h num dia de semana, e que a probabilidade de não encontrar visitantes não-residentes neste horário é de 0.0003. (a) Calcule a probabilidade de observar no máximo 4 visitantes não-residentes durante aquele horário. (b) Qual a probabilidade de num total de 5 dias úteis, em pelo menos 1 destes observar-se no máximo 4 visitantes não-residentes durante aquele horário, supondo independência entre número de chegadas nos sucessivos dias. 18. Indique uma expressão que lhe permita calcular a probabilidade exacta de que pelo menos 2 pessoas de um grupo de 500 façam anos no dia de Natal (considere o ano com 365 dias). Obtenha um valor aproximado para esta probabilidade com base na distribuição de Poisson. 12

Capítulo 3 Variáveis aleatórias contínuas Funções densidade de probabilidade e distribuição; momentos e outros parâmetros 1. A procura diária de arroz num supermercado, em centenas de quilos, é uma variável aleatória com função densidade de probabilidade: (2x)/3, 0 x < 1 f X (x) = x/3 + 1, 1 x 3 0, restantes valores de x (a) Qual a probabilidade da procura exceder 150 Kg de arroz num dia escolhido ao acaso? (b) Calcule o valor esperado da procura diária de arroz, assim como uma medida da variabilidade dessa procura. (c) Qual a quantidade de arroz que deve ser deixada diariamente à disposição do público para que não falte arroz em 95% dos dias? Uniforme Contínua 2. Considere uma variável aleatória a tomar valores no intervalo [0,1] todos igualmente prováveis. (a) Indique o espaço de resultados associado e a função densidade de probabilidade e, represente-a graficamente. (b) Determine a função de distribuição de X e represente-a graficamente. (c) Calcule a mediana, o valor esperado e a variância de X. (d) Repita as alíneas anteriores considerando os intervalos [0,1/2] e [0,2]. Exponencial 3. Uma componente electrónica tem uma duração de vida, em centenas de horas, que é uma variável aleatória com distribuição exponencial de valor esperado 0.5. (a) Calcule a função de distribuição da variável aleatória X. (b) Calcule a probabilidade de que a componente electrónica tenha uma duração de vida superior a 150h, sabendo que já funcionou pelo menos durante 100 h. (c) Obtenha uma expressão para o quantil de probabilidade p, χ p, e indique a mediana e o 1º quartil. 4. O tempo que um doente tem de esperar até ser atendido, em horas, tem distribuição exponencial com valor esperado igual a 0.20. (a) Qual a probabilidade de ele ter de esperar mais de 30 minutos? (b) Sabendo que um doente já esperou mais de 30 minutos, qual é a probabilidade de ainda ter de esperar pelo menos mais 15 minutos? 13

Normal ou Gaussiana 5. O comprimento das peças produzidas por uma máquina é uma variável aleatória normal com valor esperado µ (mm) e variância σ 2 (mm 2 ). Uma peça é defeituosa se o seu comprimento diferir do valor esperado mais do que σ. Sabe-se que 50% das peças produzidas têm comprimento inferior a 2.5 mm e 47.5% das peças produzidas têm comprimento entre 2.5 mm e 3.42 mm. (a) Calcule µ e σ. (b) Determine a probabilidade de que uma peça seja não defeituosa. 6. O tempo de vida de um laser tem distribuição normal com média igual a 7000 horas e desvio padrão igual a 600 horas. (a) Qual é a probabilidade de um desses lasers falhar até 5300 horas? (b) Qual é a duração que 90% desses lasers excede? (c) Um produto inclui três lasers e falha se algum deles falhar. Se os tempos de vida dos três lasers forem independentes, qual é a probabilidade desse produto durar mais do que 7000 horas? Exercícios Variados 7. Uma empresa vende peças cuja duração em centenas de horas é uma variável aleatória contínua com a seguinte função de distribuição: { 1 e λx, x > 0 F X (x) = 0, caso contrário (a) Determine a função de densidade de probabilidade de X, a sua média, mediana, 1º e 3º quartis e, a sua variância. (b) A empresa dispõe de um stock de peças dos tipos A e B. Ao tipo A está associado um parâmetro λ = 1/2 e ao tipo B um parâmetro λ = 1. i. Compare o desempenho das peças dos stocks A e B através dos parâmetros obtidos em (a). ii. De um lote formado por 100 peças do tipo A e 50 peças do tipo B, retirou-se ao acaso uma peça, cuja duração foi ensaiada. Em relação ao resultado desse ensaio sabe-se apenas que a duração da peça foi inferior a 90h. Calcule a probabilidade de que a peça escolhida seja do tipo B. 8. Seja X uma variável aleatória com distribuição normal de valor esperado 10 e variância 4, que representa o comprimento de uma barra de ferro. Suponha que a barra é considerada não defeituosa se 8 X 12 e defeituosa caso contrário. (a) Qual a probabilidade de que uma barra seja não defeituosa? (b) Qual a probabilidade de que, em 10 barras escolhidas ao acaso e com reposição do fabrico diário, pelo menos 2 sejam defeituosas? 9. Suponha que o desvio da medida das peças produzidas por uma máquina em relação à norma especificada pelo mercado é uma variável aleatória X com a seguinte função de densidade de probabilidade: f X (x) = (a) Calcule o valor de k. 1 + k + x, 1 x < 0 1 + k x, 0 x 1 0, restantes valores de x (b) Determine a função de distribuição de X. (c) Calcule o valor esperado e a variância de X. 14

(d) Calcule a moda, a mediana e o 1 o quartil de X. (e) Calcule a probabilidade de que seja necessário extrair exactamente duas peças da produção da máquina para que apareça uma peça com um desvio positivo em relação à norma. 10. Seja Y = 100 X a variavel aleatória que representa a percentagem de álcool num certo composto, onde X é uma variável aleatória com a seguinte função de densidade de probabilidade: { 20 x 3 (1 x), 0 < x < 1 f X (x) = 0, caso contrário (a) Determine a função de distribuição de X e esboce o seu gráfico. (b) Calcule a probabilidade de X ser inferior a 2/3. (c) Suponha que o preço de venda do composto depende do conteúdo em álcool: se 1/3 < X < 2/3 o preço é de C 1 euros por litro; caso contrário o preço é de C 2 euros por litro. Supondo o custo de produção igual a C 3 euros por litro: i. Calcule a função de distribuição do lucro líquido por litro. ii. Determine o valor esperado do lucro líquido por litro. 11. Uma certa liga metálica contém uma percentagem de chumbo X, que pode ser considerada como uma variável aleatória com função de densidade de probabilidade dada por { 3 f X (x) = 5 10 5 x(100 x), 0 x 100 0, caso contrário Suponha que L, o lucro líquido obtido na venda desta liga (por unidade de peso), depende da percentagem de chumbo através da relação: L = C 1 +C 2 X Calcule o valor esperado do lucro líquido por unidade de peso. 15

Capítulo 4 Vectores aleatórios, combinações lineares e TLC Pares aleatórios discretos 1. Uma loja de decoração vende candeeiros da marca X e da marca Y. A função de probabilidade conjunta do número de candeeiros vendidos diariamente é a seguinte: Y \X 0 1 2 0 0.12 0.25 0.13 1 0.05 0.30 0.01 2 0.03 0.10 0.01 (a) Calcule as funções de probabilidade marginais de X e de Y. (b) Calcule a função de distribuição marginal de X. (c) Calcule a probabilidade de que num dia a marca Y seja mais vendida do que a marca X. (d) Determine o valor esperado do número total de candeeiros vendidos diariamente. (e) As funções de probabilidade e distribuição de X condicionais a Y = 0, Y = 1 e Y = 2. (f) Calcule E(X Y = 0), V ar (X Y = 0) e a mediana de (X Y = 0). (g) Diga, justificando, se X e Y são variáveis aleatórias independentes. (h) Determine a variância do número total de televisores vendidos diariamente. (i) Calcule o coeficiente de correlação entre X e Y e interprete o seu resultado. 2. Considere o par aleatório discreto (X,Y ) com função de probabilidade conjunta dada por (Y = X 2 ): Y \X -1 0 1 0 0 1/3 0 1 1/3 0 1/3 (a) Diga, justificando, se X e Y são variáveis aleatórias independentes. (b) Calcule C ov(x, Y ) e comente o resultado. 3. Sejam X e Y duas variáveis aleatórias discretas com função de probabilidade conjunta dada por: (a) Determine: Y \X 1 2 3 1 1/9 0 1/18 2 0 1/3 1/9 3 1/9 1/6 1/9 16

i. A função de probabilidade marginal de X. ii. A função de distribuição marginal de Y. iii. P(X + Y 4). iv. As funções de probabilidade de X condicionais a Y = 1 e Y = 3. v. E(X Y = 1). (b) Defina E(X Y ). (c) Obtenha: i. V (X Y = 1). ii. P(X Y ser par). iii. P(Y = 2 X Y 4). iv. F Y X =3 (y). (d) Diga, justificando, se X e Y são variáveis aleatórias independentes. 4. Durante um treino de basquetebol um jogador efectua três lançamentos da linha de lançamento livre. A probabilidade que ele tem de encestar em cada lançamento é de 0.6 e os lançamentos podem ser considerados independentes. (a) Descreva o espaço de resultados. (b) Seja X a variável aleatória que representa o número de vezes que o jogador encesta nos dois primeiros lançamentos e Y a variável aleatória que representa o número de vezes que o jogador encesta nos dois últimos lançamentos. i) Determine a função de probabilidade conjunta do par aleatório (X,Y ). ii) Determine as funções de probabilidade marginais de X e de Y. Combinações Lineares de v.a. s 5. O diâmetro interior de um tubo cilíndrico é uma variável aleatória X com distribuição normal de valor esperado 3 cm e desvio padrão 0.02 cm e a espessura Y do mesmo tubo é uma variável com distribuição normal de valor esperado 0.3 cm e desvio padrão 0.005 cm, independente de X. (a) Calcule o valor esperado e o desvio padrão do diâmetro exterior do tubo. (b) Calcule a probabilidade de que o diâmetro exterior do tubo exceda 3.62 cm. 6. Um posto de transformação permite uma carga total de 2800KW. Sabe-se que esse posto de transformação alimenta uma fábrica com consumo permanente de 2500KW e além disso o mesmo posto de transformação alimenta 100 consumidores domésticos. Estes gastam em média 2KW em electrodomésticos (sendo o desvio padrão igual a 0.5KW) e 0.5KW com a iluminação (sendo o desvio padrão de 0.25KW). Determine a probabilidade do transformador disparar por excesso de carga, admitindo que os vários tipo de consumos domésticos são independentes e normalmente distribuídos. Teorema do Limite Central (TLC) 7. Um elevador de acesso a um grupo de galerias de uma mina tem capacidade nominal de 3800kg. Os mineiros que usam regularmente o elevador têm pesos que seguem uma distribuição com valor esperado 75kg e desvio padrão 8kg. Calcule aproximadamente a probabilidade de ser excedida a capacidade nominal do elevador quando nele se encontrarem 50 mineiros. 8. Um estudante decidiu amealhar diariamente uma pequena quantia para comprar uma bicicleta. As probabilidades do estudante amealhar 50, 100 e 250 cêntimos em cada dia são respectivamente 0.3, 0.6 e 0.1. Calcule, justificando, a probabilidade do estudante amealhar mais do que 350 euros durante o ano (365 dias). 17

Aproximação da Binomial à Normal 9. Um atirador acerta num alvo com probabilidade 1/3. Numa sequência de 30 tiros independentes calcule: (a) a probabilidade do atirador acertar pelo menos 1 vez no alvo. (b) a probabilidade aproximada de o atirador acertar pelo menos 15 vezes no alvo usando a aproximação à normal. Calcule o valor exacto e compare-o com o aproximado. Aproximação da Poisson à Normal 10. O número de itens dum certo tipo procurados num armazém durante uma semana segue uma distribuição de Poisson com λ = 50. Calcule a dimensão mínima do stock a adquirir de modo a que a probabilidade de satisfazer a procura seja de 98% (use a aproximação à normal). Processo de Poisson 11. O número de mensagens electrónicas recebidas por dia (24h) numa pequena empresa de entregas rápidas tem distribuição de Poisson com média igual a 10. (a) Calcule a probabilidade de num dia a empresa não receber mais do que 7 mensagens. (b) Qual é a probabilidade do intervalo entre duas mensagens consecutivas exceder 1 hora? 12. Um processo de fabrico de placas de vidro produz, em média, 4 bolhas de ar espalhadas aleatoriamente por 10 m 2 de placa. Sabendo que a distribuição do número de bolhas de ar pode ser modelada por uma distribuição de Poisson, calcule a probabilidade de: (a) Uma placa de 2.5m 2m ter mais de 2 bolhas de ar. (b) Obter, num lote de 10 placas de vidro com 1m 2.5m, 6 placas perfeitas. Exercícios Variados 13. O tempo de produção de uma certa peça de porcelana é uma variável aleatória com distribuição exponencial de valor esperado 2 horas. (a) Qual a probabilidade duma peça levar pelo menos 1h 45m a ser produzida? (b) Verificando-se que em certo momento uma peça já está a ser produzida há 45m, qual a probabilidade de ser necessário esperar pelo menos mais 1h 45m para concluir a peça? Compare este resultado com o da alínea (a) e comente. (c) Num dia em que a fábrica não tinha qualquer peça em stock foi aceite uma encomenda de 100 peças, tendo a fábrica assumido o compromisso de fornecer as peças no prazo máximo de 30 dias (o que corresponde a 240 horas de trabalho). Acha que a fábrica tem boas possibilidades de cumprir o seu compromisso? Justifique. (d) A fábrica mantém os registos do tempo de execução de cada peça. Seis peças foram escolhidas ao acaso. Qual a probabilidade de 4 delas terem sido executadas no máximo em 1h 45m cada uma? 14. O número de chegadas ao MAAT durante a primeira hora de abertura tem distribuição de Poisson de média 6 num dia de semana e média 10 ao fim de semana. Considere as chegadas de dia para dia independentes. (a) Qual a probabilidade de ocorrerem pelo menos 9 chegadas na primeira hora num dia de semana? (b) Qual o número esperado e a variância do total de chegadas numa semana (7 dias) durante a primeira hora? 18

(c) Em cada dia da semana, se na primeira hora ocorrem 9 ou mais entradas, serão redirecionados 2 vigilantes de outros serviços. Qual a probabilidade de: i. Em 10 dias úteis, ter de se redirecionar 2 vigilantes em mais de 4 dias? ii. E em 100 dias úteis? (d) O tempo total despendido no MAAT tem distribuição normal com duração média de 1 hora e sabese que 30% dos visitantes despende no máximo 40 minutos no museu. Qual a probabilidade da duração total de uma visita ser superior a 2 horas? 15. Um dos elevadores dum grande edifício público transporta, no máximo, 20 pessoas de cada vez. A carga máxima transportada pelo elevador é de 1300 Kg. Os utilizadores deste elevador pertencem a um largo estrato duma população em que se verificou que o peso duma pessoa é aproximadamente normal com valor esperado 61 Kg e desvio padrão 10 Kg. (a) Calcule a probabilidade do peso destes 20 utilizadores exceder a carga máxima. (b) Sabendo que estão 15 pessoas no elevador com um peso de 950 Kg e que se espera a entrada de mais 5 pessoas para completar a lotação e iniciar a viagem, determine a probabilidade do peso total destes 20 passageiros exceder a carga máxima. (c) Qual a probabilidade de haver nas 20 pessoas, que em certo momento viajam no elevador, i. quando muito 2 com peso superior a 85 Kg? ii. pelo menos 1 com peso inferior a 40 Kg? (d) Acha que, em face do tipo de população que utiliza o elevador, a carga máxima indicada é adequada? Explique a sua opinião. 16. O tempo (em horas) que João Pestana dorme por noite é uma variável aleatória com distribuição uniforme no intervalo (7,12). (a) Calcule a probabilidade de João Pestana dormir mais de 11 horas numa noite. (b) Calcule a probabilidade de, em 20 noites, João Pestana dormir mais de 11 horas em pelo menos 3 dessas noites. (c) Qual a probabilidade de João Pestana dormir mais de 1100 horas em 100 noites? 17. Um doente é acompanhado regularmente por um médico numa determinada clínica com vários gabinetes. (a) Se a probabilidade de o médico o atender no gabinete A for 0.8, qual é a probabilidade de em 20 consultas pelo menos 10 serem nesse gabinete? (b) O número de consultas anuais desse doente tem distribuição de Poisson com valor esperado igual a 3. Qual é a probabilidade de num ano ele ter necessidade de mais 8 consultas? (c) Ao longo dos últimos anos esse doente foi visto 50 vezes. Se a duração, em minutos, de cada consulta tiver valor esperado igual a 30 e variância igual a 100 e for independente de consulta para consulta, qual é aproximadamente a probabilidade de a duraccão total das 50 consultas exceder 27 horas? 18. O intervalo de tempo, em minutos, entre a passagem de dois comboios numa estação de metropolitano tem, em horas de ponta, distribuição uniforme no intervalo de (5,15). (a) Determine a probabilidade de se ter de esperar mais de 8 minutos entre dois comboios. (b) Sabendo que o último comboio passou há oito minutos, qual é a probabilidade de se ter de esperar pelo menos mais cinco minutos pelo próximo comboio? (c) Admitindo que os intervalos de tempo entre passagens sucessivas dos comboios são variáveis aleatórias independentes, calcule um valor aproximado para a probabilidade da média dos intervalos de tempo entre 100 passagens exceder 9 minutos. 19

Capítulo 5 Estimação Pontual 1. Seja (X 1, X 2, X 3 ) uma amostra aleatória de dimensão 3 extraída de uma população com valor esperado µ e variância σ 2 e, sejam X = (X 1 + X 2 + X 3 )/3 e ˆµ = (X 1 + 2X 2 + X 3 )/4 dois estimadores para µ. (a) Verifique se algum dos estimadores é centrado. (b) Obtenha as suas variâncias. (c) Qual a eficiência de ˆµ relativamente a X? (d) Suponha que se observaram os valores (0.4, 0.3, 0.5). Qual dos estimadores escolheria para estimar a média populacional e obtenha uma estimativa com base na amostra dada. (e) Indique um estimador centrado para a variância populacional e obtenha uma estimativa com base na amostra dada na alínea anterior. 2. T 1 e T 2 são estimadores de um parâmetro θ, tais que: E(T 1 ) = θ, V (T 1 ) = 9; E(T 2 ) = 3θ, V (T 2 ) = 3. Diga, justificando, qual destes estimadores é melhor estimador de θ. 3. Seja X 1, a média de uma amostra aleatória de dimensão n extraída de uma população normal de valor esperado µ e variância σ 2 1 e X 2 a média de uma amostra aleatória de dimensão n, independente da primeira, extraída de uma população normal de valor esperado µ e variância σ 2 2. Mostre que: (a) ˆµ = w X 1 + (1 w)x 2 ], em que 0 w 1, é um estimador centrado de µ. (b) A variância de ˆµ é mínima quando w = σ2 2 σ 2 1 +. σ2 2 (c) Qual o Erro Quadrático Médio de ˆµ? (d) Qual a eficiência de X 1 relativamente a ˆµ? Comente o resultado. (e) Obtenha uma estimativa para µ com base nas amostras (2,4,1,3) retirada da população X 1 e (2,5,1,4) retirada da população X 2. 4. (a) Mostre que se ˆθ é um estimador centrado do parâmetro θ e V ( ˆθ) > 0 então ( ˆθ) 2 não é um estimador centrado de θ 2. (b) Se ˆθ é um estimador de θ, o seu enviesamento é dado por b = [E( ˆθ) θ]. Mostre que E[( ˆθ θ) 2 ] = V( ˆθ) + b 2. 5. Seja (X 1,..., X n ) uma amostra aleatória proveniente de uma população com variância σ 2. Prove que n S 2 (X i X ) 2 n X 2 i = = n 1 n 1 n n 1 X 2 i=1 i=1 é um estimador centrado para σ 2. 20

6. Considere uma população X, com função densidade de probabilidade contínua f (x) e valor desconhecido da mediana, me. A mediana da amostra aleatória X é um estimador centrado de me e o seu desvio padrão é aproximadamente [2 n f (me)] 1. Calcule a eficiência relativa da média da amostra aleatória X em relação à mediana da amostra aleatória X, como estimadores do parâmetro µ, (a) para o caso duma população normal com valor esperado µ e desvio padrão σ. (b) para o caso da variável aleatória cuja função densidade de probabilidade é: f (x) = 1 2σ e 2 x µ σ em que µ e σ representam, respectivamente, o valor esperado e o desvio padrão. (c) O que pode concluir, na sequência dos resultados obtidos em (a) e (b)? 21

Capítulo 6 Intervalos de Confiança 1. Medições do comprimento de 25 peças produzidas por uma máquina conduziram a uma média x = 140 mm. Admita que cada peça tem comprimento aleatório com distribuição normal de valor esperado µ e desvio padrão σ = 10 mm, e que o comprimento de cada peça é independente das restantes. Construa intervalos de confiança a 95%, 99% e 90% para o valor esperado da população e compare os intervalos. 2. Admita que a densidade de construção, X, num projecto de urbanização tem distribuição normal. Uma amostra aleatória de 50 lotes desse projecto conduziu a 50 i=1 x i = 227.2 ; 50 i=1 x 2 i = 2242.6 Assumindo que o desvio padrão de X é igual a 4, construa um intervalo de confiança a 95% para a densidade média de construção. Que dimensão deveria ter a amostra para que a amplitude desse intervalo fosse reduzida a metade? 3. Foram efectuados estudos em Los Angeles com o objectivo de determinar a concentração de monóxido de carbono perto de vias rápidas. Para isso recolheram-se amostras de ar, para as quais se determinou a respectiva concentração (usando um espectrómetro). Os resultados das medições em ppm (partes por milhão) foram os seguintes (para um período de um ano): 102.2 98.4 104.1 101.0 102.2 100.4 98.6 88.2 78.8 83.0 84.7 94.8 105.1 106.2 111.2 108.3 105.2 103.2 99.0 98.8 Determine um intervalo de confiança a 95% para a concentração esperada de monóxido de carbono, assim como para a sua variância. Indique as hipóteses consideradas. 4. Suponha que a intensidade da corrente, em amperes, num certo circuito é uma variável aleatória com distribuição normal. Uma amostra de dimensão 12 desta variável aleatória conduziu aos seguintes resultados: 2.3 1.9 2.1 2.8 2.3 3.6 1.4 1.8 2.1 3.2 2.0 1.9 Construa um intervalo de confiança a 99% para: (a) O valor esperado da intensidade da corrente. (b) O desvio padrão da intensidade da corrente. 5. De modo a estudar a média do tempo despendido semanalmente, por família, a ver TV numa grande cidade do sul dos EUA, um sociólogo recolheu uma amostra de 500 famílias. Tal amostra conduziu a uma média de 28.4 h/semana e um desvio padrão corrigido (s) de 8.3 h/semana. Calcule um IC a 95% para o valor esperado. 22

6. Um engenheiro civil, tencionando comparar a resistência a forças compressivas de dois tipos de betão, seleccionou aleatoriamente 10 elementos de cada tipo de betão e registou as seguintes medições. Tipo I 3250 3268 4302 3184 3266 3297 3332 3502 3064 3116 Tipo II 3094 3268 4302 3184 3266 3124 3316 3212 3380 3018 Se se assumir que as amostras provêm de populações normais independentes com desvio padrão igual a 353 e 133, respectivamente, determine um intervalo de confiança a 95% para a diferença entre os valores esperados das duas populações. 7. Para comparar a eficiência de dois métodos de ensino, uma turma de 24 alunos foi dividida aleatoriamente em dois grupos. Cada grupo é ensinado de acordo com um método diferente. Os resultados no fim de semestre, numa escala de 0 a 100, são os seguintes: 1 o grupo n 1 = 13 x 1 = 74.5 s1 2 = 82.6 2 o grupo n 2 = 11 x 2 = 71.8 s2 2 = 112.6 Assumindo que as populações são normais e com variâncias iguais e desconhecidas obtenha um intervalo de confiança a 95% para a diferença entre os valores esperados das duas populações. 8. Para estimar a diferença de tempos esperados de vida entre fumadores e não fumadores, numa grande cidade dos E.U.A., foram recolhidos duas amostras independentes de, respectivamente, 36 não fumadores e 44 fumadores tendo-se obtido os seguintes resultados: Dimensão Média Desvio padrão corrigido Não fumadores 36 72 9 Fumadores 44 62 11 Calcule um intervalo de confiança a 90% para a diferença dos valores esperados dos tempos de vida. 9. Uma amostra de 100 peças de uma linha de produção revelou 17 peças defeituosas. (a) Determine um intervalo de confiança a 95% para a verdadeira proporção p de peças defeituosas produzidas. (b) Quantas peças adicionais devemos recolher para estarmos confiantes a 95% que o erro de estimação de p seja menor que 2%? (c) Responda à alínea anterior mas com uma confiança de 98%. Compare os resultados. 10. Num trabalho realizado há já algum tempo concluiu-se que 62% dos passageiros que entram na estação A do metro tem como destino o centro da cidade. Esse valor tem vindo a ser utilizado em todos os estudos de transportes realizados deste então. O Engenheiro Vivaço começou a ter dúvidas sobre a actualidade daquele valor, acreditando que ele tem vindo a diminuir, acompanhando o declínio do centro. Resolveu, portanto, realizar um inquérito na estação A, tendo sido inquiridos 240 passageiros dos quais 126 indicaram o centro como destino. (a) Com base nestes resultados construa um intervalo de confiança a 90% para a percentagem de passageiros entrados em A e que saiem no centro, e interprete-o, admitindo que tem como interlocutor um leigo em Estatística. (b) Quantos passageiros deveriam ser inquiridos caso se pretendesse estimar aquela percentagem com margem de erro não superior a 2% e com um grau de confiança de pelo menos 90%? 11. A capacidade (em amperes-hora) de um tipo de bateria varia segundo uma distribuição normal. Selecionadas aleatoriamente 10 baterias registaram-se as seguintes capacidades: 23

140 136 150 144 148 152 138 141 143 151 (a) Construa intervalos de confiança a 99% para o valor esperado e o desvio padrão da capacidade de uma bateria. (b) Qual o número aproximado de baterias que deveriam ser seleccionadas se se quiser estimar o valor esperado da capacidade com uma confiança de pelo menos 99% dentro de uma margem de erro ± 1.5 amperes-hora? 12. Considere uma população X com distribuição exponencial com valor esperado α 1, α > 0, isto é, com função densidade de probabilidade { αe αx, x > 0 f (x) = 0, x 0 Observada uma amostra de dimensão 100 obteve-se x = 2.5. Deduza, com base nesta amostra, um intervalo de confiança a 95% para o parâmetro α. 24

Capítulo 7 Testes de Hipóteses Testes para µ, µ 1 µ 2 e σ 2 1. Uma máquina de ensacar açúcar está regulada para encher sacos de 16 quilos. Para controlar o funcionamento escolheram-se ao acaso 15 sacos da produção de determinado período, tendo-se obtido os pesos seguintes: 16.1 15.8 15.9 16.1 15.8 16.2 16.0 15.9 16.0 15.7 15.8 15.7 16.0 16.0 15.8 Admitindo que o peso de cada saco possui distribuição normal: (a) Que conclusão pode tirar sobre a regulação da máquina? (b) Que evidência fornece a concretização de S 2 sobre a hipótese H 0 : σ 2 = 0.25? 2. Da produção diária de determinado fertilizante tiraram-se seis pequenas porções que se analisaram para calcular a percentagem de nitrogénio. Os resultados foram os seguintes: 6.2 5.7 5.8 5.8 6.1 5.9 Sabe-se, por experiência, que o processo de análise fornece valores com distribuição que se pode considerar normal com σ 2 = 0.25. (a) Suportam as observações a garantia de que a percentagem esperada de nitrogénio, µ, é igual a 6% ao nível de significância de 10%? (b) Responda à alínea anterior usando o valor p. 3. O departamento de segurança de uma fábrica quer saber se o tempo esperado que o empregado nocturno da segurança leva a dar uma volta à fábrica é de 30 minutos. Em 32 voltas a média do tempo foi de 30.7 minutos com um desvio padrão corrigido de s = 1.5 minutos. (a) Diga se, ao nível de significância de 1%, é de admitir a hipótese considerada. (b) Responda à alínea anterior usando o valor p. (c) Suponha agora que departamento de segurança quer saber se o tempo esperado que o empregado nocturno leva a dar uma volta à fábrica é no máximo de 30 minutos. Avalie novamente se, ao nível de significância de 1%, é de admitir a hipótese considerada. (d) Responda às alíneas anteriores supondo a população subjacente normal. 4. Seja X uma variável aleatória com distribuição normal de valor esperado µ e desvio padrão σ. A partir de uma amostra de dimensão 30 dessa variável obtiveram-se os seguintes resultados: 30 i=1 x i = 64.0 30 i=1 (x i x) 2 = 84.8 Teste ao nível de significância de 5% a hipótese H 0 : µ = 2.0 contra a hipótese alternativa H 1 : µ > 2.0. 25

5. A cotação na bolsa de uma dada empresa está sujeita a flutuações em torno de um valor médio (2500) relativamente estável. Admite-se que a cotação desta empresa pode ser considerada uma variável aleatória com distribuição aproximadamente normal. O valor que se admite para a variância é tal que há 95% de probabilidade de a cotação pertencer ao intervalo (2300,2700). (a) Observou-se durante 16 dias as cotações da empresa e obteve-se a média amostral de 2538 e um desvio padrão amostral corrigido de 91.5. Que conclusão pode tirar acerca da variabilidade da cotação dessa empresa? (b) E relativamente à média da cotação da empresa? 6. Para confrontar dois tipos de máquina de ceifar (segadeiras) um trigal foi dividido em secções longitudinais e cada duas secções adjacentes tratadas por cada uma das máquinas, sendo a indicação da máquina obtida lançando uma moeda ao ar. As produtividades foram as seguintes: Segadeira 1 8.0 8.4 8.0 6.4 8.6 7.7 7.7 5.6 6.2 Segadeira 2 5.6 7.4 7.3 6.4 7.5 6.1 6.6 6.0 5.5 Ao agricultor que experimenta as segadeiras interessa averiguar se a produtividade esperada das duas máquinas se pode considerar igual ou se existe diferença significativa que o leve a preferir uma delas. Responda a esta questão admitindo que as produtividades possuem distribuição normal com: (a) As variâncias conhecidas e iguais a 1.13 e 0.62, respectivamente. (b) As variâncias iguais com valor comum desconhecido. 7. Um fabricante de pneus pretende comparar, através de ensaios piloto, 2 métodos de produção dos pneus. Selecionados 10 e 8 pneus produzidos, respectivamente segundo o 1 o e 2 o métodos, resolve-se testá-los. Os pneus da 1 a amostra foram testados numa zona A, os da 2 a numa zona B, com as durações (em unidades de 100 km): Amostra 1 61.1 58.2 62.3 64 59.7 66.2 57.8 61.1 62 63.6 Amostra 2 62.2 56.6 66.4 56.2 57.4 58.4 57.6 65.4 Sabe-se de estudo anteriores que a duração de um pneu varia segundo uma distribuição normal, em que o valor esperado é eventualmente influenciável pelo método de produção, e cujo desvio padrão é susceptível de ser fortemente afectado pelas características da zona onde se procede a rodagem. (a) Será que se pode admitir que a duração esperada de um pneu do 1 o tipo não excede 6000 km? (b) Os dados são significativamente compatíveis com a conjectura do desvio padrão da duração de um pneu do 1 o tipo ser igual a 400 km? (c) Admita que as variâncias da duração dos dois tipos de pneus são iguais. Teste a hipótese de não haver uma diferença significativa na duração média dos dois tipos de pneus. 8. Dois grupos de 36 estudantes foram seleccionados ao acaso para participarem numa experiência que consiste em aprender o significado de palavras numa língua que não conhecem. Durante 30 minutos os estudantes tentaram aprender o maior número de palavras. No grupo I os estudantes trabalharam isoladamente. No grupo II os estudantes trabalharam aos pares procurando certificarse mutuamente que iam aprendendo as palavras. Em seguida foi efectuado um teste para determinar o número de palavras aprendidas por cada aluno, tendo-se obtido os seguintes resultados: Grupo I 24 14 16 17 18 23 14 15 15 17 18 16 17 19 20 21 20 19 19 18 16 25 18 20 22 16 16 15 25 22 16 20 20 19 25 18 Grupo II 21 22 25 21 20 18 20 17 16 14 17 15 18 23 17 19 15 23 19 20 16 22 15 18 16 16 22 21 17 19 15 18 23 20 20 18 26

Acha que o segundo método de aprendizagem pode considerar-se significativamente superior ao primeiro? Testes para p em Populações Bernoulli ou Binomial 9. Um laboratório lançou no mercado um novo medicamento para o tratamento de uma alergia, afirmando que a sua eficácia, num período de 8 horas, é de 90%. A sua aplicação a uma amostra de 200 indivíduos sofrendo de tal alergia revelou-se eficaz em 160 dos casos. Será a afirmação acima consistente com os dados obtidos? Indique o valor-p do teste efectuado. 10. Uma empresa fabricante de lâmpadas considera que a sua produção é eficaz se a probabilidade de se seleccionar ao acaso uma lâmpada não defeituosa for de pelo menos 90%. Para verificar a qualidade da produção das lâmpadas, foi efectuado um teste a 200 lâmpadas, tendo-se verificado que 24 tinham defeitos. A que conclusão deve chegar o estatístico da empresa? Justifique. 11. Um comerciante retalhista recebe carregamentos de roupa de homem normalmente com 10% de peças defeituosas. A fim de se certificar que a qualidade do produto não diminuiu, resolve verificar 100 peças, determinar a percentagem de peças defeituosas e conduzir um teste de hipóteses com nível de significância igual a 8%. Suponha que, nas peças verificadas, foram encontradas 12 defeituosas. O comerciante deve ou não rejeitar o carregamento? Testes do Qui-quadrado de Pearson 12. Numa experiência com tubos de vácuo foram observados os tempos de vida (em horas) de 100 tubos, tendo-se registado as seguintes frequências absolutas (Freq. Abs.): Intervalo ]0, 30] ]30, 60] ]60, 90] ]90, + [ Freq. Abs. 41 31 13 15 (a) Serão os dados consistentes com a hipótese de o tempo de vida de um tubo de vácuo ter distribuição exponenci al com valor esperado igual a 50 horas, a um nível de significância de 5%? (b) Qual o v al or p (aproximado) do teste da alínea anterior e interprete-o comparando os resultados. 13. Considerando os atrasos A, em minutos, face à hora marcada em 400 consultas escolhidas aleatoriamente, construiu-se a seguinte distribuição de frequências absolutas: Atraso [0, 15) [15, 30) [30, 45) 45 No. de consultas 240 100 40 20 Teste ao nível de significância de 5% a hipótese de A ter distribuição exponencial de valor esperado igual a 16. 14. Suponha que o departamento de defesa acredita que a distribuição de probabilidade do número de avarias, durante uma dada missão, ocorridas numa determinada zona do submarino Polaris segue uma distribuição de Poisson. Os dados relativos a 500 destas missões são os seguintes: número de falhas por missão 0 1 2 3 4 ou mais número de missões 185 180 95 30 10 (a) Teste ao nível de significância de 5% a hipótese da referida variável aleatória possuir uma distribuição de Poisson, com valor esperado igual a 1. (b) Uma estimativa do valor esperado avaliada numericamente com base na amostra agrupada é igual a 0.9845. Será que o modelo de Poisson é uma boa escolha para descrever o conjunto de dados? 27

15. A altura, em metros, dos indivíduos de determinada população é uma variável aleatória X. Escolhidos aleatoriamente 100 desses indivíduos e medidas as suas alturas obtiveram-se os seguintes resultados: Classes F 0 i [1.595, 1.625[ 5 [1.625, 1.655[ 18 [1.655, 1.685[ 42 [1.685, 1.715[ 27 [1.715, 1.745[ 8 (a) Teste o ajustamento da distribuição normal com valor esperado 1.675 e variância 0.029 2. Exercícios variados 16. O número C de consultas diárias na clínica tem distribuição de Poisson. Sabendo que em 100 dias escolhidos ao acaso foram feitas 2800 consultas: (a) Determine um intervalo de confiança bilateral aproximado a 99% para o valor esperado de C. (b) Teste a hipótese valor esperado de C ser igual a 27. Decida com base no valor p do teste. 17. Numa empresa recolheu-se uma amostra relativa à produção de energia eléctrica em kw /h de dois tipos de geradores. Admita que a distribuição de energia segue uma distribuição normal e que aos dois tipos de geradores está associado uma variância igual. Os resultados obtidos foram os seguintes: Gerador tipo I 15.01 3.81 2.74 16.82 14.30 13.45 8.75 (n = 27) 9.40 16.84 17.21 2.74 4.91 5.05 9.72 9.02 12.31 14.10 9.64 10.21 10.34 9.04 5.02 10.59 11.91 9.44 7.21 11.07 Gerador tipo II 10.87 8.07 10.31 11.08 10.84 6.34 10.05 (n = 23) 9.37 8.94 8.78 15.01 6.93 15.91 13.45 6.84 9.37 10.04 10.94 2.04 16.89 14.04 4.32 10.71 (a) Teste se a produção média de energia eléctrica segundo os dois geradores é igual. (b) Construa um intervalo de confiança a 95% para o valor esperado da produção de energia eléctrica. (c) O fabricante afirma que a variância da produção de energia eléctrica é de 4(kW /h) 2. Comente a afirmação do fabricante. (d) Seja p a proporção desconhecida de geradores cuja produção se situa abaixo dos 5kW /h. Estes são considerados defeituosos e o comprador será indemnizado. Teste a hipótese de a proporção de geradores defeituosos ser inferior ou igual a 10%. (e) Verifique a hipótese de a produção de energia eléctrica seguir uma distribuição normal. 28

Capítulo 8 Regressão Linear Simples 1. Interessa estudar a relação entre a resistência de um determinado tipo de plástico (Y ) e o tempo que decorre a partir da conclusão do processo de moldagem até ao momento de medição da resistência (x horas). As observações que se seguem foram efectuadas em 12 peças construídas com este plástico, escolhidas aleatoriamente. i 1 2 3 4 5 6 7 8 9 10 11 12 x i 32 48 72 64 48 16 40 48 48 24 80 56 y i 230 262 323 298 255 199 248 279 267 214 359 305 (a) Represente graficamente as observações e desenhe a recta que, no seu entender, melhor se ajusta às observações. (b) Considere um modelo de regressão linear simples para explicar as observações. Obtenha a estimativa dos mínimos quadrados dos coeficientes da recta de regressão e desenhe-a no gráfico. (c) Obtenha uma estimativa pontual para o valor esperado da resistência obtida 48 horas depois de concluída a moldagem. Acha legítimo usar o mesmo procedimento tratando-se de um período de 10 horas em vez de 48 horas? Justifique a sua resposta. (d) Proceda ao teste da hipótese O coeficiente angular é nulo. Qual o interesse desta hipótese? (e) Calcule o coeficiente de determinação e comente o valor obtido. Relacione-o com o resultado obtido em (d). (f) Calcule o intervalo de confiança a 95% para o valor esperado da resistência obtida 50 horas depois de concluída a moldagem. 2. Um estudo sobre a influência da velocidade do vento (X ), em m/s, na quantidade de água (Y ) que se evapora por dia, em centenas de litros, na albufeira de certa barragem, a temperaturas constantes, conduziu a: x i 20 50 30 100 70 y i 3 5 3 10 8 (a) Adoptando um modelo de regressão linear simples, estime a recta de regressão de Y sobre X e obtenha uma estimativa da quantidade média de água evaporada quando a velocidade do vento é igual a 90m/s. Faça uso dos seguintes valores: x = 54.0 ȳ = 5.8 x 2 i = 18700 y 2 i = 207 x i y i = 1960 (b) Calcule o coeficiente de determinação do modelo estimado. i (c) Teste a significância da regressão. Indique o valor-p desse teste e comente o resultado face ao valor obtido na alínea anterior. 3. Da análise do consumo médio de energia por agregado familiar durante 10 dias de um mês de Inverno numa cidade obtiveram-se os seguintes resultados, representando x a temperatura diária média ( o C ) e Y o consumo médio de energia (kw ): i i 29

i 1 2 3 4 5 6 7 8 9 10 x i 15 14 12 14 12 11 11 10 12 13 y i 4.3 4.4 5.3 4.6 5.5 5.9 5.7 6.2 5.2 5.0 10 i=1 10 i=1 x i = 124 x 2 i = 1560 10 i=1 10 i=1 y i = 52.1 y 2 i = 275.13 10 i=1 x i y i = 637.1 O modelo de regressão linear simples foi usado para estudar a relação entre o consumo médio de energia por agregado familiar e a temperatura diária média. (a) Escreva a equação da recta de regressão estimada e obtenha um intervalo de confiança a 90% para o verdadeiro valor do declive da recta de regressão. (b) Qual o valor predito para o consumo médio num dia de temperatura média igual a 10 o C? Que responderia se lhe fosse pedida uma predição do consumo médio para um dia com temperatura média de 20 o C? 4. Uma liga metálica é submetida a várias tensões (x [10 3 K g f /cm 2 ]), tendo-se registado o tempo decorrido (T [hor as]) até se atingir a rotura. Alguns dos resultados obtidos nesta experiência foram os seguintes: i 1 2 3 4 x i 15 20 25 30 t i 2500 600 200 70 Admite-se que as duas variáveis estão relacionadas de acordo com o seguinte modelo de regressão linear: lnt = β 0 + β 1 X + ε. (a) Assumindo as hipóteses que julgar convenientes, obtenha as estimativas dos mínimos quadrados de β 0 e β 1. (b) O modelo foi utilizado para prever os tempos correspondentes às tensões de 25 10 3 K g f /cm 2 e 50 10 3 K g f /cm 2. Calcule as estimativas desses tempos. Diga, justificando, se concorda que o modelo adoptado seja usado para predizer aqueles tempos. 5. O modelo de regressão linear simples foi usado para estudar a relação entre a produção de uma variedade de trigo (Y ) e a quantidade de adubo usada como fertilizante (x). Foram efectuadas 7 observações: i 1 2 3 4 5 6 7 x i 100 200 300 400 500 600 700 y i 40 50 50 70 65 65 80 As observações foram tratadas em seguida usando o package estatístico R. Parte do output obtido é o seguinte: > x<-seq(100,700,100) > x [1] 100 200 300 400 500 600 700 > y<-c(40,50,50,70,65,65,80) > lm(y~x) Call: lm(formula = y ~ x) Coefficients: (Intercept) x 30

36.42857 0.05893 > summary(lm(y~x)) Call: lm(formula = y ~ x) Residuals: 1 2 3 4 5 6 7-2.3214 1.7857-4.1071 10.0000-0.8929-6.7857 2.3214 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 36.42857 5.03812 7.231 0.000789 *** x 0.05893 0.01127 5.231 0.003379 ** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 5.961 on 5 degrees of freedom Multiple R-squared: 0.8455, Adjusted R-squared: 0.8146 F-statistic: 27.36 on 1 and 5 DF, p-value: 0.003379 (a) Proceda ao teste da hipótese de que a adubação não tem influência na produção. (b) Acha que o modelo se ajusta adequadamente às observações? Justifique. (c) Calcule uma estimativa do valor esperado da produção com uma quantidade de adubo à sua escolha e indique uma estimativa da variância associada. 31

Apêndice A Probabilidade, Variáveis e Vectores Aleatórios, Teorema do Limite Central A.1 Probabilidade Consegue-se definir probabilidade de forma rigorosa e simples através da Axiomática de Kolmogorov, necessitando de um pequeno número de conceitos e muito abrangente: experiência aleatória, espaço de resultados Ω, acontecimentos elementares ω i Ω, acontecimentos ou eventos A Ω, probabilidade de A ocorrer P(A),... mas estrutura pouco flexível! Conceitos fundamentais são: Lei da probabilidade total, Teorema de Bayes e, independência entre acontecimentos. A.2 Variáveis aleatórias discretas Seja X uma variável aleatória (v.a.) a tomar valores reais discretos com probabilidade não nula. Define-se a sua função de probabilidade P(X = x) para qualquer x R e com a qual se conseguem calcular probabilidade para eventos, i.e. P(X B) com B R. Alternativamente define-se a função de distribuição cumulativa (f.d.) F X (x) = P(X x), x R. Casos particulares que permitem descrever bastantes situações de interesse na prática são: Bernoulli(p), Binomial(n, p): nº de sucessos em n provas de bernoulli (experiência aleatória só com dois resultados possíveis e.g. sucesso e insucesso) independentes e com probabilidade de sucesso p (0, 1); inclui experiências de amostragem com reposição. Hipergeométrica(N, M, n): nº de sucessos em experiências de amostragem sem reposição sendo N o número total de indivíduos da população, M o número total de indivíduos da população "com sucesso"e n a dimensão da amostra. Geométrica(p): nº de provas Beroulli(p) independentes até ao 1º sucesso. Uniforme: aplica-se quando todos os resultados possíveis são equiprováveis. Poisson(λ): aplicações em contagens independentes. Na caracterização de v.a. s (discretas ou contínuas) duas classes de medidas a salientar são, medidas de localização: incluindo a média µ = E[X ], moda m 0, mediana me, e os quantis de probabilidade χ p ; medidas de escala: incluindo a variância σ 2 = V ar (X ), desvio padrão σ e o coeficiente de variação σ/ µ. 32

A.3 Variáveis aleatórias contínuas Consideremos para definição de v.a. contínua: X com função de distribuição (f.d.) F X (x) = P(X x) contínua x R, e função de densidade de probabilidade (f.d.p.) f X (x), respectivamente, x F X (x) = f X (u)du, f X (x) 0, x R, e R f X (x)dx = 1; f X (x) = df X (x). dx Casos particulares que permitem descrever bastantes situações de interesse na prática são: Uniforme: todos os resultados possíveis em [a,b], a,b R, a < b, são equiprováveis. Exponencial(λ): e.g. na modelação de tempos de vida de componentes elétricas ou tempos entre chegadas. Gaussiana ou Normal(µ,σ 2 ): com grande impacto devido ao Teorema do Limite Central (TLC). Propriedades a salientar da v.a. normal: 1. Fecho para transformações lineares: X N (µ,σ 2 ), a,b R = Y = ax + b N (aµ + b, a 2 σ 2 ). consequentemente, X N (µ,σ 2 ) = Z = X µ σ N (0,1). 2. Uso de tabelas da normal reduzida (Z N (0,1) com f.d. φ) no cáculo de probabilidades, ( a µ P(a < X < b) = P σ < X µ σ < b µ ) ( ) b µ ( a µ ) = φ φ. σ σ σ A.4 Vectores Aleatórios Bivariados Discretos Vectores aleatórios bivariados discretos são representados por (X,Y ) com espaço de resultados R X,Y ( R 2 ) um conjunto de valores finito ou infinito numerável, com função de probabilidade conjunta { > 0, (x, y) RX,Y P(X = x,y = y) = 0, c.c., (x,y) R X,Y P(X = x,y = y) = 1, função de distribuição cumulativa conjunta e valor esperado F X,Y (x, y) = P(X x,y y) = P(X = x i,y = y i ), E[ψ(X,Y )] = ψ(x, y)p(x = x,y = y), x,y x i x,y i y com propriedades naturalmente extensíveis, por exemplo a propriedade da linearidade E[X +Y ] = E[X ]+E[Y ]. As funções de probablidade marginais e momentos marginais podem-se obter por P(X = x) = y P(X = x,y = y), P(X x) = P(X = x i,y = y), x R, x i x y E[ψ(X )] = x ψ(x)p(x = x), µ X = E[X ], σ 2 = V ar (X ) = E[(X µ X ) 2 ] = E[X 2 ] µ 2 X. Duas v.a. s X e Y são independentes se P(X = x,y = y) = P(X = x) P(y = y), (x, y) R 2. Definem-se ainda função densidade de probabilidade de X condicional a Y = y, P(X = x,y = y) P(X = x Y = y) =, se P(Y = y) > 0, P(Y = y) 33

valor esperado e outros momentos condicionais, E[X Y = y] = x xp(x = x Y = y), E[ψ(X ) Y = y] = x ψ(x)p(x = x Y = y). A covariância permite obter informação sobre a dependência entre variáveis aleatórias, Cov(X,Y ) = E[(X µ X )(Y µ Y )] = E[X Y ] µ X µ Y. Propriedades: 1. V ar (ax + by ) = a 2 var (X ) + b 2 V ar (y) + 2ab Cov(X,Y ) 2. X,Y independentes = Cov(X,Y ) = 0, logo V ar (X + Y ) = V ar (X ) +V ar (Y ) 3. Cov(X,Y ) = Cov(Y, X ) 4. Cov(X, X ) = V ar (X ) 5. Cov(aX + b,y ) = a Cov(X,Y ) 6. Cov(X + Z,Y ) = Cov(X,Y ) +Cov(Z,Y ) A correlação pretende medir a associação linear entre X e Y, 1 Cor r (X,Y ) = Cov(X,Y ) V ar (x)v ar (y) 1 Sendo Y = a + bx : Cor r (X,Y ) = 1 se a < 0, e Cor r (X,Y ) = 1 se a > 0. A.5 Combinações Lineares de Variáveis Aleatórias Independentes n X i i=1 n n c i X i, c i R, X = i=1 i=1 X i Bin(n i, p) = n i=1 X i Bin ( n i=1 n i, p ) X i Poi s(λ i ) = n i=1 X i Poi s ( n i=1 λ i X i N (µ i,σ 2 i ) = n i=1 c i X i N ( n i=1 c i µ i, n i=1 c2 i σ2 i X i N (µ,σ 2 ) = X = ( n X i i=1 n N µ, σ2 A.6 Teorema do Limite Central n ) X i n ) X µ σ/ N (0, 1) n ) n i=1 c i X i n i=1 c i µ i n i=1 c2 i σ2 i N (0,1) Sendo X i, i = 1,...,n, v.a. s independentes com E[X i ] = µ e var (X i ) = σ 2 <, pelo TLC, ( n lim P i=1 X ) ( ) i nµ X n σ µ z = lim P n n σ/ n z = φ(z). Consequentemente, n X i apr ox N ( nµ,nσ 2) i=1 X = n i=1 Aproximações, X i n apr ox N ) (µ, σ2 n n i=1 X i nµ apr ox N (0,1) nσ 2 X µ σ/ n aprox N (0, 1) X Bin(n, p),np > 5 e n(1 p) > 5 = X apr ox N ( np,np(1 p)) ) X Poi s(λ),λ > 5 = X apr ox N (λ,λ) 34

A.7 Processo de Poisson Um Processo de Poisson {N t, t > 0} de taxa λ verifica: - N t Poi s(λt) representa o número de ocorrências em (0, t], - ocorrências em intervalos disjuntos são independentes, - o número de ocorrências em (0, t] segue a mesma distribuição que número de ocorrências em (s, s + t], s, t > 0. Propriedade: o tempo entre ocorrências consecutivas segue uma distribuição exponencial. 35

Apêndice B Estimação e Testes de Hipóteses De uma forma geral, interessa estudar uma determinada população representada por uma variável aleatória (v.a.) X que segue um modelo probabilístico conhecido, por exemplo, Bi n(n, p), Poi sson(λ), N (µ, σ) ou E xponenci al(λ). Alguns dos parâmetros populacionais mais comuns são: µ = E(X ) média populacional σ 2 = V ar (X ) - variância populacional p = P(sucesso) - probabilidade de sucesso em populações Bernoulli ou Binomial λ = E(X ) ou λ = 1/E(X ) numa população Poisson ou Exponencial respectivamente. B.1 Estimação Pontual Uma amostra aleatória de dimensão n proveniente de uma população X é um conjunto de n variáveis aleatórias independentes e identicamente distribuídas (i.i.d.), representada por: (X 1, X 2,..., X n ). No que se segue θ representa um parâmetro desconhecido da população X e ˆθ n um seu estimador. Um estimador ˆθ n é uma função exclusiva da amostra aleatória e portanto independente de parâmetros desconhecidos. Note-se que é uma variável aleatória. Propriedades desejáveis dos estimadores são: a) centralidade: E[ ˆθ n ] = θ e, b) Var( ˆθ n ) mínima. Dois estimadores a salientar: a) Estimador Média Amostral n i=1 X = X i. n É um estimador centrado para a média populacional µ. Quando concretizada a amostra aleatória - representada por (x 1,..., x n ) - obtém-se a estimativa x = n 1 n i=1 x i, i.e. um valor concreto para µ que quase certamente não será o verdadeiro valor de µ mas que deverá aproximar-se deste pelas boas propriedades do estimador (em particular prova-se que tende para µ quando n ). 36

b) Estimador Variância Amostral (também designado variância amostral corrigida) n Sn 1 2 = i=1 (X i X ) 2. n 1 É um estimador comum para a variância populacional σ 2. A divisão por (n 1) garante a centralidade. O Erro Quadrático Médio (EQM) mede em simultâneo a variânciao e o quadrado do enviesamento (i.e. quanto e em média o estimador se desvia do parâmetro a estimar), EQM( ˆθ) = V ar ( ˆθ) + (E[ ˆθ] θ) 2. A eficiência de um estimador ˆθ 1 relativamente a outro estimador ˆθ 2, compara os estimadores pelos seus EQM através do quociente: EQM( ˆθ 2 ) EQM( ˆθ 1 ), ˆθ 1 diz-se mais eficiente se EQM( ˆθ 2 )/EQM( ˆθ 1 ) > 1 e, ˆθ 2 diz-se mais eficiente se EQM( ˆθ 2 )/EQM( ˆθ 1 ) < 1. B.2 Intervalos de confiança (IC) Seja X uma v.a. com modelo probabilístico, conhecido ou não, com parâmetro(s) desconhecido(s). Método da variável fulcral para a obtenção do IC, após a clara identificação da população subjacente (geralmente caracterizada por uma v.a. X ) e do parâmetro desconhecido para o qual se pretende o IC: 1. Identificar a variável fulcral: T (X,θ) função do estimador e do parâmetro desconhecido, e com distribuição conhecida. 2. Estabelecido o nível de confiança, ou α : (1 α) 100%, obter os quantis de probabilidade α/2 e 1 α/2, i.e. χ α/2 e χ 1 α/2 tais que, P ( χ α/2 < T (X,θ) < χ 1 α/2 ) = 1 α. 3. Obter os limites inferior e superior do IC aleatório, pela resolução da dupla desigualdade χ α/2 < T (X,θ) < χ 1 α/2 em ordem a θ. 4. Concretizar o IC com base na amostra dada. Distinguem-se os casos: IC para: população subjacente: 1. µ nor mal(µ,σ 2 ), σ 2 conhecido 2. µ arbitrária, σ 2 conhecido, n elevado 3. µ 1 µ 2 nor mal(µ 1,σ 2 1 ), nor mal(µ 2,σ 2 2 ), σ2 1 e σ2 2 conhecidos 4. µ 1 µ 2 arbitrárias, σ 2 1 e σ2 2 conhecidos, n 1 e n 2 elevados 5. µ nor mal(µ,σ 2 ), σ 2 desconhecido 6. µ arbitrária, σ 2 desconhecido, n elevado 7. µ 1 µ 2 nor mal(µ 1,σ 2 1 ), nor mal(µ 2,σ 2 2 ), σ2 1 = σ2 2 desconhecidos 8. µ 1 µ 2 arbitrárias, σ 2 1 e σ2 2 desconhecidos, n 1 e n 2 elevados 9. σ 2 nor mal(µ,σ 2 ), µ desconhecido 10. p bernoulli ou binomial, n elevado Note-se que os casos 3., 4., 7. e 8. pressupõem a independência entre as duas populações. Confianças (1 α) 100% mais usuais são: 95%, 99% e 90% correspondendo, respectivamente, a α = 0.05, α = 0.01 e α = 0.1. Dois exemplos: 37

1. IC para µ com σ 2 conhecido a 95% Seja X com distribuição normal de média µ desconhecida mas variância σ 2 conhecida. Pela variável fulcral, X µ σ/ N (0,1), (B.1) n conseguem-se obter os quantis F 1 N (0,1) (0.025) = φ 1 (0.025) = 1.96 e F 1 N (0,1) (0.975) = φ 1 (0.975) = 1.96 tais que, ( P 1.96 < X ) ( µ σ/ n < 1.96 = P X 1.96 σ < µ < X + 1.96 σ ) = 0.95. n n Isto é, pela resolução da dupla desigualdade, obtém-se o IC aleatório a 95% para µ, [ X 1.96 σ, X + 1.96 σ ] n n No caso de população arbitrária com n elevado, o argumento anterior repete-se aproximadamente justificado pelo Teorema do Limite Central. 2. IC para µ com σ 2 desconhecido e, IC para σ 2, ambos a 95% Seja X com distribuição normal de média µ e variância σ 2 ambos desconhecidos. Prova-se que X µ S/ n t (n 1) e (n 1)S 2 σ 2 χ (n 1), sendo t (n 1) a distribuição t Student com n 1 graus de liberdade e, χ (n 1) a distribuição Qui-quadrado com n 1 graus de liberdade. Escolhendo estas variáveis para variáveis fulcrais, os intervalos de confiança para os parâmetros µ e σ 2 obtêm-se de forma semelhante ao caso anterior. Os quantis, F 1 t n 1 (0.025), F 1 t n 1 (0.975), e F 1 χ n 1 (0.025), F 1 χ n 1 (0.975) necessários para o cálculo dos intervalos obtêm-se das respectivas tabelas, quantis da função de distribuição t Student e quantis da função de distribuição Qui-quadrado. A amplitude do IC reflete a precisão do IC e portanto da estimação. O erro de estimação, ou semi-amplitude do IC, também é uma medida usual para a avaliar a precisão da estimação. B.3 Testes de Hipóteses (TH) Duas classes importantes de TH são: A. a parâmetros populacionais, por exemplo, { H0 : µ = 20 H 1 : µ 20, { H0 : σ 2 = 5 H 1 : σ 2 > 5, ou { H0 : p =.2 H 1 : p.2. B. a distribuições, por exemplo, { H0 : X N (µ,σ 2 ) H 1 : X N (µ,σ 2 ) ou, { H0 : X Poi sson(λ) H 1 : X Poi sson(λ). A. Metodologia para efecturar TH paramétricos, após clara identificação da população subjacente (geralmente caracterizada por uma v.a. X ) e do parâmetro desconhecido para o qual se pretende o TH: 1. Especificar as hipóteses H 0 e H 1 (pondo sempre a igualdade em H 0 ). 38

2. Escolha da estatística do teste (semelhante à escolha da variável fulcral na construção do IC e respectiva distribuição e distinguindo-se os mesmos casos que anteriormente), T (X,θ) H0 com distribuição conhecida. 3. Identificar o nível de significância α = P(Re j ei t ar H 0 H 0 ) (erro de 1ª espécie), os correspondentes quantis (de acordo com a distribuição conhecida) χ α/2 e χ 1 α/2, e a correspondente Região Crítica (de acordo com H 1 ): (a) RC bilateral: (,χ α/2 ) (χ 1 α/2, ) (b) RC unilateral esquerda: (,χ α ) (c) RC unilateral direita: (χ 1 α, ) 4. Tomar a decisão, a α 100% de significância, com base na amostra observada: (a) não rejeitar H 0 se t cal RC; (b) rejeitar H 0 se t cal RC. Níveis de significância α mais usuais são: 0.05, 0.01 e 0.10. Em alternativa calcula-se o v al or p, que reflete a probabilidade de obter valores tão ou mais desfavoráveis a H 0 : P(T > t calc H 0 ) se RC = (χ 1 α, ) valor p = P(T < t calc H 0 ) se RC = (,χ α ) P( T > t calc H 0 ) se RC = (,χ α/2 ) (χ 1 α/2, ) e, se valor p < α, rejeitar H 0 a α 100% de significância. B. Testes de Ajustamento do Qui-quadrado de Pearson Requisitos gerais: o tamanho da amostra n deve ser elevado pois trata-se de um teste assimptótico e, os dados devem estar agrupados em k classes disjuntas (cada com frequência esperada 5 ou similar) a cobrir todos os resultados possíveis. A estatística do teste e correspondente Região Crítica são dadas por, sob a validade da hipótese nula: sendo: k (O i E i ) 2 χ 2 k β 1 E, RC : i i=1 O i - frequências absolutas observadas, E i - frequências esperadas de acordo com H 0, β - número de parâmetros estimados. Note-se que k i=1 O i = k i=1 E i = n. ( ) F 1 (1 α),+ χ 2 k β 1 39

Apêndice C Regressão Linear Simples O modelo de RLS define-se como, Y = β 0 + β 1 x + ε sendo: Y - v.a. dependente, x - variável independente, β 0 β 1 - ordenada na origem, - declive, ε - erro aleatório: E[ε] = 0 e V ar [ε] = σ 2 ; ε N (0,σ 2 ) para obter as distribuições usuais dos estimadores (úteis para construir IC e TH). Com base numa amostra (x 1, y 1 ),(x 2, y 2 ),...,(x n, y n ) de dimensão n pretende-se: 1. Obtêr o melhor modelo: uma possibilidade será usar os estimadores dos mínimos quadrados i.e., tais que minimizam n i=1 ε2 i = ( ) n 2 i=1 yi β 0 β 1 x i obtendo-se, { ˆβ0 = ȳ ˆ β 1 x ˆβ 1 = n i=1 (x i x)(y i ȳ) n i=1 (x i x) 2. 2. Avaliar a qualidade do modelo: (a) Coeficiente de Determinação, interpretado como uma medida da percentagem da variabilidade do Y que o modelo consegue explicar, R 2 = ρ 2 = cov 2 (x, y) var (x)var (y) = ( n i=1 (x i x)(y i ȳ) ) 2 n i=1 (x i x) 2 n i=1 (y i ȳ) 2, R2 100% (0,100). (b) Significância de β 1 : este coeficiente ser significativamente diferente de zero (que pode ser avaliado através de um IC ou TH) indica existência de relação entre x e Y. 3. Estimar valores de Y dado x: E[Y x] = ˆβ 0 + ˆβ 1 x. 40

Soluções Capítulo 1: 1a Ω = {1,2,3,4,5,6}, P({1}) = P({3}) = P({5}) = 2/9, P({2}) = P({4}) = P({6}) = 1/9. 1b 4/9 1c 1/3 3a 0.0001 3b 0.001 3c 0.504 4a 988/2303 4b 435/2303 4c 22529/23030 4d 3/658 5a 1/210 5b 2/9 6a Exp. aleatória: extracção ao acaso de uma bola da urna com as características referidas, Ω = {B,PB,PPB,PPPB,PPPPB,PPPPPB}. 6b P(A ganhar) = 0.6587, P(B ganhar) = 0.3413. 6c P(A ganhar) = 2/3, P(B ganhar) = 1/3. 7a Sendo D e F acontecimentos a representar equipamento defeituoso e não defeituoso, respectivamente, Ω = {(D,D),(F,D),(D,F ),(F,F )}; P({(D,D)}) = 0.04, P({(F,D)}) = P({(D,F )}) = 0.16, P({(F,F )}) = 0.64. 7b P(A 1 ) = P(A 2 ) = 0.2, P(A 3 ) = 0.36, P(A 3 ) = 0.32. 7cP({(D,D)}) = 2/90, P({(F,D)}) = P({(D,F )}) = 16/90, P({(F,F )}) = 56/90, P(A 1 ) = P(A 2 ) = 0.2, P(A 3 ) = 34/90, P(A 3 ) = 32/90. 8a n/(2n 1), sendo n o número de moedas de cada tipo. 8b 1/2 8c n/(2n 1) 8d (3n 1)/(4n 2) 9 27/6 3 = 0.125 10 25740/3 13 admitindo equiprobabilidade. 11a [(n 1)/n] r 1 11b n!/(n r (n r )!) 12a 1 + y x 12b x 2y 12c x y 12d 1 y 13a 0.13 13b 0.25 14a 0.85 14b 0.125 15a 0.67 15b 0.258 17a 150/365 41

17(b)i 50/214=0.23 17(b)ii 100/151=0.66 17c 150/365 = (50/214) (214/365) + (100/151) (151/365) 18a 0.3225 18b 0.1163 19a 0.3225 19b 0.1162791 20b 0.64 21 0.2 22a 0.13043 22b 0.43478 23a Sim 23b Não 24a 0.504 24b 0.296 26b 10/11 27a 0.0905 27b 0.6633 Capítulo 2: 1a a = 1/10 1b F X (x) = 0, x < 2; 0.4, 2 x < 1; 0.5, 1 x < 1; 0.9, 1 x < 2; 1, x 2. 1c m 0 = { 2,2}, classe mediana [-1,1], χ.25 = 2, χ.75 = 2, µ = 0. 1d σ 2 = V (X ) = 3.4, σ = 3.4 = 1.844, não existe o coeficiente de variação. 2a c = 1/6 2b F X (x) = 0, x < 1; 1/6, 1 x < 2; 0.5, 2 x < 3; 1, x 3. 2c m 0 = 3, classe mediana [2,3[, µ = 7/3. 2d σ 2 = V (X ) = 0.5(5), σ = 0.5(5) = 0.745356, CV (X ) = 0.3194. 3a P(X = x) = 1/6, x = 0; 1/12, x = 2; 1/4, x = 4; 1/2, x = 6. 3(b)i 1/6 3(b)ii 1/2 3(b)iii 1/12 3(b)iv 1/3 3(b)v 1/4 3(b)vi 1/4 4a 1/3 c 1/4 4b E(X ) = (10 9c)/4, V (X ) = (20 8c 81c 2 )/16 5a F X (x) = 0, x < 1; 0.25, 1 x < 2; 0.5, 2 x < 3; 0.75, 3 x < 14; 1, x 4. 5b m 0 = {1,2,3,4}, µ = 2.5, m e = [2,3], χ.25 = [1,2], χ.5 = m e, χ.75 = [3,4], V (X ) = 15/12. 6a F X (x) = 0, x < 1; 0.2, 1 x < 2; 0.4, 2 x < 3; 0.6, 3 x < 4; 0.8, 4 x < 5; 1, x 5. 6b m 0 = {1,2,3,4,5}, µ = 3, m e = 3, χ.25 = 2, χ.5 = m e, χ.75 = 4, V (X ) = 2. 7a F X (x) = 0, x < 0; 1 p, 0 x < 1; 1, x 1 7b m 0 = m e = 1 se p > 0.5; m 0 = m e = 0 se p < 0.5; m 0 = m e = {0,1} se p = 0.5; µ = p, V (X ) = p(1 p), CV = (1 p)/p. 8(a)i Ω = {( B, B,B),( B,B, B),(B, B, B),(B,B, B),(B, B,B),( B,B,B),(B,B,B)} 8(a)ii 0.7 8(a)ii 1/3 8(b)i V.a. Hipergeométrica (5,2,3): P(X = x) = 1/10, x = 0; 6/10, x = 1; 4/10, x = 2. 8(b)ii F X (x) = 0, x < 0; 1/10, 0 x < 1; 7/10, 1 x < 2; 1, x 2. 42

8c (a)i Ω = {( B, B, B),( B, B,B),( B,B, B),(B, B, B),(B,B, B),(B, B,B),( B,B,B),(B,B,B)}; (a)ii 0.648; (a)iii 1/3; (b)i V.a. binomial (3,2/5): P(X = x) = 27/125, x = 0; 54/125, x = 1; 36/125, x = 2; 8/125, x = 3; (b)ii F X (x) = 0, x < 0; 27/125, 0 x < 1; 81/125, 1 x < 2; 117/125, 2 x < 3; 1, x 3. 9a V.a. binomial (3,0.9): P(X = x) = 0.001, x = 0; 0.027, x = 1; 0.243, x = 2; 0.729, x = 3. 9b F X (x) = 0, x < 0; 0.001, 0 x < 1; 0.028, 1 x < 2; 0.271, 2 x < 3; 1, x 3. 9c E[X ] = 2.7, m 0 = x = 3, V (X ) = 0.27. 10a V.a. Hipergeométrica (30,20,2): P(X 1) = 26/29. 10b V.a. binomial (2,2/3): P(X 1) = 8/9. 11a V.a. geométrica (1/3): P(X = 3) = 4/27. 11b E[X ] = 3. 12(a)i X v.a. Hipergeométrica (5000,100,10). 12(a)ii P(X > 1) = 1 P(X 1) = 0.0162. 12(a)iii E[X ] = 0.2. 12b Y v.a. binomial (10,0.02), P(Y > 1) = 0.0160, E[Y ] = 0.2. 12(c)i Z v.a. geométrica (0.02): P(Z 3) = 0.9412. 12(c)ii E[Z ] = 50. 13a V.a. binomial (10,0.1), 1 F X (2) = 0.0702. 13b n : 1 F X (2) < 0.05 F X (2) > 0.95 = n 8. 14 4 x=0 C 2000 15a 0.3005. 16a 0.2231. 16a 0.4308. 16b 4.47. x C250 x 58000 /C 60000 250. 17a X v.a. Poisson (8.1), F X (4) = 0.0996. 17b Y v.a. binomial (5,0.1), 1 F Y (0) = 1 0.5905 = 0.4095. 18 500 x=2 C 500 x (1/365) x (364/365) 500 x 0.3977. Capítulo 3: 1a 0.375 1b µ = 4/3 = 133.3 Kg, σ = 62.36 kg. 1c 245.23 Kg. 2a Ω X = [0,1], f X (x) = 1, 0 x 1; 0,c.c. 2b F X (x) = 0, x < 0; x, 0 x < 1; 1, x 1. 2c x = E[X ] = 1/2, V (X ) = 1/12. 2d Ω X = [0,1/2], f X (x) = 2, 0 x 1/2; 0,c.c. 2b (i) f X (x) = 2, 0 x 1/2; 0,c.c., F X (x) = 0, x < 0; 2x, 0 x < 1/2; 1, x 1/2., x = µ = 1/4, σ 2 = 1/48. (ii) f X (x) = 1/2, 0 x 2; 0,c.c., F X (x) = 0, x < 0; x/2, 0 x < 2; 1, x 2, x = µ = 1, σ 2 = 1/3. 3a F X (x) = 0, x < 0; 1 e 2x, x 0. 3b e 1 = 0.3679 3c χ p = 2 1 log(1 p); x = χ 1/2 = 2 1 log2, χ 1/4 = 2 1 log(4/3). 4a P(X > 1/2) = e 5/2 = 0.082085. 4b Pela propriedade da falta de memória da v.a. exponencial, P(X > 1/2 + 1/4 X > 1/2) = P(X > 1/4) = e 5/4 = 0.2865048. 5a µ = 2.5, σ = 0.469 5b 0.6826 6a 0.0023 6b 6231.04 horas 6c 1/8 7a f X (x) = λe λx, x > 0; 0,c.c.; µ = 1/λ, x = χ 1/2 = (log2)/λ, χ 1/4 = λ 1 log(4/3), χ 3/4 = λ 1 log(4), σ 2 = 1/λ 2. 43

7(b)i Espera-se que as peças de A tenham um melhor desempenho que B pois E[X A ] = 2 > E[X B ] = 1; note-se que semelhante conclusão se pode tirar dos quantis pois χp A = 2log(1/(1 p)) > χb p = log(1/(1 p)). 7(b)ii 0.4502. 8a 0.6826 8b 0.8759 9a k = 0 9b F X (x) = 0, x < 1; x 2 /2 + x + 1/2, 1 x < 0; x 2 /2 + x + 1/2, 0 x < 1; 1, x 1. 9c µ = 0, σ = 1/6. 9d m 0 = x = 0, χ 1/4 = 1 + 2/2. 9e 1/4. 10a F X (x) = 0, x < 0; 5x 4 4x 5, 0 x < 1; 1, x 1. 10b 112/243 10(c)i P(L = C 1 C 3 ) = 101/243, P(L = C 2 C 3 ) = 142/243:F L (x) = 0, x < C 2 C 3 ; 142/243, C 2 C 3 x < C 1 C 3 ; 1, x C 1 C 3. 10(c)ii (142C 1 + 101C 2 243C 3 )/243. 11 C 1 + 50C 2. Capítulo 4: 1a P(X = x) = 0.2, x = 0; 0.65, x = 1; 0.15, x = 2; 0, x 0,1,2; P(Y = y) = 0.5, y = 0; 0.36, y = 1; 0.14, y = 2; 0, y 0,1,2. 1b F X (x) = 0, x < 0; 0.2, 0 x < 1; 0.85, 1 x < 2; 1, x 2. 1c 0.18 1d 1.59 1e P(X = x Y = 0) = 12/50, x = 0; 25/50, x = 1; 13/50, x = 2; 0, x 0,1,2; F X Y =0 (x) = 0, x < 0; 12/50, 0 x < 1; 37/50, 1 x < 2; 1, x 2. De forma semelhante obtêm-se P(X = x Y = 1), F X Y =1 (x), P(X = x Y = 2) e, F X Y =2 (x), x R. 1f 51/50=1.02, 0.4996, classe mediana [1,2[. 1g Não são independentes, por exemplo 0.12 = P(X = 0,Y = 0) 0.10 = P(X = 0) P(Y = 0). 1h 0.7619 1i -0.114 o que indica uma fraca relação linear negativa. 2a Não são independentes. 2b Cov(X,Y ) = 0 e X, Y não são independentes. 4a Ω X,Y = {(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2)}. 4bP(X = x) = 0.064, (x, y) = (0,0); 0.096, (x, y) = (0,1); 0, (x, y) = (0,2); 0.096, (x, y) = (1,0); 0.240, (x, y) = (1,1); 0.144, (x, y) = (1,2); 0, (x, y) = (2,0); 0.144, (x, y) = (2,1); 0.216, (x, y) = (2,2);. 4bP(X = x) = 0.16, x = 0; 0.48, x = 1; 0.36, x = 2; 0, x 0,1,2; P(Y = y) = 0.16, y = 0; 0.48, y = 1; 0.36, y = 2; 0, y 0,1,2. 5a µ = 3.6 cm, σ = 0.0224 cm. 5b 0.1867 6 0 7 0.1894 8 0.9236 9a 0.9999948 9b 0.0409 10 65 11a 0.2202 11b 0.6592 12a 0.3233 12b 0.0831 13a 0.4169 44

13b 0.4169 13c A probabilidade de cumprir com o compromisso é elevada, aproximadamente igual a 0.9772. 13d 0.3014 14a X v.a. Poisson (6), 1 F X (8) = 1 0.8472 = 0.1528. 14b E[T ] = V ar (T ) = 50 sendo T = 5 i=1 X i + 2 i=1 Y i. 14(c)i W v.a. binomial (10,0.15), 1 F W (4) = 1 0.9901 = 0.0099. 14(c)ii V v.a. binomial (100,0.15), 1 F V (4) 0.999 usando a aproximação da binomial à normal. 14d P(T > 2) = 0.0582, sendo T uma v.a. normal(1,0.6356 2 ). 15a 0.0367 15b 0.0222 15(c)i 0.9994 15(c)ii 0.3032 16a 0.2 16b 0.7939 16c 0 17a 0.9994 17b 0.0038 17c 0.044843 18a 0.7 18b 0.286 e 5.5 m 18c 0.9997 Capítulo 5: 1a E X = E ˆµ = µ logo ambos são centrados. 1b V ar ( X ) = σ 2 /3, V ar ( ˆµ) = 3σ 2 /8. 1c E f ( ˆµ X ) = EQM( X )/EQM( ˆµ) = 8/9 < 1 logo ˆµ menos eficiente. 1d Escolhendo X, obtém-se x = 0.4. 1e Escolhendo S 2, obtém-se s 2 = 0.006(6). 2 T 2 é mais eficiente se θ ( 3/2, 3/2), caso contrário escolha-se T 1. 3c EQM = V ar = ω 2 (σ 2 1 + σ2 2 )/n + (1 2ω)σ2 2 /n 3d E f ( X 1 ˆµ) = (σ 4 2 + σ2 1 σ2 2 )/(σ2 1 + σ2 2 ) < 1 logo ˆµ é mais eficiente. 3e ˆµ = 2.67. 6a π/2 > 1 logo média mais eficiente. 6b 1/2 < 1 logo mediana mais eficiente. 6c média mais eficiente na população normal e mediana mais eficiente na população em 6b. Capítulo 6: 1 A 95%: (136.08,143.92), a 99%: (134.85,145.15), a 90%: (136.71,143.29). 2 (3.435,5.653), n = 200. 3 (94.6,102.7), (43.6,161.0), assumindo independência da amostra e população normal. 4a (1.7226,2.8434) 4b (0.401,1.285) 5 (27.67,29.13) h/semana. 6 (-192.106,275.506) 7 (-5.635,11.035) 8 (6.322,13.678) 9a (0.0964,0.2436) 9b 1256 9b 1810 45

10a (0.4720,0.5780) 10b n 1688 11a (138.4651,150.1349), (3.5068,12.9310) 11b Pelo menos 152 peças. 12 (0.3216,0.4784) Capítulo 7: 1a H 0 : µ = 16 vs. H 1 : µ 16: não rejeitar H 0 para α = 0.01 ou α = 0.05, e rejeitar H 0 para α = 0.10 (-2.145<-2.037<-1.761). 1b H 0 : σ 2 = 0.25 vs. H 1 : σ 2 0.25: rejeitar H 0 para os usuais níveis de significância α = 0.01, 0.05 ou 0.10 (1.296<4.075). 2a Sim (-1.645<-0.408<-1.645). 2b V alor p = 0.6818 > 0.1, logo não rejeitar H 0 para α = 0.1. 3a H 0 : µ = 30 vs. H 1 : µ 30, rejeitar H 0 para α = 0.01 (2.64>2.576). 3b V alor p = 2 (1 φ(2.64)) = 0.008 < 0.01, rejeitar H 0 para α = 0.01. 3c H 0 : µ 30 vs. H 1 : µ > 30, valor p = 1 φ(2.64) = 0.004 < 0.01, rejeitar H 0 para α = 0.01. 3d H 0 : µ = 30 vs. H 1 : µ 30, não rejeitar H 0 para α = 0.01 (2.64<2.744, ou valor p = 0.013). H 0 : µ 30 vs. H 1 : µ > 30, rejeitar H 0 para α = 0.01 (2.64>2.453, ou valor p = 0.006). 4 Não rejeitar H 0 : (0.427<1.699). 5a Teste sobre σ: 6.262<12.06<27.49, não rejeitar H 0 para α = 0.05. 5b Teste sobre µ: -2.131<1.661<2.131, não rejeitar H 0 para α = 0.05. 6a H 0 : µ 1 = µ 2 vs. H 1 : µ 1 µ 2 : rejeitar H 0 para α > 0.0394. 6b H 0 : µ 1 = µ 2 vs. H 1 : µ 1 µ 2 : rejeitar H 0 para α > 0.1 (1.746<2.088<2.120). 7a H 0 : µ 1 60 vs. H 1 : µ 1 > 60 (ou H 0 : µ 1 = 60 vs. H 1 : µ 1 > 60). Rejeitar H 0 para α 0.05 (t cal = 1.933). 7b H 0 : σ 2 = 16 vs. H 1 : σ 2 16. Não rejeitar H 0 para os usuais níveis de significância (t cal = 3.855). 7c H 0 : µ 1 = µ 2 vs. H 1 : µ 1 µ 2. Não rejeitar H 0 para os usuais níveis de significância (t cal = 0.996). 8 H 0 : µ 1 = µ 2 vs. H 1 : µ 1 < µ 2 ou H 0 : µ 1 µ 2 vs. H 1 : µ 1 < µ 2. V alor p = 0.4522: não rejeitar H 0 para os usuais níveis de significância logo, não se poderá concluir que o segundo método é significativamente superior ao primeiro. 9 H 0 : p = 0.9 vs. H 1 : p 0.9. V alor p = 2.42 10 6 : rejeitar H 0 para α 2.42 10 6 (consequentemente para os usuais níveis de significância), logo a afirmação não é consistente com os dados. 10 H 0 : p = 0.1 vs. H 1 : p > 0.1 (p representa a proporção de lâmpadas com defeitos), não rejeitar H 0 para α 0.1736, consequentemente para os usuais níveis de significância. 11 H 0 : p = 0.1 vs. H 1 : p > 0.1 (ou H 0 : p 0.1 vs. H 1 : p > 0.1), não rejeitar H 0 para α = 0.08 (0.67<1.4051), consequentemente não deve rejeitar o carregamento. 12 V alor p (0.5,0.6) pelo que não se rejeita H 0 para os usuais níveis de significância. 14a A hipótese não é rejeitada (0.2308<9.488). 14b É, aos usuais níveis de significância (0.4214<0.472). 15a Não rejeitar para os usuais níveis de significância (0.4347<0.472). 17a H 0 : µ 1 = µ 2 vs. H 1 : µ 1 µ 2, não se rejeita H 0 para os usuais níveis de significância (-0.255<-0.02<0.255). 17b (8.936,11.136). 17c H 0 : σ 2 = 4 vs. H 1 : σ 2 4, rejeita-se H 0 para os usuais níveis de significância (183.65>89.56). 17d H 0 : p = 0.1 vs. H 1 : p > 0.1 (ou H 0 : p 0.1 vs. H 1 : p > 0.1), não rejeitar H 0 para os usuais níveis de significância. 17e Capítulo 8: 1b ˆβ 0 = 153.917; ˆβ 1 = 2.417. 1c E[Y x ˆ= 49] = 269.933. Não é legítimo para x = 10 porque 10 (min i x i,max i x i ). 1d H 0 : β 1 = 0 vs. H 1 : β 1 0, rejeita-se H 0 para os usuais níveis de significância (15.35>4.587). 46

1e R 2 = 0.9593. A recta estimada ajusta-se bem: 95.9% da variação de Y é explicada pela relação linear com x. Esta conclusão é coerente com a da alínea anterior. 1f (268.45,281.08). 2a ˆβ 0 = 0.6359; ˆβ 1 = 0.0965; E[Y x ˆ= 90] = 9.2427. 2b R 2 = 0.9711. 2c H 0 : β 1 = 0 vs. H 1 : β 1 0, rejeita-se H 0 para os usuais níveis de significância (t calc = 9.929). 3a ŷ = ˆβ 0 + ˆβ 1 x = 10.1589 0.3991x; (-0.4474;-0.3508). 2b E[Y x ˆ= 10] = 6.17, e não se deve usar para x = 20. 4a ˆβ 0 = 11.2633; ˆβ 1 = 0.23651. 4b E[Y x ˆ= 25] = 210.7 horas, E[Y x ˆ= 50] = 0.57 mas este não deve ser usado pois trata-se de uma extrapolação sem qualquer fundamento. 5a H 0 : β 1 = 0 vs. H 1 : β 1 0, rejeita-se H 0 para os usuais níveis de significância (t calc = 5.23). Os dados indicam que a adubação influencia significativamente a produção. 5b R 2 = 0.845. O modelo ajusta-se bem às observações. 47