Duração: 90 miutos Grupo I Probabilidades e Estatística LEE, LEGI, LEMat, LERC/LETI, LMAC, MEAer, MEAmb, MEBiol, MEBiom, MEEC, MEFT, MEQ Justifique coveietemete todas as respostas 2 o semestre 206/207 6/06/207 h:00 2 o teste 0 valores. Amostras de solo de certa região têm acidez descrita por uma variável aleatória X cuja fução de desidade de probabilidade é dada por f X (x { 2x ( exp x2, x 0 0, x < 0, ode é um parâmetro positivo descohecido. (a Deduza o estimador de máxima verosimilhaça de com base uma amostra aleatória (X,..., X (3.0 proveiete da população X. V.a. de iteresse X acidez do solo em certa região F.d.p. de X { 2x f X (x ( exp x2, x 0 0, x < 0 Parâmetro descohecido, > 0 Amostra x (x,..., x amostra de dimesão proveiete da população X com x i > 0, i,...,]. Obteção do estimador de MV de Passo Fução de verosimilhaça L( x f X (x X i idep f Xi (x i X i X i f X (x i i ( ] 2x i i exp x2 i ( ( 2 x i exp i Passo 2 Fução de log-verosimilhaça ll( x l(2 l( + i il(x x 2 i i x 2 i i Passo 3 Maximização A estimativa de MV de é doravate represetada por ˆ e d ll( x d 0 (poto de estacioaridade ˆ ˆ : d 2 ll( x < 0 (poto de máximo d 2 ˆ, > 0 Págia de 8
ˆ : ṋ + ˆ2 i x2 i 0 ˆ 2ˆ3 2 i x2 i < 0 ˆ ( i x2 i i x2 i 2 2 ( i x2 i 3 i x2 i ( 3 2 < 0 (proposição verdadeira. i x2 i Passo 4 Estimador de MV de E MV ( X 2 i i (b Tedo-se recolhido a amostra (x,..., x 5 (2.9,8.3,3.6,8.9,3.9 para a qual 5 i x2 84.68, (2.0 i obteha a estimativa de máxima verosimilhaça da probabilidade de a acidez de uma amostra de solo da região pertecer ao itervalo 5.5,6.5]. ( Nota: A fução de distribuição de X é dada por F X (x exp, para x 0. Estimativa de MV de ˆ x 2 i i 84.68 5 36.936 Outro parâmetro descohecido h( P(5.5 X 6.5 F X (6.5 F X (5.5 ] ] exp ( 6.52 exp ( 5.52 exp ( 5.52 exp ( 6.52 Estimativa de MV de h( Ivocado a propriedade de ivariâcia dos estimadores de máxima verosimilhaça, pode cocluir-se que a estimativa de MV de h( é h( h( ˆ exp ( 5.52 exp ( 6.52 ˆ exp ( 5.52 36.936 0.22296. exp ˆ ( 6.52 36.936 x2 2. Um iquérito a 000 lisboetas revelou que, etre eles, 285 são favoráveis à aplicação de uma taxa à circulação automóvel o cetro histórico da cidade. (a Com base estes dados, costrua um itervalo de cofiaça a aproximadamete 95% para a (2.5 proporção de lisboetas que são favoráveis à proposta. V.a. de iteresse X resposta de um lisboeta (escolhido ao acaso ao iquérito Situação X Beroulli(p p P(resposta favorável à proposta 000 >> 30 (suficietemete grade. DESCONHECIDA Págia 2 de 8
Obteção de IC aproximado para p Passo Selecção da v.a. fulcral para p Uma vez que os foi solicitada a determiação de um IC aproximado para uma probabilidade e a dimesão da amostra é suficietemete grade para justificar o recurso à seguite v.a. fulcral para p com distribuição aproximada:] Z X p X ( X a ormal(0, Passo 2 Obteção dos quatis de probabilidade Os quatis a utilizar são { a α Φ (α/2 Φ ( α/2 Φ (0.975 t abel a.9600 b α Φ ( α/2 Φ (0.975.9600. Estes equadram a v.a. fulcral para p com probabilidade aproximadamete igual a ( α 0.95.] Passo 3 Iversão da desigualdade a α Z b α P(a α Z b α α P P a α ] X p b X ( X α α X b α X ( X p X a α ] X ( X α ] P X Φ ( α/2 X ( X p X + Φ ( α/2 X ( X α. Passo 4 Cocretização Ao ter-se em cosideração que 000 x i x i 285 000 0.285 proporção observada de respostas favoráveis] Φ ( α/2.9600, coclui-se que o itervalo de cofiaça aproximadamete igual a 95% para p é dado por x Φ ( α/2 x( x ] x( x, x + Φ ( α/2 0.285 ( 0.285 0.285.9600 000, 0.285 +.9600 0.25702, 0.32979]. ] 0.285 ( 0.285 000 (b Uma egeheira afirmou que um quarto dos lisboetas é favorável à proposta. Avalie se os dados (2.5 recolhidos cotrariam esta afirmação. Decida com base o valor-p. Hipóteses H 0 : p p 0 0.25 H : p p 0 Estatística de teste Sabe-se que o estimador de MV de p é X i X i, ode X i i.i.d. X. Para além disso, E( X E(X p e V ( X p( p V (X < +. Etão pelo TLC pode afirmar-se que X E( X X p a V ( X p( p ormal(0,, pelo que a estatística de teste é] Págia 3 de 8
T X p 0 p0 ( p 0 a H0 ormal(0,. Região de rejeição de H 0 (para valores de T Tratado-se de um teste bilateral (H : p p 0, a região de rejeição de H 0, escrita para valores da estatística de teste, é do tipo W (, c (c, +. Decisão (com base o valor-p O valor observado da estatística de teste é x p 0 t p0 ( p 0 0.285 0.25 0.25( 0.25 000 2.56. Dado que a região de rejeição deste teste é a reuião de dois itervalos simétricos, temos: valor p 2 P(T > t H 0 2 Φ( t ] 2 Φ(2.56] calc/tabel a 2 ( 0.9948 0.004. Cosequetemete, é suposto: ão rejeitar H 0 a qualquer.s. α 0.04%, pelo que H 0 : p p 0 0.25 ão é cotrariada pelos dados ao.u.s. de %; rejeitar H 0 a qualquer.s. α 0 >.04%, omeadamete aos.u.s. de 5% e 0%. Grupo II 0 valores. Um arquitecto cojectura que o primeiro algarismo (X da altura de uma estrutura artificial, escolhida ao acaso etre estruturas com pelo meos 00 metros, possui fução de probabilidade ( P(X i log 0 + i, para i,2,...,9. Uma amostra relativa a 50 estruturas artificiais as codições referidas, coduziu aos seguites dados: Primeiro algarismo da altura 2 3 4 {5,..., 9} Frequêcia absoluta observada 26 4 6 3 Frequêcia absoluta esperada E 8.8 6.2 4.8 E 5 (a Calcule os valores das frequêcias absolutas esperadas E e E 5 (aproximado-os às décimas. (0.5 V.a. de iteresse X primeiro algarismo da altura de uma estrutura artificial com pelo meos 00 metros F.p. cojecturada ( log 0 + i, i,2,...,9 Frequêcias absolutas esperadas omissas Atededo à dimesão da amostra 50 e à f.p. cojecturada, segue-se: ( E 50 log 0 + 5.; Págia 4 de 8
4 E 5 E i i 50 (5. + 8.8 + 6.2 + 4.8 5.. (b Teste a hipótese cojeturada pelo arquiteto, ao ível de sigificâcia de %. (3.0 Hipóteses ( H 0 : P(X i log 0 + i, para i,2,...,9 H : H 0 Nível de sigificâcia α 0 % Estatística de Teste k (O i E i 2 T E i a H0 χ 2 (k β, ode: i k No. de classes 5 O i Frequêcia absoluta observável da classe i E i Frequêcia absoluta esperada, sob H 0, da classe i β No. de parâmetros a estimar 0 dado que a distribuição cojecturada em H 0 está completamete especificada, i.e., H 0 é uma hipótese simples.] Frequêcias absolutas esperadas sob H 0 De acordo com a tabela facultada e a alíea (a, os valores das frequêcias absolutas esperadas sob H 0 aproximados às décimas são: E 5.; E 2 8.8; E 3 6.2; E 4 4.8; E 5 5.. De otar que ão é ecessário fazer qualquer agrupameto de classes uma vez que em pelo meos 80% das classes se verifica E i 5 e que E i para todo o i. Caso fosse preciso efectuar agrupameto de classes, os valores de k e c teriam que ser recalculados...] Região de rejeição de H 0 (para valores de T Tratado-se de um teste de ajustameto, a região de rejeição de H 0 escrita para valores de T é o itervalo à direita W (c,+, ode c F ( α χ 2 0 (k β F ( 0.0 χ 2 (5 0 F (0.99 χ 2 (4 tabel a/calc 3.28. Decisão No cálculo do valor observado da estatística de teste covém recorrer à seguite tabela auxiliar: Classe i Freq. abs. obs. Freq. abs. esper. sob H 0 Parcelas valor obs. estat. teste i o i E i (o i E i 2 E i (26 5. {} 26 5. 5. 7.868 2 {2} 4 8.8 2.68 3 {3} 6.2 3.76 4 {4} 6 4.8 0.300 5 {5,...,9} 3 5. 9.696 k i o i 50 k i E i 50 t k (o i E i 2 i E i 24.98 Págia 5 de 8
Como t 24.99 W (3.28,+, devemos rejeitar H 0 ao.s. de α 0 % ou qualquer outro.s. superior a α 0 ]. 2. A perda percetual de massa (Y de uma certa substâcia metálica (quado exposta a oxigéio seco a 500 o C depede do período de exposição (x, em hora. Cico medições coduziram a: 5 i x i 2, 5 i x2 i 32.5, 5 i y i 0.77, 5 i y 2 i 0.006789, 5 i x i y i 0.4685, ode mi i,...,5 x i, max i,...,5 x i ].0, 3.5]. (a Calcule as estimativas de míimos quadrados dos parâmetros da reta de regressão liear simples (.5 de Y em x. Estimativas de MQ de β 0 e β Dado que 5 i x i 2 x i x i 2 5 2.4 i x2 i 32.5 i x2 i ( x2 32.5 5 2.4 2 3.7 i y i 0.77 ȳ i y i 0.77 5 0.0354 i y 2 i 0.006789 i y 2 i (ȳ2 0.006789 5 0.0354 2 0.000523 i x i y i 0.4685 i x i y i x ȳ 0.4685 5 2.4 0.0354 0.0437, as estimativas de MQ de β e β 0 são, para este modelo de RLS, iguais a: i ˆβ x i y i xȳ i x2 i ( x2 0.0437 3.7 0.08 ˆβ 0 ȳ ˆβ x 0.0354 0.08 2.4 0.007054 (b Obteha a estimativa de míimos quadrados do valor esperado da perda percetual de massa (.0 quado a substâcia metálica é exposta por um período de 3 horas. Estimativa de MQ para E(Y x 0 β 0 + β x 0 Ê(Y x 0 ˆβ 0 + ˆβ x 0 0.007054 + 0.08 3 0.042487. Não estamos a cometer qualquer erro de extrapolação ao estimar potualmete E(Y x 3 β 0 + β 3 dado que 3 mi i,...,5 x i, max i,...,5 x i ].0, 3.5].] (c Teste a sigificâcia do modelo de regressão liear simples, ao ível de sigificâcia de 5%. Eucie (3.0 as hipóteses de trabalho que assumir. Págia 6 de 8
Hipóteses de trabalho No modelo de RLS, Y i β 0 + β x i + ɛ i, cosideraremos Obs. Pretede cofrotar-se ɛ i i.i.d. Normal(0,σ 2, i,...,. H 0 : β β,0 0 (regressão liear ão é sigificativa, i.e., o valor esperado da variável resposta Y, E(Y β 0 + β x, ão depede liearmete da variável explicativa x H : β β,0 (regressão liear é sigificativa.] Hipóteses H 0 : β β,0 0 H : β β,0 Nível de sigificâcia α 0 5% Estatística de teste ˆβ β,0 T ˆσ 2 i x2 x2 i H0 t ( 2 Região de rejeição de H 0 (para valores de T Estamos a lidar com um teste bilateral (H : β β,0, pelo que a região de rejeição de H 0 é W (, c (c,+, ode c : P(Rejeitar H 0 H 0 α 0 ( c Ft ( 2 α 0 2 c Ft (3 (0.975 c t abel a/calc 3.82 Decisão Tedo em cota que ( ˆσ 2 y 2 i 2 ȳ 2 ( ( ] 2 ˆβ x 2 i x2 i i ( 0.000523 0.08 2 3.7 5 2 2.28368 0 6, o valor observado da estatística de teste é dado por t ˆβ β,0 ˆσ 2 i x2 x2 i 0.08 0 2.28368 0 6 3.7 5.033848. Como t 5.033848 W (, 3.82 (3.82,+, devemos rejeitar H 0 hipótese de iexistêcia de relação de tipo liear etre o valor esperado da variável resposta Y e a variável explicativa x], ao ível de sigificâcia α 0 5% ou a qualquer outro.s. superior 5%]. (d Calcule e iterprete o valor do coeficiete de determiação do modelo ajustado. (.0 Págia 7 de 8
Cálculo do coeficiete de determiação ( r 2 i x i y i x ȳ 2 ( i x2 i x2 ( i y 2 i ȳ 2 0.0437 2 3.7 0.000523 0.987. Iterpretação coeficiete de determiação Cerca de 98.7% da variação total da perda percetual de massa é explicada pelo tempo de exposição, através do modelo de regressão liear simples cosiderado. Assim, podemos adiatar que a recta estimada parece ajustar-se muito bem ao cojuto de dados. Págia 8 de 8