MAE0229 Introdução à Probabilidade e Estatística II

Documentos relacionados
MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

2. Testes de Independência

Professora Ana Hermínia Andrade. Período

MAE0229 Introdução à Probabilidade e Estatística II

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Introdução à probabilidade e estatística II

- Testes Qui-quadrado - Aderência e Independência

- Testes Qui-quadrado - Aderência e Independência

- Testes Qui-quadrado - Aderência e Independência

Análise de Aderência e de Associação

Inferência para duas populações

Teste de Hipóteses Paramétricos

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses Paramétricos

MAE Introdução à Probabilidade e Estatística II Resolução Lista 4

Introdução à probabilidade e estatística II

Testes t para comparação de médias de dois grupos independentes

Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin Estatística Básica 7ª Edição

Testes de Hipóteses Paramétricos

(Hipótese alternativa unilateral)

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

1 Teoria da Decisão Estatística

Unidade IV Inferência estatística

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

Introdução em Probabilidade e Estatística II

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

Introdução a Estatística

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

AULA 05 Teste de Hipótese

X e Y independentes. n + 1 m

Stela Adami Vayego Estatística II CE003/DEST/UFPR

Testes de Hipóteses I

Teste de Hipótese. Capítulo 8 Triola, 10 a. Ed. (Capítulo 7 Triola, 9 a. Ed.) 1 Visão Geral. 2 Fundamentos do teste de hipótese

Prof. Lorí Viali, Dr.

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Estimação e Testes de Hipóteses

Aula 16: Análise de Aderência e Associação

Teste para a Média Populacional com Variância Conhecida

Testes de Hipóteses: exemplos

1 Probabilidade - Modelos Probabilísticos

Intervalos de Confiança

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC

Teste de Hipóteses. Enrico A. Colosimo/UFMG enricoc/ Depto. Estatística - ICEx - UFMG 1/24

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Testes para dados categóricos

Testes de Hipótese para uma única Amostra - parte I

X 2. (σ 2 + µ 2 ) = 1 n (nσ 2 + nµ 2 ) = σ 2 + µ 2. µ = 0 E(T ) = σ 2

Testes de Hipótese PARA COMPUTAÇÃO

Os testes. Objetivos. O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos)

MAE Modelos Lineares Generalizados 2 o semestre 2017

MAE0229 Introdução à Probabilidade e Estatística II

AULA 04 Teste de hipótese

3 2σ 2] = σ 2 C = 1 6

Testes de Hipótese para uma única Amostra - parte II

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Estatística aplicada a ensaios clínicos

Prova # SUB 15 junho de 2015

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

Testes de Hipóteses: Média e proporção

TESTES DE HIPÓTESES. Lucas Santana da Cunha Universidade Estadual de Londrina

Razão para rejeitar H 0

Professora Ana Hermínia Andrade. Período

Testes de Aderência, Homogeneidade e Independência

Distribuições Amostrais - Tamanho da Amostra

Teste Qui-Quadrado Rio de Janeiro, 23 de setembro de 2012

Distribuições por Amostragem

Carlos Antonio Filho

Exercícios Resolvidos

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

- Testes Qui-quadrado. - Aderência e Independência

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

Testes de Aderência, Homogeneidade e Independência

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Estatística Não Paramétrica. Como construir testes de aderência

Testes de Hipótese para uma única Amostra - parte II

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Teste de Hipóteses

7 Teste de Hipóteses

MAE Introdução à Probabilidade e à Estatística II. Lista de Exercícios 5-1 sem de Profa. Lígia Henriques-Rodrigues

TESTES DE HIPÓTESES. HIPÓTESES: São suposições que fazemos para testar a fixação de decisões, que poderão ser verdadeiras ou não.

Introdução em Probabilidade e Estatística II

Teste de hipóteses para proporção populacional p

Testes de Aderência, Homogeneidade e Independência

Final exam June 25, 2007 Statistics II

Probabilidade e Estatística

Probabilidade e Estatística

TESTE DE HIPÓTESES ELISETE AUBIN E MONICA SANDOVAL - IME

Lista de Exercícios #8 Assunto: Teste de Hipóteses

Inferência Estatística Básica. Teste de Hipóteses para uma média populacional Cálculo do Valor p

Princípios de Bioestatística Teste de Hipóteses

Teorema central do limite e es/mação da proporção populacional p

Prof. a Dr. a Simone Daniela Sartorio de Medeiros. DTAiSeR-Ar

5.3 Experimentos fatoriais a dois fatores. Ambos os fatores são supostos fixos e os efeitos de tratamento são definidos como desvios da média tal que

Inferência estatística

Transcrição:

Exercício A fim de comparar os salários médios anuais de executivos e executivas de uma determinada cidade, amostras aleatórias de n = 26 executivos e n 2 = 24 executivas foram coletadas obtendose os valores (em mil USD) para os salários médios amostrais, x = 46, 38 e x 2 = 39, 79, com desvios padrão amostrais S = 2, 06 e S 2 = 0, 40, respectivamente. (a) Testar inicialmente a homogeneidade de variâncias ao nível de significância de 5% (b) Aplicar um teste apropriado para a comparação das médias, ao nível de 5%. (c) Apresente uma estimativa intervalar de 95% para a diferença entre as médias salariais dos dois grupos. Sugestão: estabeleça para cada caso as hipóteses que estão sendo testadas com os correspondentes erros, as estatísticas dos testes e decida com base no valor-p Nesse problema temos que n = 26, n 2 = 24, x = 46, 38 e x 2 = 39, 79. Além disso, vamos supor que X N ( µ, σ 2 ) e X2 N ( µ 2, σ 2 2) em que X e X 2 representam os salarios anuais dos executivos e das executivas da cidade, respectivamente. Assim, temos o seguinte: (a) O interesse é testar as hipóteses H : σ 2 = σ2 2 A : σ 2 σ2 2. Para as hipóteses acima, os erros associados são: Erro tipo : Erro tipo 2: Rejeitar incorretamente a homogeneidade de variâncias. Não detectar que as variâncias são diferentes. Também, sabemos que, supondo H verdadeira W = S2 S 2 2 F 25, 23, e uma região crítica para rejeitar H para un nivel de significancia α fica dada por RC = { W f, W f }, em que f é obtido tal que P ( F 25, 23 f ) = α. Segundo as informações amostrais temos 2 que S 2 = (2, 06)2 = 45, 44 S 2 = (0, 40)2 = 08, 6 W = S2 S 2 2 =, 344. Página de 8

Agora, note que o valor critco f = 2, 287, pois P ( F 25,23 > f ) = 0.025. Por tanto note que não podemos rejeitar H pois W < 2, 287. Além disso, é possível notar que P ( F 25, 23 >, 344 ) = 0.24 e portanto o valor-p associado a, 344 é dado por 2 0, 24 = 0, 48 (teste bilateral). Veja que P valor > α = 0, 05 e portanto não temos evidencias para rejeotar H. (b) Agora, o interesse é testar as hipóteses H : µ = µ 2 A : µ µ 2. Para as hipóteses acima, os erros associados são: Erro tipo : Rejeitar incorretamente a homogeneidade de medias. Erro tipo 2: Não detectar que as medias dos salários anuais são diferentes para executivos e executivas. Como anteriormente a hipótese de variâncias iguais não foi rejeitada, podemos usar a estatistica X X 2 T = S p +, n n 2 em que S 2 p = { (n ) S 2 X + (n 2 ) S 2 X 2 } / (n + n 2 2). Em particular, para nosso caso, temos que S p =, 538 e t = 2,. O valor crítico é dado por t c = 2, 0, pois P (t 46 > t c ) = 0, 025. Como t > 2.03, rejeitamos a hipótese nula. Além disso, o valor-p associado a 2, é dado por 2 P (t 48 > 2.) = 0.04 e como valor P < α = 0, 05, rejeitamos a hipótese nula H. (c) Uma estimativa intervalar de 95% para a diferença entre as médias salariais dos dois grupos é dada por x x 2 ± t c S p n + n 2, em que P (t 48 > t c ) = 0, 025. Assim, temos que x x 2 ± t c S p n + n 2 = [46, 38 39, 79 ± (2, 0) (, 538) (0, 283) ] = [6, 59 ± 6, 56] = [0.03; 3, 5]. Exercício 2 Dois municípios A e B sempre tiveram rendas per capita domiciliares muito parecidas, contudo acredita-se que a renda per capita do município B deve ter superado a renda per capita do município A em virtude de vários investimentos ocorridos no último ano na geração de empregos. Para avaliar essa suspeita foram amostrados n A = 200 domicílios do município A e n B = 80 Página 2 de 8

domicílios do município B, obtendo-se os valores amostrais (em unidades monetárias) x A = 680, x B = 75, s A = 80 e s B = 40, respectivamente. Supondo que as variâncias populacionais não são diferentes aplique (a) um teste de hipóteses apropriado estabelecendo quais são as hipóteses que estão sendo testadas, (b) os erros correspondentes, (c) decida através do valor-p. (a) Sejam as variáveis aleatórias X A e X B, a rendas per capita domiciliares dos municipios A e B, respectivamente. Suponha que X A N(µ A, σ 2 A ) e X B N(µ B, σ 2 B ), em que µ A e µ B são as rendas médias per capita, σ 2 A e σ2 as variâncias correspondentes aos municipios A e B. B Assim, as hipóteses de interesse são: H : µ B = µ A (Homogeneidade de médias) A : µ B > µ A. (b) Os erros correspondentes as hipóteses do item (a) são Erro de tipo I: Rejeitar incorretamente a homogeneidade de médias. Erro de tipo II: Não detectar que a renda média per capita do municipio B é superior à renda média do municipio A. (c) Asumindo que σ 2 A e σ2 são desconhecida, mas iguais, a estatística de teste adequada para B testar as hipóteses acima é T = X B X A S p, n A + n B em que S 2 p = (n B )S 2 B + (n A )S 2 A e o valor-p é calculado por P = P ( t (nb +n n B + n A 2 A 2) T ). Substituindo os valores das médias e das variâncias amostrais dos dois municipios obtemos S 2 p = (80 ) (40)2 + (200 ) (80) 2 = 26338, 62. 80 + 200 2 T = 75 680 26338, 62 80 + 200 35 = 62, 29 80 + 200 2, 0. Logo, P = P ( t (38) 2, 0 ) = 0, 082. Adotando α = 0, 05 temos que valor-p< α, então há evidências suficentes para rejeitar a hipóteses de homogeneidade de médias, e portanto a renda per capita do municipio B é maior a renda per capita do municipio A, com um nível de significância do 5%. Página 3 de 8

Exercício 3 Uma região do país é conhecida por ter uma população obesa, particularmente a população masculina entre 20 e 30 anos. Um endocrinologista propõe um tratamento para combater a obesidade que consiste de exercícios físicos, dietas e ingestão de um medicamento. Com esse tratamento o médico afirma que o peso médio deve diminuir no período de três meses. Esse tratamento foi aplicado numa amostra aleatória de n = 0 homens na faixa etária de 20 a 30 anos obtendo-se os pesos (em kg) abaixo: Antes da Dieta 95 88 85 77 92 83 75 00 89 9 Depois da Dieta 90 85 83 78 87 85 78 92 83 84 Aplique um teste t-pareado e verifique se houve redução do peso médio ao nível de 0%. Considere que X,..., X 0 são os pesos dos 0 homens da faixa etária de 20 a 30 anos antes de iniciar a dieta proposta pelo endocrinologista, e que Y,..., Y 0 são os respectivos pesos destes homens depois aplicar a dieta. Assim, (X i, Y i ) corresponde ao peso do i-ésimo homen nas duas ocasiões, i =,..., 0. Suponha que X i N(µ X, σ 2 X ) e Y i N(µ Y, σ 2 Y ), então definindo D i = Y i X i temos que D i N(, σ 2 D ), em que = µ Y µ X e σ 2 D = σ2 Y + σ2 X 2ρσ Yσ X, p = Corr(Y, X). Logo, as hipóteses que desejamos testar são Ou equivalentemente, H : i = 0 A : i < 0. H : µ Y = µ X (Homogeneidade de médias) A : µ Y < µ X. Como as medidas dos pesos nas duas ocasiões são sobre cada homen, as amostras são pareadas, portanto a estatística adequada para testar as hipóteses de interesse é Dos dados amostrais segue que T = d n n, d = Y X, S 2 S d = i= d2 nd 2 i. d n X = n n X i = 87, 5 i= d = 84, 5 87, 5 = 3 Y = n Substituindo estes valores na estatística de teste obtemos S 2 D n Y i = 84, 5 i= = 226 0 ( 3)2 0 5, T = 3 0 5, 2, 44. Página 4 de 8

O valor-p é calculado por P (t 9 2, 44) = 0, 087. Adotando α = 0, 0, valor-p< α, então há evidências fortes na amostra para rejeitar a hipóteses de homogeneidade de médias, portanto o tratamento para combater a obesidade diminui o peso médio dos homens. Exercício 4 Ministério da Saúde deseja saber se a preferência por Aspirina ou Dipirona Sódica é a mesma entre homens e mulheres adultos. Uma amostra aleatória de n = 380 mulheres foi consultada dentre as quais 228 disseram preferir Dipirona Sódica. Uma outra amostra aleatória de n 2 = 420 homens foi consultada sendo que 20 disseram ter preferência por Dipirona Sódica. (a) Formule este como sendo um problema de teste de hipóteses especificando as hipóteses apropriadas. (b) Decida através do valor-p. (a) Denotando por X o número de mulheres adultas que têm preferência pela Aspirina e por Y o número de homens que têm preferência pela Aspirina; e supondo que X B(n, p ) e Y B(n 2, p 2 ), em que p é a probabilidade da mulher ter preferência por Aspirina e p 2 a probabilidade de um homen ter preferêcia por Aspirina, as hipóteses de interesse são H : p = p 2 (Homogeniedade de proporcoes) A : p p 2 (b) Para testar as hipótesis acima usaremos a estatística Z = Conforme o enunciado temos que ˆp ˆp 2 ˆp( ˆp) ( ), ˆp = n + n 2 n ˆp + n 2 ˆp 2 n + n 2 ˆp = 228/380 = 0, 60. ˆp 2 = 20/420 = 0, 50. ˆp ˆp 2 = 0, 60 0, 50 = 0, 0. 380 0, 60 + 420 0, 50 ˆp = = 0, 5475. 380 + 420 Assim, o valor da estatística de teste é Z = 0, 0 0, 5475( 0, 5475) ( 380 + ) 2, 84. 420 como n e n 2 são grandes, pelo TLC temos que Z N(0, ), então o valor-p é dado por P(Z 2, 84), mas como a hipóteses é bilateral, o cálculo do valor-p é 2 P(Z 2, 84), assim P = 2 P(Z 2, 84) = 2 { P(Z < 2, 84)} = 2 { 0, 9977} = 0, 0046. Página 5 de 8

Adotando α = 0, 05 temos que valor-p< α, então temos evidência suficente nas amostras para rejeitar a hipóteses nula e portanto a preferência por Aspirina é diferente entre homens e mulheres. Exercício 5 Uma pesquisa foi conduzida para verificar se a opinião do eleitor a um novo projeto de governo é independente da faixa etária. Para isso, tomou-se uma amostra aleatória de n = 250 eleitores que foram classificados segundo a tabela a seguir: Opinião Faixa Etária Contra A Favor Indeciso Total < 25 anos 40 0 50 00 25 anos 60 40 50 50 Total 00 50 00 250 (a) Formule as hipóteses H e A e os erros correspondentes. (b) Obtenha as frequências relativas para cada faixa etária e comente. (c) Aplique um teste estatístico apropriado e decida a partir do valor-p. (a) As hipóteses que desejamos testar são: H : Independência entre a opinião do eleitor e a faixa etária. A : Ausência de indepêndencia entre a opinião do eleitor e a faixa etária. Os erros correspondentes a essas hipóteses são: Erro de tipo I: rejeitar incorretamente que há independencia entre a opinião do eleitor e a faixa etária. Erro de tipo II: não detetar que há ausencia de independência entre a opinião do eleitor e a faxia etária. (b) As frequências relativas para cada faixa etária estão dadas na seguinte tabela Faixa Etária Opinião Contra A favor Indeciso Total < 25 anos 40% 0% 50% 00% 25 anos 40% 26,7% 33,3% 00% Com base nestes resultados podemos podemos observar que Dentre os eleitores menores a 25 anos, apenas 0% esta a favor do novo projecto do governo, enquanto que dos eleitores cuja idade é maior ou igual a 25 anos essa porcentagem é de 26,7%. Página 6 de 8

Dentre os eleitores cuja idade é maior ou igual a 25 anos, apenas o 33,3% esta indeciso com o novo projeto do governo, enquanto que dos eleitores menos a 25 anos essa porcentagem é de 50%. (c) Para testar as hipóteses estipuladas no item (a) usamos a estatística do tipo qui-quadrado: χ 2 = r i= ( ) 2 s Oij E ij, E ij j= em que r e s denotan o número de linhas e de colunas da tabela de contigência, respectivamente; O ij é o valor observado na (i, j)-ésima casela e E ij o valor esperado sob H na (i, j)-ésima casela e obtido por E ij = n ˆp i. ˆp.j = n i.n.j n, em que n i. é o total da i-ésima linha e n.j o total da j-ésima coluna. Na seguinte tabela se encontram exibidos os valores observados e seus correspondentes valores esperados sob H certa Valores observados Valores esperados O, = 40 E, = (00 00)/250 = 40 O,2 = 0 E,2 = (50 00)/250 = 20 O,3 = 50 E,3 = (00 00)/250 = 40 O 2, = 60 E 2, = (00 50)/250 = 60 O 2,2 = 40 E 2,2 = (50 50)/250 = 30 O 2,3 = 50 E 2,3 = (00 50)/250 = 60 Logo, o valor da estatística qui-quadrado é χ 2 (40 40)2 (0 20)2 (50 40)2 = + + 40 20 40 (60 60)2 (40 30)2 (50 60)2 + + + 60 30 60 = 0 + 5, 00 + 2, 5 + 0 + 3, 3 +, 7 = 2, 5. Sabemos que sob H e para n grande, χ 2 χ 2 q, em que q = (r )(s ); neste caso temos r = 2 e s = 3, então q = 2. Logo, o valor - P do teste é P = P ( χ 2 2 2, 5) = 0, 0093. Adotando α = 0.05, temos que P < α, portanto rejeitamos H e concluimos que há ausencia de indêndencia entre a opinião do leitor e a faixa etária. O procedimento no R é como segue opiniao<-matrix(c(40,60,0,40,50,50),ncol=3) Página 7 de 8

colnames(opiniao) = c("contra","a favor","indeciso") rownames(opiniao) = c("<25", ">=25") opiniao Contra A favor Indeciso <25 40 0 50 >=25 60 40 50 chisq.test(opiniao) Pearson s Chi-squared test data: opiniao X-squared = 2.5, df = 2, p-value = 0.0093 Página 8 de 8