Teste de hióteses ara médias e roorções amostrais Prof. Marcos Pó Métodos Quantitativos ara Ciências Sociais
Questão rática Abrir a lanilha Alunos MQCS_16-18 e calcular a média, o desvio adrão e o tamanho da amostra dos alunos no geral e ara cada turma. Diurno Noturno Total Geral Média (cm) Desvio Padrão (cm) Considerando que segundo o IBGE* a mediana de alturas da oulação entre 20 e 29 anos é de 173cm e que é válido assumir esse valor como equivalente à média, odemos afirmar que: (a). Os alunos de MQCS são mais baixos que a oulação brasileira? (b). Os alunos de elo menos uma das turmas são mais baixos que a oulação brasileira? n * htt://www.ibge.gov.br/home/estatistica/oulacao/condicaodevida/of/2008_2009_encaa/tabelas_df/tab1_1.df, acesso em 07/03/2016 2
Questão rática Abrir a lanilha Alunos MQCS_16-18 e calcular a média, o desvio adrão e o tamanho da amostra dos alunos no geral e ara cada turma. Média (cm) Desvio Padrão (cm) Diurno 166,5 9,40 101 Noturno 169,1 12,00 93 Total Geral 167,8 10,87 194 Considerando que segundo o IBGE* a mediana de alturas da oulação entre 20 e 29 anos é de 173cm e que é válido assumir esse valor como equivalente à média, odemos afirmar que: (a). Os alunos de MQCS são mais baixos que a oulação brasileira? (b). Os alunos de elo menos uma das turmas são mais baixos que a oulação brasileira? n * htt://www.ibge.gov.br/home/estatistica/oulacao/condicaodevida/of/2008_2009_encaa/tabelas_df/tab1_1.df, acesso em 07/03/2016 3
Hiótese estatística Hiótese é uma exlicação rovisória roosta ara um fenômeno, assível de ser demonstrada ou testada. Hiótese estatística é uma afirmação sobre um arâmetro oulacional, a ser testada com base em estatísticas amostrais: H 0 - Hiótese nula: normalmente é uma afirmação de igualdade. É nula no sentido de significar que o fenômeno investigado não está ocorrendo e que os valores amostrais encontrados são exlicados aenas or acasos amostrais. H A - Hiótese alternativa: é o comlemento da hiótese nula e significa que os valores encontrados naquela amostra são tão raros que rovavelmente devem-se ao fato de tratarmos de duas oulações diferentes. 4
Teste estatístico de hiótese Processo que usa estatísticas amostrais ara testar uma afirmação sobre um arâmetro de uma oulação. É uma metodologia ara julgar se os dados amostrais trazem evidências que aoiem ou refutem uma hiótese quantitativa, assim como ermite estimar a robabilidade de cometer determinados tios de erro nesse julgamento. Ele nos fornece uma regra de decisão em relação a uma afirmação com base nas robabilidade de erro que odemos incorrer. Ou seja, nos ermite resonder com algum grau de confiança: essa evidência ode nos convencer que a hiótese está errada? 5
6
Tios de erro de decisão em um TH Julgamento Erro Tio I: rejeitar uma hiótese verdadeira. Erro Tio II: aceitar uma hiótese falsa. Realidade Verdadeiro Falso Verdadeiro Erro Tio II Falso Erro Tio I 7
Erro Tio I: rejeitar uma hiótese verdadeira A robabilidade de incorrermos nesse erro é denominada α e é chamada de nível de significância do teste, ou seja, o resultado da amostra é tanto mais significante ara rejeitar H 0 quanto menor for o valor de α Normalmente α é fixado em: 10% 5% * Evento raro 1% ** Evento raríssimo 0,1% *** Evento raríssimo O alfa (α) é um valor definido arbitrariamente elo esquisador. 8
Exemlo de raridade Como sabemos que determinado card de Pokémon é raro? 9
Erro Tio II: aceitar uma hiótese falsa A robabilidade de se incorrer no Erro Tio II é denominada β (beta). Nem semre conseguimos determinar ou definir β em um teste de hiótese, ois normalmente a Hiótese Alternativa de um roblema não contém muitos elementos. 10
Exemlo de erros de decisão Uma cooerativa retende usar um novo tio de vergalhões em suas obras. Haverá um leilão de um lote, orém não se sabe se são do tio antigo ou do novo. Antes do leilão será disonibilizado o resultado do teste de resistência à tração de uma amostra aleatória de 16 eças. Os arâmetros de cada tio são mostrados na tabela. (a). Se a regra de decisão fosse: caso o resultado do teste seja inferior à 1500kg, considero que os vergalhões são do tio antigo e não comro; se for maior que 1500kg considero serem novos e comro, verifique a robabilidade dos seguintes erros: Tio I: dizer que os vergalhões são antigos quando na realidade são novos. Tio II: dizer que os vergalhões novos, quando na verdade são antigos. (b). Qual deveria ser a regra de decisão se desejarmos que o risco de comrar eças antigas seja menor que 5%? Tio Resistência à tração Desvio-adrão Antigo 1.400 kg 300 kg Novo 1.600 kg 250 kg 11
Como escolher o erro que aceitamos cometer? Ao se diminuir a robabilidade de Erro I, aumenta-se a chance de Erro II. Para escolher que risco queremos correr é necessário analisar qual seria mais rejudicial ara a esquisa e ara os seus ossíveis imactos. Ex.: Por causa de um erro amostral excessivo seria mais grave considerar que...... há ou não diferenças no desemenho acadêmico de estudantes de acordo com o gênero?... há ou não diferenças no desemenho de motoristas que tomam bebidas alcoólicas? 12
Teste de hiótese = decisão com base em evidências A artir de qual nível de evidência oderíamos julgar com segurança que determinado suseito cometeu o crime? 1. Ele estava na cidade no dia do crime. 2. Ele tinha motivos ara querer matar a vítima. 3. Não aresentou um álibi convincente. 4. Ele ossuía uma arma do mesmo calibre da utilizada no crime. 5. Foi filmado entrando e saindo do local do crime. Prof. Marcos Vinicius Pó Ícone: Aldric Rodríguez, The Noun Project 13
Regra de decisão: Região Crítica Testar uma hiótese significa verificar se a nossa evidência amostral é tão forte (= tão imrovável) a onto de odermos rejeitar a Hiótese Nula. Para isso estabelecemos um intervalo de valores em que consideraremos haver elementos suficientes ara fazer essa rejeição. Esse intervalo de rejeição de H 0 é chamado região crítica. Se a estatística do teste cair na região crítica, rejeita-se H 0, ou seja, consideramos que há forte evidência de H 0 ser falsa e que odemos aceitar a H A. Esse risco é o nosso alfa (). Quando a evidência estatística não cair na região crítica dizemos que não houve evidência amostral significativa ara rejeitar H 0. 14
Probabilidade de significância (-valor) Invés de se definir arbitrariamente um valor ara α, um rocedimento alternativo consiste em determinar a robabilidade de significância, ou -valor do teste. Nesse caso, em vez de se calcular a região crítica ara aceitar ou rejeitar a hiótese, calcula-se qual a robabilidade de ocorrerem ^ valores ara x ou mais desfavoráveis à H 0. A seguir julga-se se tal valor consiste em um evento raro. Em muitos casos, em vez de se determinar simlesmente se H 0 é rejeitada, diz-se que H 0 é rejeitada a um determinado nível de - valor. 15
Roteiro ara o teste de hiótese 1. Definir as hióteses. Nula (H 0 ) Alternativa (H A ) 2. Esecificar as evidências estatísticas que serão usadas. Estimadores Proriedades da estatística (distribuição, média, desvio-adrão...) 3. Fixar a robabilidade de cometer o Erro Tio I (α) e esecificar a regra de decisão. Referência ara aceitar ou rejeitar a hiótese (região crítica) 4. Areciar a evidência. 5. Decidir e interretar o resultado. 16
Usar t ou z ara teste de hiótese? Se conhecermos o desvio-adrão da oulação (σ), ode-se usar a distribuição z. Caso não se conheça σ, temos que usar o s da amostra ara determinar o intervalo de confiança. Assim, segue-se a mesma regra que ara intervalos de confiança: Amostras grandes: nesse caso ode-se considerar que a amostra aroxima-se da normal Amostras equenas: usar a distribuição t de Student 17
TESTE DE HIPÓTESE DE MÉDIAS PARA DUAS POPULAÇÕES 18
Teste de hióteses da média de duas oulações Objetivo: testar hióteses que comaram médias de duas amostras, ossivelmente de oulações distintas. Tios de amostras: Indeendentes: não há relação entre as amostras selecionadas em cada oulação Deendentes: cada membro de uma amostra corresonde a um membro da outra amostra. Também chamadas de emarelhadas ou relacionadas. Poulação 1 (μ 1 ; σ 1 )? Amostra (m, Y, s)? Amostra (n, X, s) Poulação 2 (μ 2 ; σ 2 ) 19
Testes ossíveis Diferença entre médias Diferença entre desvios-adrão (será tratado juntamente com ANOVA) 20
Considerações: teste de médias Poulações: Normais (= distribuição amostral da média) Homocedásticas (σ X = σ Y = σ) Lembrar que: E( X Y) E( X ) E( Y) E( X Y) E( X ) E( Y) Var ( X Y) Var ( X ) Var ( Y) 2 Var ( k X ) k Var ( X ) 21
Amostras indeendentes Podemos definir um intervalo de confiança da diferença da média das amostras X e Y, com n e m elementos resectivamente. E( X Y) ~ N0; 2 2 X Y n m Z X Y 2 2 X Y n m Como as oulações são homocedásticas odemos simlificar: z s X Y 1. n 1 m Caso seja usada a distribuição t, os graus de liberdade serão ν = n+m-2 22
IC do teste da diferença de duas médias 4 2 1 8 N(0,1) 6 4 2 2 1 2 0 - -z z + 0 0 5 10 15 20 E( X Y ) Var( X Y ) Var( X ) Var( Y ) 0 z s X Y 1. n 1 m
Amostras deendentes Nesse caso, a quantidade de elementos de X e Y são iguais (n). As amostras odem ser entendidas como ares (X 1 -Y 1,..., X n - Y n ) e, assim, odemos definir a variável D = X Y, resultando na amostra D 1,...,D n. Dessa forma, reduzimos o roblema a uma única oulação e amostra, com as seguintes características: D 1 n n i 1 X Y X i Y i S 2 D 1 n 1 n i1 Di D 2 24
Teste de hiótese ara roorção Idêntico ao teste de médias, considerando que a estatística tem distribuição aroximadamente normal. n N ) (1, ~ ˆ 25 m n N E ) (1 ) (1 0; ~ ) ˆ ˆ ( 2 2 1 1 2 1 m n Z ) (1 ) (1 ˆ ˆ 2 2 1 1 2 1 ^
Exemlo: amostra x oulação 1. Mediu-se as alturas de 30 recém-nascidos no deartamento de ediatria de um hosital, obtendo-se uma média de 49cm e um desvioadrão de 2,8cm. Teste a hiótese de que a média dos recém-nascidos seja de 51cm conforme o eserado elos adrões da OMS, admitindo o risco de 5% de cometer o erro tio I. 26
Exemlo: diferença entre amostras 2. Uma rede de suermercados testou duas estratégias diferentes de venda em lojas de mesmo orte e erfil do úblico. Para comará-las utilizaram-se amostras de 50 clientes, obtendo-se as médias de gasto resectivamente em R$62 e R$71. Sabendo-se que o desvio-adrão em ambos os casos é de R$20, é ossível afirmar que o gasto médio das duas filiais é o mesmo? Caso contrário, dê um intervalo de confiança ara a diferença. Cena de mercado. Século 15 www.wga.hu 27
Exemlo: roorção x oulação (baseado em fatos reais) 3. Desconfiada dos resultados do sorteio de gruos realizado or seu rofessor de Métodos Quantitativos, a aluna R. resolveu testar o dado utilizado fazendo 600 lançamentos, onde o lado três foi sorteado 123 vezes. (a) Qual o -valor do teste? (b) Podemos afirmar, ao nível de 5%, que o dado é viciado em relação ao lado 3? (c) Podemos afirmar que o dado é viciado ao nível de 1%? 28
Exemlo: amostras areadas 4. Uma lanchonete quer saber se a introdução de uma ausa afeta a rodutividade dos seus funcionários. Para isso verificou o total de lanches roduzidos or cada um de seus 6 chaeiros ao longo de dias aletaórios sem e com o intervalo. Os resultados indicam que há melhora na rodutividade? Chaeiro Sem intervalo Com intervalo Diferença (Sem-Com) 1 23 28-5 2 35 38-3 3 29 29 0 4 33 37-4 5 43 42 1 6 32 30 2 média 32,5 34-1,5 dad 6,63 5,76 2,88 29