Testes de hipóteses Paramétricos Modelos de análise de variância com um factor Teste de Bartlett Teste de comparações múltiplas de Scheffé Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 1 / 18
Análise de Variância:Introdução A análise de variância simples paramétrica (ANOVA) é uma extensão do teste para a diferença de médias aplicado a mais de duas amostras independentes. Pretende-se analisar o comportamento de uma variável (quantitativa)- variável dependente ou variável a explicar - em função de outra variável (qualitativa) -variável independente ou explicativa, permitindo comparar médias, em mais de dois grupos distintos e independentes, de uma mesma variável quantitativa. Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 2 / 18
Nesta situação temos: X 11, X 12,..., X 1n1 X 21, X 22,..., X 2n2 X k1, X k2,..., X knk k grupos (tratamentos). O grupo i tem n i observações N = k i=1 n i é o número total de observações X ij representa a j-ésima observação do i-ésimo grupo Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 3 / 18
O modelo ANOVA pressupõe que cada observação pode ser modelada pela expressão onde Notas: X ij = µ i + ɛ ij = µ + τ i + ɛ ij, i = 1,..., k; j = 1,..., n i µ i representa a média do grupo i µ representa a média de todos os grupos τ i representa a diferença entre a média total e a média do grupo i ɛ ij representa o erro aleatório da observação (i, j) Para que τ i represente o desvio do grupo i à média total µ os valores de τ i devem verificar k i=1 τ i = 0 Neste modelo assume-se que os erros ɛ ij Gau(0, σ 2 ) Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 4 / 18
Hipóteses: Nota: H 0 : µ 1 = µ 2 =... = µ k = µ H 1 : µ i µ pelo menos para um valor de i ( i, j : µ i µ j, i j, i, j = 1,..., k) Se H 0 for válida os grupos têm todos a mesma média µ e cada observação não é mais do que uma variável com distribuição Gau(µ, σ 2 ). Representemos por n i X i = 1 X ij, n i j=1 a média das observações do grupo i X = 1 k n i X ij, a média de todas as observações N i=1 j=1 Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 5 / 18
Ou seja, O método da análise de variância paramétrica baseia-se na estimação da variação ou variabilidade total (TSS) de um conjunto de observações, decompondo-a em duas componentes independentes: variabilidade devida às diferenças entre grupos (SST-Sum of Squares Treatment ou BSS-Between Sum of Squares); variabilidade dos erros ɛ ij dentro de cada grupo (SSE-Sum of Squares Error ou WSS-Within Sum of Squares) k n i (X ij X ) 2 = i=1 j=1 k k n i ( X i X n i ) 2 + (X ij X i ) 2 i=1 i=1 j=1 Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 6 / 18
Simbolicamente, TSS = SST + SSE onde TSS = k n i (X ij X ) 2 -soma dos quadrados total i=1 j=1 SST = k n i ( X i X ) 2 i=1 -soma dos quadrados entre grupos SSE = k n i (X ij X i ) 2 -soma dos quadrados dentro de cada grupo i=1 j=1 Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 7 / 18
Definindo, verifica-se que: MST = SST k 1 e MSE = SSE N k, MSE é um estimador centrado de σ 2 independentemente de H 0 sob H 0, MST também é um estimador centrado de σ 2 A ideia de base da ANOVA é que: se H 0 for verdadeira MST e MSE devem ser próximos (porque estimam a mesma quantidade) e, portanto, a sua razão deve ser próxima da unidade se H 1 for verdadeira MST terá um valor inflacionado e ao dividir por MSE tenderá a produzir um valor significativamente superior à unidade Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 8 / 18
Estatística de Teste: F = MST MSE F k 1,N k Critério de Rejeição: Rejeita-se H 0 ao nível de significância α quando F > F k 1,N k;1 α Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 9 / 18
Tipicamente uma ANOVA de efeitos fixos é resumida numa tabela do seguinte tipo: Quadro ANOVA Soma de Graus de Média dos Fonte de variação Quadrados Liberdade Quadrados F p-value MST Entre grupos SST k 1 MST MSE Dentro dos grupos SSE N k MSE Total TSS N 1 Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 10 / 18
Exercício (7.4) O tempo médio despendido a atender os pacientes por três psicólogos cĺınicos foi registado no quadro seguinte: Psicólogo Tempo da consulta (min) 1 25 33 18 17 19 2 28 27 35 35 32 3 30 19 32 18 23 Pretendemos saber se o tempo médio despendido a atender os pacientes é igual nos três psicólogos cĺınicos? Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 11 / 18
Exercício (7.5) De um estudo de mercado, cujo objectivo principal era detectar as diferenças de comportamento dos leitores de três semanários (Expresso, Sol e Semanário), retiraram-se os seguintes resultados relativos ao tempo de leitura (em minutos) de cada leitor. Semanários Observações Expresso Sol Semanário 1 100 80 62 2 110 70 65 3 85 65 68 4 60 75 75 5 95 69 80 6 96 91 70 7 78 8 120 Pretende-se saber se, nas populações onde se retiraram estas amostras (leitores do Expresso, Sol e do Semanário), os tempos médios de leitura de jornal são idênticos ou não. Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 12 / 18
Teste de Bartlett (homocedasticidade) Na aplicação da ANOVA assume-se que as variâncias entre os vários grupos é igual. Para testar a validade desta hipótese utiliza-se o teste de Bartlett. Hipóteses: Estatística de Teste: sendo H 0 : σ 2 1 = σ2 2 =... = σ2 k H 1 : i, j : σ 2 i σ 2 j (i j, i, j = 1,..., k) B = 1 C C = 1 + { (N k) ln S 2 k } (n i 1) ln Si 2 i=1 { k 1 1 3(k 1) n i 1 1 }, N k i=1 Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 13 / 18
Teste de Bartlett (homocedasticidade) Nota: S 2 i = 1 n i 1 S 2 = 1 N k n i j=1 (X ij X i ) 2 - variância da amostra i k (n i 1)Si 2 - variância total i=1 Verifica-se facilmente que S 2 = MSE Quando os grupos populacionais seguem uma distribuição gaussiana e para n i 6 B χ 2 k 1 Critério de Rejeição: Rejeita-se H 0 ao nível de significância α quando B χ 2 k 1;1 α Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 14 / 18
Teste de Bartlett (homocedasticidade) Nota: O teste de Bartlett é muito sensível ao facto das variáveis serem gaussianas. Caso haja dúvidas sobre esta situação é aconselhável o uso do teste de Levene. Exercício (7.6) Tendo em conta os dados do exercício 7.4 poder-se-á admitir que a variabilidade dos tempos de consulta é idêntica para os três psicólogos (α = 0.05)? Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 15 / 18
Teste de comparações múltiplas de Scheffé Quais a médias significativamente diferentes entre si? Para responder a esta questão vamos utilizar o teste de Scheffé Hipóteses: H 0 : µ i = µ j H 1 : µ i µ j, i j Estatística de Teste: T S = X i X j S 2( 1 n i + 1 ) n j (k 1)F k 1,N k Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 16 / 18
Teste de comparações múltiplas de Scheffé Critério de Rejeição: Rejeita-se H 0 ao nível de significância α quando T S > (k 1)F k 1,N k;1 α ou ainda quando X i X j > S 2 ( 1ni + 1nj ) (k 1)F k 1,N k;1 α Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 17 / 18
Teste de comparações múltiplas de Scheffé Exercício (7.7) Relativamente ao exercício 7.5, identifique os pares de médias diferentes, usando o teste de Scheffé. Rita Brandão (Univ. Açores) Testes de hipóteses Paramétricos 18 / 18