Testes de hipóteses Sua aplicações e limites. Testes de hipóteses Sua aplicações e limites. A importância da Estatística

Tamanho: px
Começar a partir da página:

Download "Testes de hipóteses Sua aplicações e limites. Testes de hipóteses Sua aplicações e limites. A importância da Estatística"

Transcrição

1 Testes de hipóteses Sua aplicações e limites Testes de hipóteses Sua aplicações e limites Seminários de métodos e análise de dados Enquadramento dos Testes de Hipóteses na Estatística Doutoramento em Psicologia Fevereiro 2010 Luís Faísca A importância da Estatística Divisão clássica da Estatística Representação matemática do real Estatística descritiva MUNDO REAL NÚMEROS Análise estatística Estatística Estatística indutiva (ou inferencial) (objecto de estudo) (representação matemática) A importância da Estatística Estatística descritiva POPULAÇÃO (estudantes da UALG) amostragem Aquilo que se conhece através amostra da Estatística Descritiva 100 alunos inquiridos Conjunto de procedimentos para organizar e sumariar a informação de uma forma tão breve e precisa quanto possível. Inferência Aquilo que se pretende conhecer Generalizar com segurança para a população a descrição obtida na amostra 1

2 Aplicações da estatística descritiva Descrição univariada Análise descritiva (uni e bivariada) Aptidão Numérica em estudantes do 9º ano N = 10 alunos; aptidão numérica medida pela GATB Descrever e resumir conjuntos volumosos de dados Gráficos / Tabelas / Estatísticas descritivas Análise descritiva (multivarida( multivarida) Representações gráficas multidimensionais Redução da dimensionalidade dos dados Descrição univariada Descrição bivariada Existe relação entre a nota de ingresso do aluno num curso de licenciatura e resultado que ele obtém no primeiro teste efectuado na Universidade? Média = 3,19 Desvio-padrão = 9,00 Mediana = 37 Mínimo = 17 Máximo = Estatística descritiva univariada Descrição bivariada Descrição multivariada Caracterizar relação entre diversas variáveis veis Teste 1 = - 8,72 + 1,24 * Nota ing R 2 = 28,6 % Estatística descritiva bivariada Será possível distinguir tipos de dificuldades de aprendizagem a partir de uma bateria de doze testes de avaliação? N = 10 estudantes com problemas de aprendizagem Técnica de análise Q 2

3 Descrição multivariada Descrição multivariada 8 7 S08 6 S04 S10 S09 4 S02 S0 3 2 S07 S01 S03 S06 1 Estatística descritiva multivariada (análise de clusters) Estatística descritiva multivariada (escalonamento multidimensional) Estatística indutiva Erros envolvidos no estudo de amostras e de populações Conjunto de procedimentos usados para fazer inferências a partir de informação parcial, avaliando o grau de incerteza envolvido da generalização. Aplicações da estatística indutiva Estimação de parâmetros (valores desconhecidos da população) Análise inferencial Estimação intervalar Testes de hipóteses Modelação Qual a percentagem de estudantes universitários dispostos a experimentar drogas duras? Amostra representativa da população, controlando variáveis consideradas importantes (amostra estratificada, e.g.) Questionário adequado a este tema sensível e contabilização das respostas Dos 30 estudantes inquiridos, 24 disseram que Sim 3

4 Estimação de parâmetros Testes de hipóteses Há 9% de confiança de que a percentagem de estudantes dispostos a experimentar drogas duras se situa entre 4,21% e 9,1% População Amostra 6,86% de respostas Sim (N = 30) Estatística indutiva - estimação Avaliar se as diferenças observadas na amostra reflectem diferenças reais na população ou se, pelo contrário, rio, se devem ou não ao acaso. Teste de hipóteses a) Formular uma hipótese b) Recolher dados amostrais para verificar se apoiam ou não a hipótese c) Avaliar o grau em que esse apoio se pode dever ao acaso Testes de hipóteses Modelação A presença de ruído ambiental afecta a memorização de um texto? Hipótese (nula): a memorização de um texto é tão boa em silêncio como em condições de ruído Explicitar as relações que se estabelecem num conjunto alargado de variáveis. Itens corretamente evocados (%) Silêncio Ruído Condição experimental Significância da diferença Não há diferenças significativas no tempo de resposta entre as duas condições experimentais (p > 0,2). Estatística indutiva testes de hipóteses Modelação por path analysis Estatística A Estatística Descritiva permite descrever a amostra e a Estatística Indutiva permite generalizar com confiança essa descrição para a população de onde a amostra foi retirada, recorrendo para isso à Teoria das Probabilidades. Testes de hipóteses Sua aplicações e limites Testes de hipóteses 4

5 Teste de hipóteses Tipos de teste estatísticos O teste de hipóteses é a técnica da Estatística Indutiva mais utilizada na investigação em Psicologia. Consiste em averiguar se a hipótese formulada sobre aspectos desconhecidos de uma população é ou não apoiada pela informação contida na amostra retirada dessa população. 1) Testes unilaterais e bilaterais Testes unilaterais menos exigentes, pois as suas hipóteses implicam fundamentação a priori. 2) Testes paramétricos e não paramétricos (distribution free) Testes não paramétricos menos exigentes em termos das condições de aplicação mas, eventualmente, menos potentes para detectar diferenças. Passos num teste de hipóteses Passos num teste de hipóteses Passo 1. A questão em investigação deverá permitir formular uma hipótese sobre um ou mais parâmetros desconhecidos da população. A formulação de hipóteses é um formalismo deste procedimento; na maior parte das vezes, a hipótese de investigação é contrária à hipótese nula em que se baseia o teste estatístico. Pergunta teoricamente relevante: Durante a adolescência, serão os rapazes mais ansiosos do que as raparigas? Hipótese nula: O nível médio de ansiedade na população de rapazes é igual ao da população de raparigas H 0 : µ M = µ F Passos num teste de hipóteses Passos num teste de hipóteses Passo 2. Extrair uma amostra da população, aplicar uma medida de ansiedade e calcular as estatísticas descritivas relevantes. µ M =? µ F =? X M = 28 X F = 32 Amostra 100 rapazes 100 raparigas As medidas de ansiedade que usamos não são totalmente fiáveis, envolvendo margem de erro. Não havendo possibilidade de avaliar a ansiedade de todos os adolescentes (rapazes e raparigas) da população sobre a qual se pretende tirar conclusões, limitámo-nos a estudar a uma amostra (por exemplo, duas ou três escolas de Faro). População

6 Passos num teste de hipóteses Passos num teste de hipóteses Pelo menos, duas fontes de erro: erro de medição Informação amostral sobre nível de ansiedade não é 100% segura erro de amostragem Amostra X M = 28 X F = 32 A diferença de 4 pontos observada entre rapazes e raparigas reflecte uma diferença real ou é apenas aparente (devida aos erros envolvidos na obtenção destas médias)? Passos num teste de hipóteses Passos num teste de hipóteses Passo 3. Maquinaria dos testes de significância Recorrendo à Teoria das Probabilidades e assumindo algumas condições, é possível saber em que medida duas médias amostrais contaminadas de erro podem diferir entre si quando a amostra provém de uma população semelhante à estipulada na hipótese (ou seja, em que não há diferença entre rapazes e raparigas). Distribuição de amostragem Como se comportam todas as médias que se podem extrair de uma população com as característica especificadas na hipótese nula? Passos num teste de hipóteses Passos num teste de hipóteses Conhecimento a priori das distribuições de amostragem Estatística Clássica Pergunta a que responde um teste de significância: Se não existir diferença entre os níveis médios de ansiedade de rapazes e raparigas (hipótese nula), qual é a probabilidade de, devido ao acaso, encontrarmos uma diferença igual (ou mais extrema) do que observada na amostra?. 6

7 Passos num teste de hipóteses Passos num teste de hipóteses Amostra Passo 4. Decisão X M = 28 X F = 32 S M = 12 S F = 14 N M = 100 N F = 100 Teste t de Student t = 2,4 df = 98 p = 0,01 Significância A probabilidade de a diferença entre rapazes e raparigas observada na amostra se dever ao acaso é 0,01. Como é pouco provável que os dados observados provenham de uma população com as características especificas em H 0, devemos abandoná-la e concluir que existem diferenças entre rapazes e raparigas. Será uma decisão correcta? %&'!(&( Erros envolvidos numa decisão Erros envolvidos numa decisão estatística H 0 H 0!"#$ Caracterização da população (desconhecida) é verdadeira é falsa Aceitar H 0 Decisão correcta Decisão errada Decisão (aceitar H 0 Erro de tipo II do teste quando ela é (aceitar H 0 estatístico verdadeira) quando ela é falsa) Rejeitar H 0 Decisão errada Decisão correcta Erro de tipo I (rejeitar H 0 (rejeitar H 0 quando ela é quando é falsa) verdadeira) Erros envolvidos numa decisão estatística Nível de significância do teste Na tomada de decisão estatística é importante considerar o risco (probabilidade) de cometer os dois tipos de erro: Probabilidade de cometer erro de tipo I = α nível de significância do teste Probabilidade de cometer erro de tipo II = 1 β complementar da potência do teste O nível de significância do teste α corresponde à probabilidade de nos estamos a enganar ao rejeitar H 0 (rejeitar a hipótese quando ela é verdadeira - erro de tipo I). Deve ser definido antes da realização do teste. Por exemplo, se o teste indicar a rejeição de H 0 (sugerindo-nos haver diferença de ansiedade entre rapazes e raparigas) isso pode ser um erro pois podemos estar perante uma situação rara em que a diferença observada se deve realmente ao acaso (e não haver diferença verdadeira na população entre rapazes e raparigas). 7

8 Nível de significância do teste Nível de significância Em geral, define-se em % o nível de significância do teste α. Este valor resulta de uma convenção e não tem nada de especial; por vezes utilizam-se níveis de significância mais exigentes (por exemplo, 1%), outras vezes níveis menos exigentes (10%), mas o valor de % é o tradicionalmente mais utilizado. Porquê? De uma maneira geral, pretende-se que a probabilidade de cometer o erro de tipo I seja mínima. No entanto, esta probabilidade não pode ser reduzida a 0 pois diminui-la em excesso faz aumentar a probabilidade de cometer o erro de tipo II. Por isso, pode não ser adequado usar níveis de significância muito baixos. Potência do teste Potência do teste A potência do teste 1-β corresponde à probabilidade de não nos estamos a enganar ao aceitar H 0 (aceitar a hipótese quando ela é falsa - erro de tipo II). Um teste potente permite-nos decidir com um baixo risco de nos enganarmos quando aceitamos H 0, ou seja, dá-nos segurança que não há diferenças reais entre rapazes e raparigas quando o teste sugere que não se rejeite H 0. A determinação da potência do teste é complexa e, entre outros factores, depende da dimensão da amostra: amostras de maiores dimensões garantem testes mais potentes. Pode-se estabelecer à partida a potência do teste, bastando para isso definir a dimensão da amostra necessária para garantir que uma diferença de determinada magnitude na população tenha probabilidade elevada de ser realmente detectada (por exemplo, potência do teste 1 - β = 0,80). Potência do teste Nível de significância e potência do teste Apesar de ter vindo a ser secundarizado face ao nível de significância, a questão da potência do teste é fulcral: de nada serve realizar um teste estatístico que não tenha potência para detectar a diferença teoricamente especificada ficamos sempre na dúvida se H 0 é realmente verdadeira ou se, pelo contrário, é falsa mas o teste não teve suficiente potência para detectar essa falsidade. Relação entre α e β (quando se assume que a distribuição de amostragem das médias amostrais é normal). 8

9 Elementos na análise da potência de um teste Potência do teste Variabilidade dos dados (não temos grande controlo sobre este elemento) Magnitude da diferença que se pretende detectar Nível de significância do teste (risco de cometer o erro de tipo I) Dimensão da amostra Como aumentar a potência de um teste? Aumentar a dimensão das amostras Aumentar a magnitude da diferença que se pretende que o teste detecte Diminuir o nível de significância α Power Curve Curva da potência do teste Que potência? high Não há critérios universal. Nível optimizado B C Eficaz mas ineficiente O que é mais importante? Sample Power A Ineficaz Falhar uma tendência? Detectar uma tendência falsa? Geralmente entre 80% e 9% low small Sample Size large Testes de hipóteses Sua aplicações e limites Testes de hipóteses para comparação entre grupos Comparações entre grupos A comparação de grupos é um dos formatos mais usuais na investigação psicológica: Comparação entre grupos naturais (diferenças entre sexos, por exemplo) ou entre populações clínicas (grupos de disléxicos face grupo de controlo de idade) Comparação entre grupos experimentais (grupo que recebe o tratamento experimental versus grupo de controlo) 9

10 Comparações entre grupos Comparações entre grupos Caso de variáveis de escala Alguns aspectos a levar em consideração: Natureza métrica da variável em estudo (nominal / de escala) Natureza dos conjuntos de medidas (amostras independentes / amostras emparelhadas) Número de grupos em comparação Se o nível de medida da variável em questão é de escala, a comparação entre grupos geralmente corresponde a testes de hipóteses sobre valores médios. Na verdade, ao comparar grupos estamos, em geral, interessados em tomar decisões sobre a magnitude dos valores que a variável toma populações de onde foram extraídos os grupos. Por exemplo, verificar se há diferenças entre rapazes e raparigas na Aptidão verbal. Comparações entre grupos Caso de variáveis nominais Se o nível de medida da variável em questão é nominal, a comparação entre grupos geralmente corresponde a testes de hipóteses sobre proporções ou a testes de independência entre variáveis. Testes de hipóteses Sua aplicações e limites Comparação entre duas médias grupos Por exemplo, comparar se a percentagem de reformados é igual na população de utentes de dois serviços hospitalares. Testes de hipóteses Sua aplicações e limites A. Amostras independentes Testes sobre diferenças entre dois valores médios (amostras independentes) Condições de aplicação Uma das variáveis está medida no formato escala; a outra variável define os grupos (pode ser dicotómica ou dicotomizada) A distribuição das variáveis deve ser normal ou a dimensões dos grupos a comparar deve ser grande A variância de cada grupo deve ser semelhante (homogeneidade das variâncias). 10

11 Testes sobre diferenças entre dois valores médios (amostras independentes) Exemplo A hipótese nula postula que os dois grupos têm média igual. A rejeição da hipótese nula (p α) indica que existem diferenças significativas entre as duas médias. A magnitude da diferença pode ser avaliada por uma medida de magnitude do efeito (effect size) Num estudo sobre o efeito da estimulação durante o sono na aprendizagem, dividiu-se aleatoriamente um conjunto de 62 crianças em dois grupos. Durante um mês, todas as noites enquanto dormiam, metade das crianças foram expostas a uma gravação áudio com um relato de informação sobre História de Portugal. As restantes crianças foram expostas a um gravação áudio de discurso sem informação relevante. No final do mês, os conhecimentos de História de ambos os grupos foram avaliados através de um teste (classificação de 0 a 20). Verifique se o procedimento seguido teve efeito significativo (α = 0.0). Participantes Grupo Experimental Participantes Grupo de Controlo Exemplo Que teste? Resultados obtidos nos dois grupos. Uma das crianças do grupo experimental não compareceu ao teste Hipóteses: H 0 : µ Exp = µ Cont Teste de diferenças versus H 1 : µ Exp > µ Cont Teste de unilateral direito Teste de unilateral direito de diferenças entre valores médios (para dois grupos independentes) Média 14,967 Média 13,4 Desviopadrão 3,232 Desviopadrão 3,601 Diferenças significativas? Teste t de Student para amostras independentes A avaliação da significância da diferença entre dois valores médios não depende apenas do valor da diferença mas também da sobreposição das duas distribuições (ou seja, da sua dispersão). No exemplo, apesar da diferença entre valores médios ser idêntica nas três situações, essa diferença aparenta ser mais significativa apenas na situação de baixa dispersão. Condições de aplicação Amostras aleatórias retiradas de população normal ou amostras com dimensão suficientemente grande para se aplicar o Teorema do Limite Central (em geral, N 30 para ambas as amostras). OK (N = 31 para o grupo de controlo e N = 30 para o grupo experimental) Homogeneidade das variâncias: as variância / desvios-padrão dos dois grupos têm de ser iguais. A razão desta exigência é que o teste assume que as populações de onde vêm as duas amostras são iguais em tudo (distribuição, dispersão, etc) excepto nos respectivos valores médios. A verificar (S = 3,232 para o grupo de controlo e S = 3,601 para o grupo experimental) 11

12 Teste t de Student para amostras independentes Condições de aplicação Condições de aplicação: As observações da amostra 1 são independentes das observações da amostra 2. OK (os resultados de um grupo não afectam os resultados de outro grupo) A variável em estudo tem de estar medida pelo menos numa escala quasi-intervalar (quasi-intervalar, intervalar ou de quociente). OK (variável: classificação obtida no teste) Verificação de normalidade (desnecessário neste caso pois as amostras são grandes) Gráfico de quartis Gráfico de quantis da normal Condições de aplicação Teste de Levene para averiguar a homogeneidade das variâncias Verificação da homogeneidade das variâncias Grupo Experimental S 2 = 3,232 2 = 10,448 Grupo Controlo S 2 = 3,601 2 = 12,9672 As variâncias são grosseiramente semelhantes (a divisão de uma pela outra dá cerca de 1,2), embora convenha sempre efectuar um teste estatístico formal para garantir que não há razões para as assumirmos como diferentes (teste de Levene para a igualdade de variâncias). Hipóteses do teste de Levene (teste de homogeneidade das variâncias): H 0 : σ 2 Exp = σ2 Cont versus H 1 : σ 2 Exp σ2 Cont No SPSS, este teste vem incluído no output do teste t de Student para amostras independentes. Teste de Levene (output do SPSS) Teste de Levene para averiguar a homogeneidade das variâncias Estatísticas descritivas para cada grupo (média, desvio-padrão e erro-padrão da média) Conclusão do teste de Levene Rejeita-se H 0 ao nível de significância α = 0,0, ou seja, pode-se considerar que as variâncias dos dois grupos são iguais (F = 0,4, p = 0,467). Teste de Levene sobre homogeneidade de variâncias Valor p do teste de Levene não significativo Assegura-se assim o pressuposto da homogeneidade das variâncias, pelo que se pode prosseguir com o teste t para avaliar a diferença entre valores médios. 12

13 Teste t (output do SPSS) Decisão Como o teste é unilateral, tem de se dividir por dois o valor calculado pelo SPSS. Assim, Sig. = 0,071/2 = 0,036 < α. Estatística de teste Valor p do teste t (bilateral) Logo, rejeita-se H 0 ao nível de significância α = 0,0, ou seja, o grupo experimental tem, em média, um desempenho superior no teste de História do que o grupo de controlo (t = 1,84, gl = 9, p = 0,036), indicando que a estimulação durante o sono teve um efeito positivo significativo na aprendizagem. Consequências de violar as condições de aplicação do teste t de Student Consequências de violar as condições de aplicação do teste t de Student Normalidade O teste t é robusto face à violação do pressuposto da normalidade da distribuição da variável, mesmo com amostras pequenas. Assim, as consequências da não normalidade dos dados afecta minimamente os erros de tipo I e tipo II envolvidos na decisão. Por exemplo, se a distribuição da variável em estudo for assimétrica e as amostras em comparação tiverem dimensões tão pequenas como, sabe-se que a verdadeira margem de erro de tipo I envolvida na decisão poderá afastar-se no máximo em 2% do valor de α estipulado, o que é negligenciável em termos práticos (Hsu & Feldt, 1969). No entanto, ainda assim existe a possibilidade de recorrer a testes não paramétricos alternativos (teste de Mann-Whitney). Homogeneidade das variâncias O teste t baseia-se nos desvios-padrão das duas amostras para obter uma estimativa conjunta de σ 2 (S 2 pool ). Se não existir homogeneidade das variâncias, esta estimativa conjunta não faz sentido. Sabe-se que o teste t é robusto face à violação do pressuposto da homogeneidade das variâncias desde que as duas amostras tenham igual dimensão nestes casos, as consequências da heterogeneidade das variâncias afectam minimamente os erros de tipo I e tipo II envolvidos na decisão. Consequências de violar as condições de aplicação do teste t de Student Consequências de violar as condições de aplicação do teste t de Student Homogeneidade das variâncias Contudo, quando as amostras têm dimensão diferente, verificase que: Se a amostra maior tiver a maior variância, o teste t é conservador (ou seja, a probabilidade real de cometer o erro de tipo I é mais pequena do que o valor α estipulado). Se a amostra mais pequena estiver associada à maior variância, o este t é bastante liberal (ou seja, a probabilidade real de cometer o erro de tipo I é superior ao estipulado) situação mais problemática. Homogeneidade das variâncias O SPSS fornece uma correcção ao teste t para as situações de heterogeneidade das variâncias (procedimento de Welch), que consiste num ajustamento dos graus de liberdade. Um procedimento alternativo para lidar com a estas situações é realizar um teste não-paramétrico equivalente, que não exija homogeneidade das variâncias (teste Mann-Whitney). 13

14 Testes de hipóteses Sua aplicações e limites Testes sobre diferenças entre dois valores médios (amostras emparelhadas) A hipótese nula postula que os dois conjuntos de dados provêm de populações com valor médio igual. B. Amostras emparelhadas As investigações que levam à recolha de dados emparelhados surge em estudos longitudinais (o mesmo indivíduo é observado duas vezes) ou quando indivíduos diferentes são emparelhados por diferentes razões (por semelhança em variáveis relevantes ou por pertencerem à mesma unidade, por exemplo um casal). Exemplo Exemplo Para avaliar o efeito dos ritmos circadianos na memória, um conjunto de 30 crianças com idades entre 6 e 9 anos realizaram uma prova de memória imediata (digit span) de manhã e a mesma prova 12 horas depois. Teste, ao nível de significância α = 0,0, se existem diferenças significativas no desempenho observado nos dois momentos. Participante Manhã Tarde Participante Manhã Tarde Que teste? Amostras independentes versus Amostras emparelhadas Hipóteses: H 0 : µ Manhã = µ Tarde versus H 1 : µ Manhã µ Teste de diferenças µ Tarde Teste de bilateral Teste de bilateral direito de diferenças entre valores médios (para dois grupos emparelhados). Se cada observação da amostra 1 puder ser emparelhada a uma observação da amostra 2, os dois conjuntos de dados não são independentes mas emparelhados. Amostra 1 Observação 1 Observação 2 Observação n Amostra 2 Observação 1 Observação 2 Observação n No caso de amostras emparelhadas, a unidade em estudo não é a observação mas sim o par de observações. Não se pretende saber se existe diferenças entre a média das observações do grupo 1 e a média das observações do grupo 2 mas sim saber se a média das diferenças entre os elementos de cada par é significativa. 14

15 Amostras independentes versus Amostras emparelhadas Teste t de Student (para amostras emparelhadas) Designações para este tipo de design: Amostras emparelhadas (versus amostras independentes); Medidas repetidas (versus medidas independentes); Planeamento experimental intra-sujeito (versus planeamento entre-sujeitos) (within subjects versus between subjects). Condições de aplicação: Amostras aleatórias retiradas de população normal ou amostras com dimensão suficientemente grande para se aplicar o Teorema do Limite Central (em geral, N 30 para ambas as amostras). OK (N = 30 pares de observações) Observações emparelhadas. OK (estamos perante um design com medidas repetidas, uma vez que cada sujeito é o controlo de si próprio) Teste t de Student (para amostras emparelhadas) Teste t de Student para amostras emparelhadas (output do SPSS) Data view: os valores observados nos dois momentos de avaliação são dispostos lado a lado em colunas diferentes (faceta T da data box). Variável que corresponde ao desempenho dos sujeitos durante a manhã Variável que corresponde ao desempenho dos sujeitos durante a tarde Estatísticas descritivas para cada conjunto de observações (média, desviopadrão e erro-padrão da média) Correlação existente entre os dois conjuntos de observações reflecte o grau em que o desempenho da manhã está relacionado com o desempenho da tarde. No entanto, não esclarece se há diferença no nível médio desses dois desempenhos. Teste de diferenças entre valores médios Teste de diferenças significativo Decisão E se não se respeitassem as medidas emparelhadas? Como Sig. = 0,02 = < α, rejeita-se H 0. O desempenho no teste de memória é diferente quando este é realizado de manhã e à tarde (t = 2,36, 29gl, p = 0,02), indicando que o ritmo circadiano poderá influenciar o desempenho neste tipo de prova. Se, em vez de 30 pares de observações, considerássemos que existiam 60 observações independentes (30 de manhã e 30 de tarde), os dados estariam lançados numa única coluna, já não havendo o cuidado de emparelhar o desempenho do mesmo sujeito nos dois momentos. O teste a utilizar seria o teste t para amostras independentes. Variável que identifica o momento da observação Variável correspondente ao desempenho na prova de memória 1

16 Output do SPSS Utilizar o procedimento de medidas repetidas sempre que os dados o permitam Teste de diferenças não significativo O facto de se ter ignorado o emparelhamento dos dados resulta numa conclusão diferente não há diferenças entre o desempenho de manhã e à tarde. Porquê, se os dados ( números ) são idênticos? O teste para amostra emparelhadas é mais potente na detecção de diferenças que o teste para medidas independentes, pois anula a variância (ruído) causada pelo facto de haver sujeitos diferentes nas duas condições experimentais (quando as amostras são emparelhadas, o mesmo sujeito é exposto às duas condições experimentais, pelo que se anula, parcialmente, o efeito das diferenças individuais). Quanto maior a correlação entre as observações do par, maior a vantagem em usar o procedimentos para amostras emparelhadas. No entanto, o design com medidas repetidas tem alguns problemas intrínsecos (aprendizagem, mortalidade experimental, carry over effects). Testes de hipóteses Sua aplicações e limites Parte 2 Comparação entre mais do que dois conjuntos de medidas Testes de hipóteses sobre diferenças entre mais de dois valores médios Teste t para diferenças entre valores médios: adequado na testagem de hipóteses sobre dois valores médios. Que fazer quando se pretende comparar mais do que dois valores médios? Exemplo O problema das comparações múltiplas Pretende-se avaliar se o nível médio de satisfação dos estudantes com os Serviços Sociais da Universidade é igual nas diferentes faculdades (FCHS, FCT, FERN, FCMA e FE). Haverá diferenças significativas, ao nível de significância de α = %, entre as cinco faculdades? Como responder a esta questão? Bastará comparar as faculdades duas a duas com um teste t para amostras independentes? Quantos testes t teriam de ser feitos? C 2 = 10 (FCHS vs FCT; FCHS vs FERN; FCHS vs FCMA; etc ) Se em cada um destes testes corremos um risco α de chegar a uma decisão errada (%), qual a probabilidade cometermos erro ao basearmos a nossa conclusão geral nas dez comparações? 16

17 O problema das comparações múltiplas O problema das comparações múltiplas Se quisermos decidir se as faculdades são ou não iguais em termos de satisfação, ao fazer as comparações par a par empolamos o risco de cometer um erro de tipo I (achar que há diferenças quando, na verdade, não existem). Probabilidade de cometer pelo menos um erro de tipo I ao fazer k comparações duas a duas através de um teste t ao nível de significância α (experimentwise error): 1 (1 - α) k No caso de α = 0,0 e k = 10 comparações, vem: 1 (1 0,0) 10 = 0,4013 O risco de nos enganarmos é demasiadamente alto para ser considerada uma abordagem estatisticamente segura. Mesmo que não haja diferença entre as faculdades, há 40% de probabilidade de pelo menos um teste t indicar que existe uma (falsa) diferença (rejeitar H 0 ). O problema das comparações múltiplas O problema das comparações múltiplas Prob erro Tipo I 1,00 0,9 0,90 0,8 0,80 0,7 0,70 0,6 0,60 0, 0,0 0,4 0,40 0,3 0,30 0,2 0,20 0,1 0,10 0,0 0, k - nº de grupos Nível de significância nominal Valor da probabilidade de cometer pelo menos um erro de tipo I ao comparar k grupos A probabilidade de tomar pelo menos uma decisão errada aumenta marcadamente com o número de grupos a comparar. Por exemplo, se compararmos 8 grupos, há 7% de probabilidade de cometer pelo menos um erro. Nota: estes cálculos assumem que os testes t são independentes, o que não é rigorosamente verdade uma vez que se baseiam em informação sobreposta, o que piora ainda mais este cenário. Conclusão: A abordagem ao problema em causa fazendo testes t múltiplos é inadequada, porque o risco de nos enganarmos aumenta proporcionalmente ao número de comparações que têm de ser feitas. De que alternativas dispomos? Testes de hipóteses Sua aplicações e limites A. Amostras independentes ANOVA A técnica estatística denominada ANOVA (Analysis of Variance) foi desenvolvida por Ronald Fisher ( ) para poder testar em simultâneo a igualdade do número de valores médios que se pretender, sem empolar o valor de α. Trata-se, assim, de um procedimento ideal para comparar o valor médio de mais de dois grupos. 17

18 Exemplo Factor e Variável dependente A fim de estudar o efeito do ruído ambienta na compreensão de um texto lido, dividiram-se nove pessoas por três condições experimentais: Grupo 1 silêncio; Grupo 2 com música de fundo instrumental; Grupo 3 com ruído (não musical) de fundo. No final, fez-se a cada pessoa um total de dez perguntas sobre o texto lido, registando-se o número de respostas correctas. Haverá diferença entre as condições experimentais? Variável dependente Desempenho no teste de compreensão (nº de respostas certas) Variável independente (factor) Ruído de fundo três níveis: silêncio versus música de fundo instrumental versus ruído (não musical) de fundo. Que teste? Hipóteses na ANOVA Hipóteses: H 0 : Os k valores médios são iguais versus H 1 : Pelo menos um valor médio é diferente dos restantes H 0 : µ 1 = µ 2 = µ 3 versus H 1 : i,j, µ i µ j Repare-se que a hipótese nula se refere globalmente a todos os grupos do estudo (hipóteses omnibus, global). Algumas precisões sobre o teste de hipóteses através de ANOVA: As hipóteses são globais (omnibus) apenas se testa o efeito global da experiência (hipótese nula de que os valores médios são todos iguais versus a hipótese alternativa de que pelo menos um deles é diferente dos restantes). Numa ANOVA não se coloca a questão do teste ser bi ou unilateral. Não aceitar a hipótese nula não nos esclarece onde reside a diferença detectada essa análise é feita numa fase posterior. Condições de aplicação da ANOVA Violação das condições de aplicação Amostras aleatórias retiradas de populações normais ou amostras com dimensão suficientemente grande para se aplicar o Teorema do Limite Central (em geral, N 30). Homogeneidade das variâncias: as variância (desviospadrão) dos diferentes grupos têm de ser iguais. As observações de cada grupo são independentes entre si. A variável em estudo tem de estar medida, pelo menos, numa escala quasi-intervalar (quasi-intervalar, intervalar ou de quociente). A ANOVA é robusta face a violações de algumas condições referidas, nomeadamente a exigência de normalidade (desde que todos os grupos tenham dimensão suficiente) e a exigência da homogeneidade das variâncias (desde que os grupos tenham dimensão semelhante). Mais grave é a violação da independência das observações entre grupos (não devem estar correlacionados; resolve-se garantindo a aleatoriedade na formação dos grupos em comparação). 18

19 Mecanismo da ANOVA Mecanismo da ANOVA Embora se denomine análise de variância, trata-se de um procedimento para averiguar se os valores médios são estatisticamente diferentes (e não para ver se as variâncias são diferentes). O nome resulta da ANOVA recorrer ao cálculo de variâncias para decidir se as médias são diferentes. O raciocínio é o seguinte: calcula-se a variância dentro de cada grupo e depois compara-se com a variância entre os grupos se houver diferenças, é porque as médias dos grupos são diferentes. Na ANOVA, avalia-se em que medida duas fontes de variabilidade contribuem para a variação total dos dados: * Alguma variação resulta da diferença entre indivíduos dentro de cada grupo (variação within, residual ou variância dentro do grupo) * Alguma variação resulta das diferenças introduzidas pelos grupos (variação between, ou variância entre grupos) Exemplo ANOVA e teste de valores médios Número de respostas correctas em cada grupo: Grupo Grupo 2 Média Grupo 3 Haverá diferença entre os valores médios das populações de onde vieram estes três grupos? Para isso, a ANOVA vai comparar a variância dentro dos grupo (variância natural dos dados) com a variância entre médias (variância devida ao efeito diferenciador das condições experimentais) A Análise de Variância compara a variância dentro dos grupos (variância residual ou variância within) com a variância entre grupos (variância entre grupos ou variância between). Se a variância residual for claramente inferior à variância entre grupos, então pode-se afirmar que os valores médios são diferentes. Estatística de teste e sua distribuição Oneway ANOVA (output do SPSS) Na ANOVA a estatística de teste é designada por F e corresponde ao quociente entre a variância entre grupos e a variância residual: Estatísticas descritivas por grupo (média, desviopadrão, erro-padrão da média, IC, mínimo e máximo) A estatística F segue uma distribuição F de Snedecor com υ 1 = k-1 gl (associados ao numerador) e υ 2 = N-k gl (associados ao denominador). Teste de Levene para avaliar o pressuposto da homogeneidade das variâncias Nota: os graus de liberdade indicados correspondem à situação em que os k grupos têm a mesma dimensão, formando um total de N observações. Tabela ANOVA (resultados do teste de comparação de médias) 19

20 Tabela ANOVA Tabela ANOVA Nº de grupos - 1 Valor p Valor p Fontes de variação dos dados Soma de quadrados Graus de liberdade associados a cada soma de quadrados Estimativa da variância (média quadrática) Estatística F A adição das Somas de Quadrados corresponde à Soma de Quadrados total Os graus de liberdade também somam N - 1 As médias quadráticas resultam de dividir a Soma de Quadrados pelos graus de liberdade correspondentes A estatística F resulta da divisão da Média Quadrática between pela Média Quadrática within Decisão Oneway ANOVA (output do SPSS) Se Sig. α, rejeita-se H 0, o que se verifica no presente exemplo (Sig. = 0,001 < 0,0). Gráfico de médias (means plot), permite visualizar que médias são diferentes Logo, rejeita-se H 0 ao nível de significância α = 0,0, ou seja, pelo menos um dos grupos têm valor médio diferente dos restantes [F(2, 9) = 1,6, p = 0,001]. O Grupo 1 (silêncio) aparenta diferir dos restantes dois. Como verificar estatisticamente se assim é? Análises posteriores Análises post-hoc Se não se rejeitar H 0, é fácil concluir que os grupos são idênticos. Mas se se rejeitar H 0, apenas sabemos que pelo menos um dos grupos é diferente dos restantes. Como determinar os grupos que diferem entre si? G1 = G2 = G3 G1 (G2 = G3) ou G2 (G1 = G3) ou G3 (G1 = G2) G1 G2 G3 Não rejeitar H 0 Rejeitar H 0 Existem inúmeros procedimentos para decidir que média são realmente diferentes umas das outras. Todos estes procedimentos consistem em comparar pares de médias, mas agora estas comparações estão protegidas quanto ao empolamento do erro de tipo I. Há procedimentos mais conservadores e procedimentos mais liberais sem razão especial, vamos utilizar o procedimento post-hoc de Tukey HSD (honestly significant difference). Em que situação estamos? 20

21 Análises post-hoc Análises post-hoc Valor p para a diferença entre cada par de condições As condições organizam-se em dois grupos: Condições 3 e 2 (que apresentam média com valores 4 e ) e Condição 1 (que apresenta média com valor 8). Valor da diferença para cada para de médias Assinalam-se com * as diferenças significativas para o valor de α escolhido Valor p para a diferença entre as médias dentro de cada grupo Conclusão final Análises post-hoc procedimento de Bonferroni Em resumo, as diferenças detectadas pela ANOVA resultam do Grupo 1 ter uma desempenho significativamente mais elevado que os outros dois grupos (Grupo 1 vs Grupo 2: p = 0,008; Grupo 1 vs Grupo 3: p = 0,001), que, por sua vez, não se distinguem de forma estatisticamente significativa (Grupo 2 vs Grupo 3: p = 0,409). Uma outra forma de realizar análises post-hoc controlando a taxa de erro global (experimentwise error) é através do procedimento de Bonferroni, que aqui se vai descrever por ser fácil de conduzir manualmente. Se pretendemos fazer uma análise post-hoc após rejeitar na ANOVA uma hipótese omnibus, basta realizar as k comparações através testes t entre pares de médias e utilizar como nível de significância não α mas sim α/k. Trata-se de um procedimento conservador, mas fácil de aplicar. Análises post-hoc procedimento de Bonferroni Análises post-hoc outros procedimento Comparação Grupo 1 vs Grupo 2 Estatística t t =,20 GL 6 Valor p 0,002 O SPSS oferece 18 alternativas no que respeita à análise post-hoc. Grupo 1 vs Grupo 3 Grupo 2 vs Grupo 3 t = 4,90 t = 1, ,003 0,267 Alguns critérios podem nortear a escolha de uma dessas alternativas: Como são três grupos em comparação, vamos utilizar o nível de significância α/3 = 0,0/3 = 0,0167. Apenas a comparação 2 vs 3 não é significativa para este nível de significância corrigido. Controlo sobre o erro de tipo I Controlo sobre o erro de tipo II Desigualdade no tamanho dos grupos a comparar Heterogeneidade das variâncias 21

22 Análises post-hoc outros procedimento Contrastes a priori Dimensão dos grupos Grupos iguais Grupos diferentes Homogeneidade das variâncias Variâncias iguais Variâncias diferentes Variâncias diferentes Procedimento post-hoc Tukey REGWQ Bonferroni (conservador) Gabriel (pouco diferentes) Hochberg GT2 (muito diferentes) Games-Howell Em vez de olharmos para as diferenças entre todos os pares de grupos, podemos estar interessados em apreciar contrastes planeados a priori. Por exemplo, num estudo experimental, pode interessar comparar o grupo de controlo com dois grupos experimentais. Estes contrastes devem ser especificados antes da realização do teste omnibus. Segundo Field (2000) Contrastes a priori Exemplo O SPSS disponibiliza um conjunto de contrastes a priori: Contraste Deviation (first / last) Simple (first / last) Repeated Helmert Difference Polynomial Compara o efeito de cada nível (excepto o primeiro / último) com o efeito global do estudo Cada nível é comparado com o primeiro / último Cada nível é comparado com o nível seguinte Cada nível é comparado com o efeito médio das categorias seguintes Cada nível é comparado com o efeito médio das categorias anteriores Testa tendências lineares, quadráticas e cúbicas e quárticas nos dados Considere que se planeara a priori contrastar o efeito da condição Silêncio com o efeito das outras duas condições. O contraste adequado será o de Helmert. O silêncio (nível 1) difere significativamente da média dos outros dois níveis (p = 0,000). No entanto, os outros dois níveis não diferem entre si de forma estaticamente significativa (p = 0,213). Relação entre o teste t e a ANOVA unifactorial Testes de hipóteses Sua aplicações e limites O teste t é um caso particular da ANOVA unifactorial (quando o número de grupos em comparação é 2). Nessa situação, o valor da estatística F corresponde ao quadrado da estatística t. O valor p será idêntico em ambos os testes. B. Amostras emparelhadas 22

23 ANOVA com medidas repetidas ANOVA com medidas repetidas EXEMPLO Objectivo: avaliar o efeito da cor na identificação e nomeação de objectos. Desenho experimental: 2 sujeitos expostos a três condições experimentais (os objectos a nomear são representados através desenhos, fotografias a preto e branco ou fotografias a cor ). Todos os sujeitos foram expostos a cada uma das condições experimentais. Atenção aos efeitos de ordem! Desenho experimental intra-sujeitos (o mesmo sujeito é exposto às três condições amostras emparelhadas) Factores: Tipo de imagem: desenho, foto B&W, foto cor (factor within subject) Variável dependente: Tempo de nomeação Fontes de variação nos dados Hipóteses sobre valores médios Porque é que duas observações são diferentes? Porque os sujeitos nomearam estímulos diferentemente coloridos (efeito do factor Tipo de imagem) Porque os sujeitos são diferentes (efeito residual) H 0 : Não há diferenças no desempenho médio dos sujeitos nas três condições experimentais H 1 : Em pelo menos uma das condições experimentais o desempenho médio dos sujeitos difere do desempenho nas restantes condições Dados A questão da esfericidade Vinte e cinco sujeitos expostos a três condições experimentais, definidas consoante o tipo de imagem a nomear. Os valores referem o tempo médio de nomeação das imagens (em segundos) para cada condição. Teste da esfericidade Quando o factor within tem mais do que duas modalidades, é necessário que se verifique a esfericidade da matriz das covariâncias. Trata-se de uma exigência semelhante à homogeneidade de variâncias, mas desta vez para o caso da ANOVA com medidas repetidas. Na presente situação, rejeita-se H 0 [X 2 (2) = 14,4, p = 0,001], ou seja, não se pode assumir a esfericidade da matriz de co-variâncias, pelo que é preciso seguir alguns cuidados na realização desta ANOVA de medidas repetidas. 23

24 ANOVA para medidas repetidas (output do SPSS) ANOVA para medidas repetidas (output do SPSS) A correcção de Greenhouse-Geisser altera os grau de liberdade da estatística F, de forma a garantir maior fiabilidade aos resultados da ANOVA. Efeito do Tipo de Imagem A significância do efeito do Tipo de Imagem lê-se nesta linha pois não se pode assumir a esfericidade dos dados. Rejeita-se H 0 [F(1.4, 32.8) = 4,9, p = 0,000], ou seja, o tempo de nomeação das imagens foi influenciado pela manipulação experimental (presença ou não de cor). Efeito do Tipo de Imagem A nomeação dos desenhos parece ser mais lenta do que a nomeação das fotografias, quer sejam a cor ou a preto e branco. ANOVA para medidas repetidas (output do SPSS) Relação com outros procedimentos para teste estatístico de hipóteses sobre valores médios Análise post hoc através do método de Bonferroni Comparação entre modalidades O tempo de nomeação dos desenhos é estatisticamente diferente do tempo de nomeação dos outros dois tipos de imagem (fotos B&W e fotos Cor). Tal como o procedimento One-way ANOVA é a generalização do teste t de Student (Two independent samples t test) para situações em que se pretende comparar a média de mais do que duas amostras independentes, também o procedimento Repeated measures ANOVA é a generalização do teste t de Student (Two paired samples t test) para situações em que se pretende comparar a média de mais do que duas amostra emparelhadas. Se não se cumprirem os requisitos mínimos de aplicação da ANOVA com medidas repetidas, é sempre possível recorrer ao teste não paramétrico de Friedman. Testes de hipóteses Sua aplicações e limites Árvore de decisão para testes sobre valores médios Ordinais Testes nãoparamétricos Parte 3 Testes não paramétricos (distribution free) Tipo de dados Escala Não se sabe se as amostras provém de populações normais Amostras provém de populações normais Amostras pequenas (N < 30) Amostras grandes (N 30) Testes paramétricos Nominais Não se aplica o conceito de valor médio; talvez se pretenda um teste de qui-quadrado 24

25 Árvore de decisão (testes paramétricos sobre valores médios) Testes paramétricos e não paramétricos Testes paramétricos sobre valores médios Teste de conformidade Teste de diferenças Comparar dois valores médios Comparar mais de dois valores médios Amostras emparelhadas Amostras independentes Amostras independentes Amostras emparelhadas Homogeneidade de variâncias Heterogeneidade de variâncias Homogeneidade de variâncias Heterogeneidade de variâncias One-Sample T Test Paired-Samples T Test Independent- Samples T Test Independent- Samples T Test (Welch Method) Oneway- ANOVA Welch & Brown- Forsythe Method GLM - Repeated Measures Os testes apresentados testam hipóteses sobre parâmetros (valor médio). Quando as exigências de aplicação destes testes paramétrico não são respeitadas, pode-se optar pela alternativa não paramétricas correspondente. No entanto, os testes não paramétricos, tal como o seu nome indica, não avaliam hipóteses sobre parâmetros, pelo que as duas abordagens (paramétrica e nãoparamétrica) não coincidem totalmente. Os testes não paramétricos testam, de um forma geral, igualdade de distribuições. Condições de aplicação Árvore de decisão (testes não-paramétricos) Em geram, os testes não paramétricos exigem apenas que... Teste de conformidade Não existe alternativa não-paramétrica As observações de uma amostra sejam independentes entre si. As observações resultem da mediação de uma variável métrica (medida ao nível ordinal ou de escala). Testes nãoparamétricos equivalentes a testes sobre valores médios Teste de diferenças Comparar dois valores médios Comparar mais de dois valores médios Amostras emparelhadas Amostras independentes Amostras independentes Amostras emparelhadas Nonparametric tests 2 Related samples (Wilcoxon) Nonparametric tests 2 Independent samples (Mann-Whitney) Nonparametric tests K Independent samples (Kruskal-Wallis) Nonparametric tests K Related samples (Friedman) Ranking Ranking Os testes não paramétricos indicados não se baseiam nos dados originalmente recolhidos mas na sua conversão em ranks (ordens). Exemplo de ranking Dados originais 7,2 4,4 3 2,8 1 9,3,2 2 Ranks As ordens ignoram o valor das diferenças existentes entre observações, transformando uma variável medida ao nível escalar numa variável ordinal. Exemplo de ranking com empates Dados originais Ordenação Ranks 2,8 1 ou 2 1, 2,8 1 ou 2 1,,2 3 3,4 4 ou ou 6,4 4 ou ou 6,4 4 ou ou 6 7, ,3 8 8 Faz-se a média das ordens: (1+2)/2 = 1, Faz-se a média das ordens: (4++6)/3 = 2

26 Testes de hipóteses Sua aplicações e limites Parte 4 Desenhos experimentais complexos Planos experimentais factoriais Em investigação experimental, é frequente estudar o efeito simultâneo de dois ou mais factores no desempenho dos participantes. Por exemplo Testar a agradabilidade provocada pelo contacto com um estímulo táctil em que se variou diferentes características (textura e temperatura). Factores / modalidade / condições Situações multifactoriais Frio Normal Quente Húmido Seco Liso Frio Normal Quente Frio Normal Quente Rugoso Trata-se de um plano experimental bifactorial, pois manipularam-se dois factores: o factor experimental textura tem duas modalidades (liso e rugoso) e o factor experimental temperatura tem três modalidades (frio, normal e quente). Para avaliar o efeito destas seis condições experimentais na variável dependente ( agradabilidade sentida ), dever-se-á recorrer a uma ANOVA 2x3. Liso Rugoso O plano experimental anterior pode estender-se a três factores, incluindo um factor adicional (por exemplo, a humidade do estímulo: seco ou húmido), passando assim a uma situação trifactorial e definindo-se 2 x 3 x 2 = 12 condições experimentais. Natureza dos factores Plano experimental entre-sujeitos Existem dois tipos de factores experimentais: Factores entre-sujeitos (between subjects) quando cada sujeito experimental é exposto apenas a uma modalidade de cada factor. Factores intra-sujeitos (within subjects) quando um sujeito é exposto a mais do que uma modalidade de um mesmo factor. Liso Rugoso Frio Pedro João Maria Vasco Manuel Julieta Normal Tiago Hugo Vânia Paula José Mário Quente Joaquim Vanessa Rui Raul Tânia Paulo Nesta experiência, cada sujeito é exposto a uma única condição. Para comparar condições temos de comparar o desempenho de sujeitos diferentes. Assim, trata-se de um plano experimental entre-sujeitos (between subjects design). 26

27 Plano experimental intra-sujeitos Plano experimental misto Frio Normal Quente Frio Normal Quente Liso Pedro João Maria Pedro João Maria Pedro João Maria Liso Pedro João Maria Tiago Hugo Vânia Joaquim Vanessa Rui Rugoso Pedro João Maria Pedro João Maria Pedro João Maria Rugoso Pedro João Maria Tiago Hugo Vânia Joaquim Vanessa Rui Nesta experiência, cada sujeito é exposto a todas as condições experimentais. Para comparar condições temos de comparar o desempenho de cada sujeito numa condição com o seu desempenho noutra condição. Assim, trata-se de um plano experimental intrasujeitos puro (within subjects design). Nesta experiência, cada sujeito é exposto às duas modalidades do factor textura mas apenas a uma modalidade do factor temperatura. Num dos factores ( textura ) o desempenho do sujeito numa condição pode ser comparado com o seu desempenho noutra condição; no outro factor ( temperatura ), o seu desempenho é comparado com o desempenho de outros sujeitos. Assim, trata-se de um plano experimental misto (mixed design): a textura é um factor intra-sujeitos e a temperatura um factor entresujeitos. Interacção Em estudos com mais de um factor, o foco de interesse é o efeito da interacção entre esses factores na variável dependente. Testes de hipóteses Sua aplicações e limites Será o efeito de um factor independente do outro factor ou o seu efeito conjunto leva a produzir padrões de resultados inesperados? A. ANOVA bifactorial A análise das interacções é um ponto fundamental na investigação psicológica. ANOVA bifactorial (para grupos independentes) ANOVA bifactorial EXEMPLO Objectivo: avaliar o impacto de uma formação breve nas competências para utilizar software estatístico. Amostra: grupo de controlo (20 estudantes) e grupo experimental (20 estudantes que receberam a formação breve). Cada grupo foi definido de forma a garantir que metade dos estudantes tivessem experiência no uso de software (grupo de experientes) e a outra metade não tivesse qualquer experiência de utilização de software (grupo de não experientes). Plano experimental bifactorial entre-sujeitos Factores Formação: Grupo experimental versus Grupo de controlo Experiência: Experientes versus Não-experientes Variável dependente Competências de utilização demonstradas numa tarefa com o software em causa Procedimento de análise: ANOVA 2x2 27

28 Fontes de variação nos dados Fontes de variação nos dados Porque razão duas observações deste estudo são diferentes? Porque os sujeitos receberam formação diferente (efeito do factor Formação ). Porque os sujeitos têm experiências prévias diferente com software (efeito do factor Experiência ). Porque o efeito da formação nos sujeitos depende da sua experiência prévia (efeito da interacção entre Experiência e Formação ). Porque são pessoas diferentes (efeito residual) Serão este efeitos realmente significativos no desempenho? Efeitos presentes num plano bifactorial: Efeito do factor Formação Efeito do factor Experiência Efeitos principais (main effects) Efeito da interacção Experiência x Formação (interacção de 2ª ordem) Hipóteses Dados Factor formação H 0 : Não há diferenças entre Grupo Experimental e Grupo de Controlo H 1 : Há diferenças entre grupo Experimental e Grupo de Controlo Factor Experiência H 0 : Não há diferenças entre Experientes e Não-experientes H 1 : Há diferenças entre Experientes e Não-experientes Interacção entre formação e experiência H 0 : O efeito da formação é independente da experiência dos participantes. H 1 : O efeito da formação depende da experiência dos participantes. Resultados na tarefa Controlo (sem formação) Experimental (com formação) Inexperientes 11, 12, 13, 14, 10, 12, 11, 13, 14, 12 1, 16, 1, 17, 1, 16, 1, 17, 1, 16 Experientes 1, 14, 1, 16, 16, 1, 16, 17, 1, 14 1, 16 14, 19, 13, 14, 1, 16, 17, 17 A amostra total é constituída por 40 observações distribuídas pelas quatro condições experimentais. Homogeneidade das variâncias Interacção entre factores Teste de homogeneidade das variâncias de Levene Perante grupos independentes, a realização da ANOVA exige que as variâncias dos grupos em comparação sejam semelhantes. Como não se rejeita H 0 [F(3, 36) = 2,2, p = 0,111], pode-se assumir a homogeneidade das variâncias, pelo que existem condições para prosseguir a ANOVA. A vantagem das ANOVAs bifactoriais sobre as ANOVAs unifactoriais diz respeito à possibilidade de avaliar se os dois efeitos agem independentemente um do outro sobre a variável dependente ou se, pelo contrário, o efeito de um depende do efeito do outro (interacção). No exemplo em análise, será que o efeito benéfico da formação dependerá do facto dos sujeitos serem Experientes ou Inexperientes? Se não existe interacção significativa, os factores principais podem ser interpretados isoladamente. Quando existe interacção, não se pode falar dos efeitos principais isoladamente, uma vez que o efeito de um factor depende do efeito do outro. Assim, a interacção deve ser sempre interpretada em primeiro lugar, antes da interpretação dos efeitos principais. 28

29 Teste das hipóteses sobre valores médios efeito de interacção Gráfico de médias Efeito da interacção Formação x Experiência Rejeita-se H 0 [F(1, 36) = 1,8, p = 0,000], ou seja, o efeito da formação não é idêntico para experientes e não experientes; o esclarecimento sobre o significado desta interacção é facilitado pela análise do gráfico de médias. Interacção Formação x Experiência Enquanto que nos Experientes a formação parece ter um efeito negligenciável, o facto dos Inexperientes terem frequentado o curso de formação fez com que o seu desempenho se aproximasse do dos Experientes. Análise gráfica dos efeitos de interacção Análise gráfica dos efeitos de interacção B2 B1 A1 A2 A1 A2 A1 A2 Efeito A: n sig Efeito B: n sig Interacção: n sig Efeito A: n sig Efeito B: sig Interacção: n sig Efeito A: sig Efeito B: sig Interacção: n sig Nota: a ausência de interacção detecta-se facilmente através de um gráfico de médias: as linhas são grosseiramente paralelas. A1 A2 A1 A2 A1 A2 Efeito A: n sig Efeito B: sig Interacção: sig Efeito A: sig Efeito B: n sig Interacção: sig Efeito A: n sig Efeito B: n sig Interacção: sig A1 Efeito A: sig Efeito B: sig A2 Interacção: sig Nota: a presença de interacção detecta-se facilmente através de um gráfico de médias: as linhas cruzam, convergem ou divergem. Identificação das diferenças significativas numa interacção Identificação das diferenças significativas numa interacção Os diversos padrões de interacção que podem surgir obrigam a identificar que condições diferem entre si. O SPSS não permite fazer comparações post hoc para efeitos de interacção, pelo que é preciso recorrer a testes t de Student ou a ANOVAs para identificar que médias diferem umas das outras. Nestes casos, é necessário usar sempre a correcção de Bonferroni. Grupo de experientes Grupo de inexperientes NOTA: para realizar esta comparação post hoc com o teste t, utilize o comando split file para fazer a análise separadamente em função do nível de experiência. 29

30 Identificação das diferenças significativas numa interacção Teste das hipóteses sobre valores médios efeitos principais Como estamos a fazer dois testes, a correcção de Bonferroni recomenda usar o nível de significância α/2 = 0,0/2 = 0,02. Confirma-se, assim, que a formação não exerce efeito nos experientes (médias: 1,3 vs 1,6; t = -0,47, df = 18, p = 0,643) mas melhora significativamente o desempenho dos inexperientes (médias: 12,2 vs 1,7; t = -7,13, df = 18, p = 0,000). Efeito da Formação Rejeita-se H 0 [F(1, 36) = 22,3, p = 0,000], ou seja, a formação introduziu diferenciação significativa no desempenho da tarefa. Pela tabela das estatísticas descritivas, pode-se observar que o grupo experimental (com formação) teve um desempenho médio significativamente superior ao grupo de controlo (1,6 versus 13,7). Teste das hipóteses sobre valores médios efeitos principais Conclusão geral Efeito da Experiência Rejeita-se H 0 [F(1, 36) = 13,9, p = 0,001], ou seja, a experiência introduziu diferenciação significativa no desempenho da tarefa. Pela tabela das estatísticas descritivas, pode-se observar que, independentemente da formação, o grupo experiente teve um desempenho médio significativamente superior ao grupo inexperiente (1,4 versus 13,9). A formação parece ter efeito positivo apenas no grupo de inexperientes, permitindo-lhes um nível de desempenho igual aos experientes. O seu benefício para os Experientes é não significativo. Apesar dos efeitos principais serem significativos, perdem significado perante a interacção detectada (ou seja, a vantagem dos Experientes observa-se apenas na condição Sem formação e a vantagem da formação observa-se apenas para o grupo de Inexperientes). Dificuldades na interpretação dos efeitos de interacção Efeito de tecto e efeito de chão A presença de efeitos designados por ceiling effect ou floor effect pode tornar inviável a interpretação das interacções. Efeito de tecto (ceiling effect) ocorre quando o desempenho de um dos grupos se aproxima do nível máximo possível permitido pela prova (ou seja, a prova é demasiadamente fácil para esse grupo). Efeito de chão (floor effect) ocorre quando o desempenho de um dos grupos se aproxima do nível mínimo permitido pela prova (a prova é demasiadamente difícil para esse grupo). Uma interacção significativa entre dois factores pode ser um artefacto devido à presença de efeito de tecto ou de efeito de chão, tornando assim a investigação inconclusiva. Por essa razão, o investigador deve garantir que a prova ou teste que está a utilizar para avaliar o desempenho dos sujeitos seja suficientemente discriminativa (nem muito fácil nem muito difícil), para garantir que os níveis de desempenho se situem a um nível médio (longe do tecto e longe do chão ). 30

31 Efeito de tecto Efeito de chão Neste exemplo, o grupo A tem um desempenho próximo do máximo (100%) em ambas as condições experimentais (ceiling effect). Respostas correctas (%) Com Luz Sem Luz Grupo A Grupo B A análise estatística vai detectar uma interacção que, muito provavelmente, será um artefacto devido ao ceiling effect. O facto do grupo A ter-se aproximado do nível máximo de desempenho em ambas as condições não garante que, numa prova mais difícil, o seu desempenho não diferisse entre condições, assemelhandose ao do grupo B (as linhas do gráfico ficariam então paralelas e deixaria de haver interacção). Neste exemplo, o grupo B tem um desempenho próximo do nível mínimo que a prova permite (0%) em ambas as condições experimentais (floor effect). Respostas correctas (%) Com Luz Sem Luz Grupo A Grupo B Também aqui a ANOVA vai detectar uma interacção significativa que será um artefacto devido à presença de floor effect. O facto do grupo B ter-se aproximado sistematicamente do nível mínimo de desempenho em ambas as condições não garante que, numa prova mais fácil, o seu desempenho permitisse uma dissociação entre condições experimentais, semelhante à observada no grupo A. Testes de hipóteses Sua aplicações e limites B. ANOVA bifactorial com medidas repetidas ANOVA com medidas repetidas Planos bifactoriais em que ambos os factores são intra-sujeitos são frequentes em estudos experimentais, quando o mesmo conjunto de sujeitos é exposto às diferentes condições manipuladas pelo experimentador. A utilização da mesma amostra nas diferentes condições permite reduzir a variação residual atribuível a diferenças individuais. No entanto, é preciso cuidados metodológicos especiais neste tipo de estudos, para evitar efeitos de ordem no desempenho dos sujeitos (cansaço, treino, expectativas). ANOVA com medidas repetidas ANOVA com medidas repetidas EXEMPLO Objectivo: avaliar o efeito da fase do dia (manhã e noite) e da natureza do material (letras, números, formas geométricas) no desempenho em provas de memória imediata. Plano experimental: 30 sujeitos expostos a três condições experimentais durante a manhã (memorizar letras, números e formas geométricas) e às mesmas três condições experimentais durante o início da noite. Regista-se o número de respostas certas nas diferentes provas de memória. Foram acautelados os efeitos de ordem. EXEMPLO Plano experimental intra-sujeitos Factores (within subject): Tipo de material: letras, números, formas Fase do dia: manhã, noite Variável dependente: Desempenho nas provas de memória imediata Procedimento de análise: ANOVA 3 x 2 com medidas repetidas 31

32 Hipóteses Dados Factor Fase do dia H 0 : Não há diferenças de desempenho entre a manhã e a noite H 1 : Existem diferenças entre a manhã e a noite Factor Tipo de material H 0 : Não há diferenças de desempenho para os três tipos de material H 1 : Pelo menos um dos tipos de material levou a desempenho diferentes dos restantes Interacção entre factores H 0 : O efeito do tipo de material é independente da fase do dia do teste H 1 : O efeito do tipo de material depende da fase do dia do teste Trinta sujeitos expostos a seis (2 x 3) condições experimentais. Como se trata de um plano de estudo com medidas repetidas, a base de dados inclui 30 linhas (sujeitos) e 6 colunas (condições). Os valores referem a acuidade das respostas dadas nas provas de memória imediata realizadas em cada condição. ANOVA com medidas repetidas no SPSS ANOVA com medidas repetidas no SPSS É necessário atribuir um nome aos dois factores within subjects e identificar o número de níveis que eles possuem. Aqui trata-se do factor fase_dia (com duas modalidades: manhã e noite ) e do factor material (com três modalidades: letras, números e formas ). Atribuir as seis variáveis aos factores within subjects. Options Solicitar um gráfico de médias, para facilitar a interpretação de eventuais interacções. Output estatísticas descritivas Output esfericidade Descriptive Statistics Mauchly's Test of Sphericity b manha_num manha_let manha_for noite_num noite_let noite_for Mean Std. Deviation N 7,37 2, ,10 2, ,10 2, ,00 2, ,40 2, ,97 2, Estatísticas descritivas: acuidade no desempenho em cada prova Measure: MEASURE_1 Epsilon a Approx. Greenhous Within Subjects Effect Mauchly's W Chi-Square df Sig. e-geisser Huynh-Feldt Lower-bound fase_dia 1,000, ,000 1,000 1,000 material,203 44,687 2,000,6,63,00 fase_dia * material,778 7,020 2,030,818,861,00 Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept Within Subjects Design: fase_dia+material+fase_dia*material Rejeita-se a hipótese de esfericidade nos casos em que ela tem de ser testada (ou seja, para o factor material, que tem 3 níveis, e na interacção que tem 2x3 níveis). Por haver problemas de esfericidade, é preciso proceder às devidas correcções na ANOVA (correcção de Greenhouse-Geisser). 32

33 Output teste das hipóteses Output teste das hipóteses Como se referiu anteriormente, nos planos bifactoriais deve-se começar sempre por verificar se a interacção é significativa antes de analisar os efeitos principais Isto porque, caso a interacção seja significativa, é arriscado falar do efeito isolado de um factor sem que se tenha, obrigatoriamente, de referir o outro factor (uma vez que os dois factores interagem na influência que têm sobre a variável dependente). Apenas quando a interacção não é significativa é que o efeito isolado de cada factor pode ser referido, independentemente do outro factor da experiência. Measure: MEASURE_1 Source fase_dia Error(fase_dia) material Error(material) fase_dia * material Error(fase_dia*material) Tests of Within-Subjects Effects Type III Sum of Squares df Mean Square F Sig. Sphericity Assumed 24, ,200 34,88,000 Greenhouse-Geisser 24,200 1,000 24,200 34,88,000 Huynh-Feldt 24,200 1,000 24,200 34,88,000 Lower-bound 24,200 1,000 24,200 34,88,000 Sphericity Assumed 20,133 29,694 Greenhouse-Geisser 20,133 29,000,694 Huynh-Feldt 20,133 29,000,694 Lower-bound 20,133 29,000,694 Sphericity Assumed 302, ,406 16,892,000 Greenhouse-Geisser 302,811 1, ,119 16,892,000 Huynh-Feldt 302,811 1,12 269,07 16,892,000 Lower-bound 302,811 1, ,811 16,892,000 Sphericity Assumed 19,86 8 8,963 Greenhouse-Geisser 19,86 32,271 16,109 Huynh-Feldt 19,86 32,636 1,929 Lower-bound 19,86 29,000 17,926 Sphericity Assumed 21, ,717 13,741,000 Greenhouse-Geisser 21,433 1,637 13,093 13,741,000 Huynh-Feldt 21,433 1,722 12,449 13,741,000 Lower-bound 21,433 1,000 21,433 13,741,001 Sphericity Assumed 4,233 8,780 Greenhouse-Geisser 4,233 47,472,93 Huynh-Feldt 4,233 49,928,906 Lower-bound 4,233 29,000 1,60 A interacção entre os dois factores é significativa (correcção de Greenhouse- Geisser). Output teste das hipóteses (interacção) Output gráfico de médias Efeito da interacção entre factores Rejeita-se H 0 [F(1.6, 47.) = 13,7, p = 0,000], ou seja, as diferenças de desempenho nas três provas não são iguais de manhã e à noite ou seja, as diferenças entre o desempenho matinal e nocturno não é igual nas três provas. ou seja, o efeito do tipo de material depende da altura do dia em que a prova é realizada. Interacção entre material e fase do dia A capacidade de memória para números e para formas parece semelhante nos dois momentos de avaliação; a memória para letras parece ser mais eficaz durante a manhã. Para verificar a significância desta leitura, é preciso proceder a análises post hoc. Identificação das diferenças significativas na interacção (análise post hoc) Output teste das hipóteses (efeitos principais) A comparação post hoc entre as médias do gráfico de interacção poderá ser feita recorrendo ao teste t para amostras emparelhadas (com correcção de Bonferroni, utilizando-se o valor α/3 = 0.0/3 = , pois é realizado um conjunto de três testes). Efeito do tipo de material Rejeita-se H 0 [F(1.1, 32.3) = 16,9, p = 0,000], ou seja, o desempenho de pelo menos uma das provas é diferente dos restantes. Pair 1 Pair 2 Pair 3 manha_num - noite_num manha_let - noite_let manha_for - noite_for Paired Samples Test Paired Differences 9% Confidence Interval of the Difference Std. Error Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed) 1,249,222,367 1,608,294 -,234, ,700 1,119,204 1,282 2,118 8,323 29,000,133,819,10 -,173,439,891 29,380 A análise post hoc permite afirmar que apenas na prova de memória para letras existe diferença significativa entre manhã e noite (t = 8,3, gl = 29, p = 0,000). Como este factor tem três modalidades, é preciso proceder a análises post hoc para identificar que modalidades são diferentes entre si (apenas sabemos que pelo menos uma difere das restantes). 33

34 Output análise post hoc Output teste das hipóteses (efeitos principais) Measure: MEASURE_1 (I) material (J) material Based on estimated marginal means Pairwise Comparisons 9% Confidence Interval for Mean Difference a Difference (I-J) Std. Error Sig. a Lower Bound Upper Bound 1,933*,69,019,260 3,607 *. The mean difference is significant at the,0 level. a. Adjustment for multiple comparisons: Bonferroni. Comparação entre materiais 3,10*,66,000 1,483 4,817-1,933*,69,019-3,607 -,260 1,217*,179,000,762 1,671-3,10*,66,000-4,817-1,483-1,217*,179,000-1,671 -,762 Análise post hoc através do método de Bonferroni Observam-se diferenças significativas entre o desempenho nas três provas, pelo que se pode afirmar que, independentemente da hora do dia, a capacidade de memória para números é sempre melhor do que a capacidade de memória para letras e ambas são melhores do que a capacidade de memória para formas geométricas. Efeito da fase do dia Rejeita-se H 0 [F(1, 29) = 34,9, p = 0,000], ou seja, o desempenho geral nas provas de memória depende da fase do dia em que foi avaliado. A análise das médias indica que o desempenho geral nas provas de memória durante a manhã é superior ao desempenho durante a noite (neste caso, como o factor fase do dia apenas tem duas modalidades, não é preciso proceder a análises post hoc); no entanto, a análise da interacção revelounos que essa diferença deve-se sobretudo à prova de letras.. Conclusão geral Embora o desempenho de provas de memória seja sistematicamente melhor quando se trabalha com números e pior quando se trabalha com formas geométricas, o desempenho em provas de memória que utilizem letras parece depender da altura do dia em que a prova é realizada. Testes de hipóteses Sua aplicações e limites C. ANOVA mista ANOVA com plano experimental misto ANOVA com plano experimental misto EXEMPLO Objectivo: avaliar o efeito de uma sessão de relaxamento na pressão arterial sistólica. Plano experimental: Após uma prova de esforço (destinada a aumentar a pressão arterial), 30 sujeitos foram aleatoriamente distribuídos por dois grupos: um grupo realizou uma sessão de relaxamento activo com duração de 10 minutos (grupo experimental) e o outro grupo ficou em repouso (grupo de controlo). Mediu-se a pressão arterial antes e depois de cada sessão. Pretende-se avaliar se a sessão de relaxamento activo teve mais efeito na redução da tensão arterial do que sessão de repouso. Plano experimental misto Factores: Tempo: antes da sessão versus depois da sessão (factor within subjects) Tipo de sessão: relaxamento activo versus repouso (factor between subjects) Variável dependente: Pressão arterial sistólica Procedimento de análise: ANOVA com medidas repetidas 34

35 Hipóteses Dados Factor Tempo H 0 : Não há diferenças na pressão arterial antes e depois das sessões H 1 : Há diferenças na pressão arterial antes e depois das sessões Factor Tipo de Relaxamento H 0 : Não há diferenças entre Relaxamento Activo e Repouso H 1 : Há diferenças entre Relaxamento Activo e Repouso Interacção entre factores Esta é a hipótese que interessa explorar nesta investigação, pois permite averiguar se o tipo de relaxamento afecta a descida da pressão arterial. H 0 : A diferença na pressão antes e depois é independente do tipo de relaxamento H 1 : A diferença na pressão antes e depois depende do tipo de relaxamento Trinta sujeitos distribuídos por duas condições experimentais Os valores referem à pressão arterial sistólica (PA) antes e depois do tratamento (sessão de relaxamento / repouso) Homogeneidade de variâncias Esfericidade PA_antes PA_depois Levene's Test of Equality of Error Variances a F df1 df2 Sig.,732, , ,97 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+Sessão Within Subjects Design: tempo Homogeneidade das variâncias Como nesta análise existe um factor entre-sujeitos, é necessário verificar se a variância das variáveis em estudo (PA_antes e PA_depois) é igual nos dois grupos em comparação. Verifica-se existir homogeneidade das variâncias para as duas variáveis (para ambas a variáveis, p > 0,00), pelo que se pode prosseguir a ANOVA. Measure: MEASURE_1 Within Subjects Effect tempo Teste da esfericidade Mauchly's Test of Sphericity b Epsilon a Approx. Greenhous Mauchly's W Chi-Square df Sig. e-geisser Huynh-Feldt Lower-bound 1,000, ,000 1,000 1,000 Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept+Sessão Within Subjects Design: tempo Como o factor within tem apenas dois níveis ( antes e depois ) não faz sentido testar a esfericidade da matriz das covariâncias. Teste das hipóteses factor within Teste das hipóteses factor between Measure: MEASURE_1 Source tempo tempo * Sessão Error(tempo) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Tests of Within-Subjects Effects Efeito do Tempo (efeito within) Type III Sum of Squares df Mean Square F Sig. 390,10 390,10 104,04, ,10 1, ,10 104,04, ,10 1, ,10 104,04, ,10 1, ,10 104,04,000 30, ,817 8,24,008 30,817 1,000 30,817 8,24,008 30,817 1,000 30,817 8,24,008 30,817 1,000 30,817 8,24, , , ,33 28,000 3, ,33 28,000 3, ,33 28,000 3,733 A significância do efeito do facto within (Tempo) lê-se nesta linha pois não se coloca a exigência da esfericidade. Como seria de esperar (pois a pressão arterial deverá baixar naturalmente 10 minutos após a conclusão do exercício), rejeita-se H 0 [F(1, 28) = 104,, p = 0,000], ou seja, há diferenças na pressão arterial antes e depois das sessões. Measure: MEASURE_1 Transformed Variable: Average Source Intercept Sessão Error Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig , , ,34, , ,017,37, , ,267 Efeito da Sessão (efeito between) Não se rejeita H 0 [F(1, 28) = 0,4, p = 0,4], ou seja, não existe diferença entre sessões. Atenção: como se trata de um factor between, o SPSS apresenta o teste correspondente numa tabela diferente da anterior. 3

36 Teste das hipóteses - interacção Gráfico de médias Measure: MEASURE_1 Source tempo tempo * Sessão Error(tempo) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Tests of Within-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 390,10 390,10 104,04, ,10 1, ,10 104,04, ,10 1, ,10 104,04, ,10 1, ,10 104,04,000 30, ,817 8,24,008 30,817 1,000 30,817 8,24,008 30,817 1,000 30,817 8,24,008 30,817 1,000 30,817 8,24, , , ,33 28,000 3, ,33 28,000 3, ,33 28,000 3,733 Efeito da interacção Tempo x Sessão (efeito misto) Existe interacção entre Tempo e Sessão [F(1, 28) = 8,3, p = 0,008], ou seja, a redução da pressão observada entre o momento antes e depois é diferente no grupo que fez relaxamento e no grupo de repouso. Interacção Tempo x Sessão A diminuição da tensão entre o momento antes e depois (efeito do Tempo) é distinta nos dois grupos: tal diminuição é mais marcada no grupo que seguiu a sessão de relaxamento. Identificação das diferenças significativas na interacção Identificação das diferenças significativas na interacção Também aqui poderá ser necessário fazer comparações post hoc para identificar que médias diferem umas das outras. O teste a escolher depende se se está trabalhar com o factor intra-sujeitos ou o factor entre-sujeitos É necessário usar sempre a correcção de Bonferroni. Duas alternativas de análise Fazer análise do factor intra-sujeitos para cada grupo definido pelo factor entre-sujeitos. Fazer a comparação entre os grupos definido pelo factor entre-sujeitos para cada um dos momentos definidos pelo factor intra-sujeitos. Identificação das diferenças significativas na interacção Identificação das diferenças significativas na interacção Grupo Sessão = repouso Grupo Sessão = relaxamento Verifica-se que o efeito entre o início e o fim da sessão é significativo para os dois tipos de sessão (repouso: t = 9,49, df = 14, p = 0,000; relaxamento: t = 7,10, df = 14, p = 0,000). No entanto, a diminuição dos níveis médios de pressão é maior nas sessões de relaxamento (diferença entre médias = 6,3) do que nas sessões de repouso (diferença entre médias = 3,67). Uma sessão de relaxamento activo parece ter um efeito mais marcado na redução da pressão arterial após exercício do que uma sessão de repouso simples. 36

37 Conclusão Testes de hipóteses Sua aplicações e limites Uma sessão de relaxamento activo parece ter um efeito mais marcado na redução da pressão arterial após exercício do que uma sessão de repouso simples. D. Situações mais complexas ANOVAs mais complexas Análise bifactorial com mais de duas modalidades Podem surgir estudos mais complexos, dependendo do número de factores envolvidos e do número de modalidades presentes em cada factor: a) Estudos com dois factores, mas onde cada factor tem mais de duas modalidades (por exemplo, ANOVA 3 x 4) b) Estudos com mais do que dois factores análise de variância multifactorial (por exemplo, ANOVA 2 x 3 x 2). Velocidade de leitura Experientes Inexperientes ANOVA 3 x 2 O efeito da iluminação é diferente consoante o nível de experiência do sujeito: ser leitor experiente traz vantagens para a velocidade de leitura em condições de penumbra. 10 Luz Penumbra Sombra Condições de leitura ANOVA 3 x 4 Análise multifactorial ESS baixo ESS médio ESS alto O aumento do número de modalidades de cada factor dificulta a interpretação da interacção. Quanto existem três factores em jogo (A, B e C), para além dos factores principais (main effects) e da interacção de 2ª ordem (interacção entre pares de factores: AxB, AxC e BxC), existe ainda a interacção de 3ª ordem entre os três factores (AxBxC) º ano 2º ano 3º ano 4º ano A análise post-hoc desta interacção implica o recurso à ANOVA unifactorial e ao método de Tukey (para comparar, por exemplo, o desempenho dos três grupos ESS em cada ano de escolaridade). A dificuldade em interpretar os efeitos de interacção aumenta rapidamente assim que se passa para análises com mais do que três factores. 37

38 Análise trifactorial Interacção de 3ª ordem Considere-se que se pretende avaliar a presença de música na sessão de relaxamento (com música ou sem música) tem efeito na redução da pressão sistólica (antes versus depois), procurando averiguar se esse feito é diferente entre homens e mulheres. Temos uma ANOVA 2 x 2 x 2, com os seguintes factores: Sexo (masculino vs feminino) Momento (antes vs depois) Condição experimental (com música vs sem música) A redução da pressão sistólica (antes versus depois) é diferente entre sexos quando o treino é feito sem música (as mulheres relaxam mais) mas igual nos dois sexos quando o treino é feito com música. Testes de hipóteses Sua aplicações e limites ANCOVA Analysis of Covariance Covariáveis são variáveis de natureza quantitativa utilizadas em ANOVA para reduzir a variação devida ao erro residual, aumentando assim a potência do teste para detectar diferenças. E. ANCOVA No estudo sobre o efeito do ruído na compreensão de um texto podemos considerar que o resultado numa prova de Vocabulário (medida da vocabulário que o sujeito possui) está correlacionado com a compreensão do texto, pelo que pode ser usado para tornar o teste mais sensível (mais potente) pois controla-se o efeito dessa variável estranha no efeito que se pretende avaliar (efeito das condições de ruído na compreensão de um texto). ANCOVA Analysis of Covariance ANCOVA Analysis of Covariance EXEMPLO Objectivo: avaliar o ruído ambiental na compreensão de um texto. ANOVA (sem covariável) ANOVA Acertos Amostra: três grupos de 4 crianças cada foram expostos a três condições ambientais distintas (silêncio vs música de fundo vs ruído de fundo) ouviram a leitura de um texto. No final, foram feitas perguntas para avaliar a compreensão do texto escutado. Considerou-se que o conhecimento de vocabulário se relaciona com a compreensão de textos, pelo que se pretendeu usar essa variável para controlar essa fonte de variação e tornar o estudo mais sensível às diferenças entre as condições experimentais. Between Groups Within Groups Sum of Squares df Mean Square F Sig. 34, ,333 1,600,001 10, ,111 44, Rejeita-se H 0 [F(2, 9) = 1,6, p = 0,001]: existem diferenças entre condições de ruído. 38

Testes de Hipóteses Estatísticas

Testes de Hipóteses Estatísticas Capítulo 5 Slide 1 Testes de Hipóteses Estatísticas Resenha Hipótese nula e hipótese alternativa Erros de 1ª e 2ª espécie; potência do teste Teste a uma proporção; testes ao valor médio de uma v.a.: σ

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia Métodos Estatísticos Avançados em Epidemiologia Análise de Variância - ANOVA Cap. 12 - Pagano e Gauvreau (2004) - p.254 Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 1 / 39 Introdução Existem

Leia mais

CAPÍTULO IV Análise de variância

CAPÍTULO IV Análise de variância CAPÍTULO IV Análise de variância O objectivo principal da análise de variância (analysis of variance - ANOVA) é a comparação de mais do que dois grupos no que diz respeito à localização. Para exemplificar,

Leia mais

Bioestatística Básica RCA 5804 COMPARANDO GRUPOS INDEPENDENTES. Prof. Dr. Alfredo J Rodrigues

Bioestatística Básica RCA 5804 COMPARANDO GRUPOS INDEPENDENTES. Prof. Dr. Alfredo J Rodrigues Bioestatística Básica RCA 5804 COMPARANDO GRUPOS INDEPENDENTES Prof. Dr. Alfredo J Rodrigues Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo alfredo@fmrp.usp.br

Leia mais

Estatística Analítica

Estatística Analítica Teste de Hipótese Testes Estatísticos 2 Teste de Hipótese Testes Estatísticos 3 1 Teste de Hipótese Testes Estatísticos 4 Principais Testes: Teste Qui-quadrado Teste T de Student Teste ANOVA Teste de Correlação

Leia mais

Capítulo 6 Estatística não-paramétrica

Capítulo 6 Estatística não-paramétrica Capítulo 6 Estatística não-paramétrica Slide 1 Teste de ajustamento do Qui-quadrado Testes de independência e de homogeneidade do Qui-quadrado Testes dos sinais e de Wilcoxon Teste de Mann-Whitney Teste

Leia mais

Estimação e Testes de Hipóteses

Estimação e Testes de Hipóteses Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas

Leia mais

AULA 19 Análise de Variância

AULA 19 Análise de Variância 1 AULA 19 Análise de Variância Ernesto F. L. Amaral 18 de outubro de 2012 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro: LTC. Capítulo

Leia mais

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA Determinada a pergunta/ hipótese Recolhidos os dados Análise descritiva = Estatística descritiva QUAIS TESTES ESTATÍSTICOS DEVEM SER REALIZADOS?? PROFESSORA:

Leia mais

Testes de Hipóteses. : Existe efeito

Testes de Hipóteses. : Existe efeito Testes de Hipóteses Hipótese Estatística de teste Distribuição da estatística de teste Decisão H 0 : Não existe efeito vs. H 1 : Existe efeito Hipótese nula Hipótese alternativa Varia conforme a natureza

Leia mais

ANÁLISE ESTATÍSTICA com o SPSS Statistics

ANÁLISE ESTATÍSTICA com o SPSS Statistics João Marôco 5 a. Edição ANÁLISE ESTATÍSTICA com o SPSS Statistics ANÁLISE ESTATÍSTICA com o SPSS Statistics 5ª Edição JOÃO MARÔCO É proibida toda e qualquer reprodução desta obra por qualquer meio físico

Leia mais

Análise de Variância (ANOVA)

Análise de Variância (ANOVA) Análise de Variância (ANOVA) A Regressão Linear visa modelar uma variável resposta numérica (quantitativa), à custa de uma ou mais variáveis preditoras, igualmente numéricas. Mas uma variável resposta

Leia mais

Testes de Hipótese para uma única Amostra - parte I

Testes de Hipótese para uma única Amostra - parte I Testes de Hipótese para uma única Amostra - parte I 26 de Junho de 2014 Objetivos Ao final deste capítulo você deve ser capaz de: Estruturar problemas de engenharia como testes de hipótese. Entender os

Leia mais

AULA 05 Teste de Hipótese

AULA 05 Teste de Hipótese 1 AULA 05 Teste de Hipótese Ernesto F. L. Amaral 03 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução

Leia mais

Amostragem. Cuidados a ter na amostragem Tipos de amostragem Distribuições de amostragem

Amostragem. Cuidados a ter na amostragem Tipos de amostragem Distribuições de amostragem Amostragem Cuidados a ter na amostragem Tipos de amostragem Distribuições de amostragem 1 Muito Importante!! Em relação às amostras, deve assegurar-se a sua representatividade relativamente à população

Leia mais

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro Exame de Recorrência de Métodos Estatísticos Departamento de Matemática Universidade de Aveiro Data: 6/6/6 Duração: 3 horas Nome: N.º: Curso: Regime: Declaro que desisto Classificação: As cotações deste

Leia mais

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência NOME:

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência NOME: DEPARTAMENTO DE MATEMÁTICA DA UNIVERSIDADE DE COIMBRA Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência 24-05-2011 NOME: Observação: A resolução completa das perguntas inclui

Leia mais

ANOVA FACTORIAL EXEMPLO 1. ANOVA TWO-WAY COM O SPSS. a capacidade de reconhecimento do odor materno

ANOVA FACTORIAL EXEMPLO 1. ANOVA TWO-WAY COM O SPSS. a capacidade de reconhecimento do odor materno ANOVA FACTORIAL Quando a variável dependente é influenciada por mais do que uma variável independente (Factor) estamos interessados em estudar o efeito não só de cada um dos factores mas e também a possível

Leia mais

PODER DO TESTE. Poder do Teste e Tamanho de Amostra para Testes de Hipóteses

PODER DO TESTE. Poder do Teste e Tamanho de Amostra para Testes de Hipóteses PODER DO TESTE Poder do Teste e Tamanho de Amostra para Testes de Hipóteses 1 2 Tipos de erro num teste estatístico Realidade (desconhecida) Decisão do teste aceita H 0 rejeita H 0 H 0 verdadeira decisão

Leia mais

Testes de Hipóteses Paramétricos

Testes de Hipóteses Paramétricos Testes de Hipóteses Paramétricos Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução Exemplos Testar se mais de metade da população irá consumir um novo produto

Leia mais

7 Teste de Hipóteses

7 Teste de Hipóteses 7 Teste de Hipóteses 7-1 Aspectos Gerais 7-2 Fundamentos do Teste de Hipóteses 7-3 Teste de uma Afirmação sobre a Média: Grandes Amostras 7-4 Teste de uma Afirmação sobre a Média : Pequenas Amostras 7-5

Leia mais

Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia 1 / 44 Métodos Estatísticos Avançados em Epidemiologia Análise de Variância - ANOVA Referência: Cap. 12 - Pagano e Gauvreau (2004) - p.254 Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG 2 / 44

Leia mais

Testes de Hipóteses Paramétricos

Testes de Hipóteses Paramétricos Testes de Hipóteses Paramétricos Departamento de Matemática Escola Superior de Tecnologia de Viseu (DepMAT ESTV) Testes de Hipóteses Paramétricos 1 / 41 Introdução. Hipóteses Estatísticas. Erro Tipo I

Leia mais

([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV

([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV Data: 09/07/2003 ([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV Duração: 2 horas Nome: N.º: Curso: Regime: Número de folhas suplementares entregues pelo aluno: Declaro que desisto (VWDSURYDFRQVLVWHHPTXHVW}HVGHUHVSRVWDDEHUWDHDVUHVSHFWLYDVFRWDo}HVHQFRQWUDPVHQDWDEHODTXHVHVHJXH

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. http://www.mat.ufrgs.br/viali/ viali@mat.ufrgs.br Os testes O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos) William Gemmell Cochran (1909-1980)

Leia mais

Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar:

Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar: Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar: o tempo médio de efeito de dois analgésicos não é o mesmo; a popularidade de determinado partido político aumentou; uma

Leia mais

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV. INTRODUÇÃO Exemplos Para curar uma certa doença existem quatro tratamentos possíveis: A, B, C e D. Pretende-se saber se existem diferenças significativas nos tratamentos no que diz respeito ao tempo necessário

Leia mais

AULA 04 Teste de hipótese

AULA 04 Teste de hipótese 1 AULA 04 Teste de hipótese Ernesto F. L. Amaral 03 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal

Leia mais

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2 COMO USAR ESTE LIVRO ÍNDICE PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 Variáveis, Populações e Amostras 1.1. VARIÁVEIS ESTATÍSTICAS E ESCALAS DE MEDIDA 27 1.2. POPULAÇÃO VS. AMOSTRA

Leia mais

TESTES DE HIPÓTESES - Generalidades

TESTES DE HIPÓTESES - Generalidades TESTES DE HIPÓTESES - Generalidades Uma hipótese estatística é uma conjectura sobre uma característica da população. Um teste de hipóteses é um procedimento estatístico que averigua se os dados sustentam

Leia mais

Os testes. Objetivos. O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos)

Os testes. Objetivos. O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos) Prof. Lorí Viali, Dr. http://www.mat.ufrgs.br/viali/ viali@mat.ufrgs.br Os testes O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos) William Gemmell Cochran (1909-1980)

Leia mais

Aula 7. Testes de Hipóteses Paramétricos (II)

Aula 7. Testes de Hipóteses Paramétricos (II) Aula 7. Testes de Hipóteses Paramétricos (II) Métodos Estadísticos 008 Universidade de Averio Profª Gladys Castillo Jordán IC e TH para comparação de valores médios µ X e µ Y de duas populações Normais.

Leia mais

Análise da Variância. Prof. Dr. Alberto Franke (48)

Análise da Variância. Prof. Dr. Alberto Franke (48) Análise da Variância Prof. Dr. Alberto Franke (48) 91471041 Análise da variância Até aqui, a metodologia do teste de hipóteses foi utilizada para tirar conclusões sobre possíveis diferenças entre os parâmetros

Leia mais

Delineamento e Análise Experimental Aula 3

Delineamento e Análise Experimental Aula 3 Aula 3 Castro Soares de Oliveira Teste de hipótese Teste de hipótese é uma metodologia estatística que permite tomar decisões sobre uma ou mais populações baseando-se no conhecimento de informações da

Leia mais

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra) Testes de Tendência Central (média, mediana, proporção) Classificação Variável 1 Variável 2 Núm ero Gru pos Dependência Teste Z Paramétrico Quantitativa - 1 - Premissas Variância pop. * conhecida Teste

Leia mais

Aula 7. Testes de Hipóteses Paramétricos (II)

Aula 7. Testes de Hipóteses Paramétricos (II) Aula 7. Testes de Hipóteses Paramétricos (II) Métodos Estadísticos 008 Universidade de Averio Profª Gladys Castillo Jordán IC e TH para comparação de valores médios µ X e µ Y de duas populações Normais.

Leia mais

Case Processing Summary

Case Processing Summary 17. O ficheiro Banco.sav encerra informação relativa a 474 empregados contratados por um banco, entre 1969 e 1971. Este banco esteve envolvido num processo judicial no âmbito da Igualdade de Oportunidade

Leia mais

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas), uma

Leia mais

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO:

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO: INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 Estudos de Mercado EXAME: DATA 24 / 02 / 20010 NOME DO ALUNO: Nº INFORMÁTICO: TURMA: PÁG. 1_ PROFESSOR: ÉPOCA: Grupo I (10

Leia mais

Probabilidade e Estatística

Probabilidade e Estatística Probabilidade e Estatística TESTES DE HIPÓTESES (ou Testes de Significância) Estimação e Teste de Hipóteses Estimação e teste de hipóteses (ou significância) são os aspectos principais da Inferência Estatística

Leia mais

1 Teoria da Decisão Estatística

1 Teoria da Decisão Estatística 1 Teoria da Decisão Estatística 1.1 Teste de Hipótese É uma metodologia estatística que permite tomar decisão sobre uma ou mais populações baseando no conhecimento de informações da amostra. Ao tentarmos

Leia mais

Medidas de Dispersão ou variabilidade

Medidas de Dispersão ou variabilidade Medidas de Dispersão ou variabilidade A média - ainda que considerada como um número que tem a faculdade de representar uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

MOQ-14 Projeto e Análise de Experimentos

MOQ-14 Projeto e Análise de Experimentos Instituto Tecnológico de Aeronáutica Divisão de Engenharia Mecânica-Aeronáutica MOQ-14 Projeto e Análise de Experimentos Profa. Denise Beatriz Ferrari www.mec.ita.br/ denise denise@ita.br Regressão Linear

Leia mais

Testes (Não) Paramétricos

Testes (Não) Paramétricos Armando B. Mendes, DM, UAç 09--006 ANOVA: Objectivos Verificar as condições de aplicabilidade de testes de comparação de médias; Utilizar ANOVA a um factor, a dois factores e mais de dois factores e interpretar

Leia mais

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística Disciplina: Estatística Aplicada Professores: Héliton Tavares e Regina Tavares Aluna:

Leia mais

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Lic. Eng. Biomédica e Bioengenharia-2009/2010 Modelos de regressão É usual estarmos interessados em estabelecer uma relação entre uma variável

Leia mais

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA) 1. Sabe-se que o nível de significância é a probabilidade de cometermos um determinado tipo de erro quando da realização de um teste de hipóteses. Então: a) A escolha ideal seria um nível de significância

Leia mais

Especialização em Engenharia de Processos e de Sistemas de Produção

Especialização em Engenharia de Processos e de Sistemas de Produção Especialização em Engenharia de Processos e de Sistemas de Produção Projetos de Experimento e Confiabilidade de Sistemas da Produção Prof. Claudio Luis C. Frankenberg 2ª parte Experimentos inteiramente

Leia mais

ESTUDO DE CASO. Terapêutica e prevenção secundária no tumor do pulmão

ESTUDO DE CASO. Terapêutica e prevenção secundária no tumor do pulmão ESTUDO DE CASO Terapêutica e prevenção secundária no tumor do pulmão É bem conhecida a relação tabaco / tumor do pulmão, embora existam casos de neoplasia do pulmão sem antecedentes de tabagismo. Mesmo

Leia mais

Capítulo 6 Estatística não-paramétrica

Capítulo 6 Estatística não-paramétrica Capítulo 6 Estatística não-paramétrica Slide 1 Teste de ajustamento do Qui-quadrado Testes de independência e de homogeneidade do Qui-quadrado Algumas considerações Slide 2 As secções deste capítulo referem-se

Leia mais

AULA 11 Teste de Hipótese

AULA 11 Teste de Hipótese 1 AULA 11 Teste de Hipótese Ernesto F. L. Amaral 20 de setembro de 2012 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro: LTC. Capítulo

Leia mais

Testes não paramétricos são testes de hipóteses que não requerem pressupostos sobre a forma da distribuição subjacente aos dados.

Testes não paramétricos são testes de hipóteses que não requerem pressupostos sobre a forma da distribuição subjacente aos dados. TESTES NÃO PARAMÉTRICOS Testes não paramétricos são testes de hipóteses que não requerem pressupostos sobre a forma da distribuição subjacente aos dados. Bioestatística, 2007 15 Vantagens dos testes não

Leia mais

ESTATÍSTICA EXPERIMENTAL. ANOVA. Aula 05

ESTATÍSTICA EXPERIMENTAL. ANOVA. Aula 05 ESTATÍSTICA EXPERIMENTAL ANOVA. Aula 05 Introdução A ANOVA ou Análise de Variância é um procedimento usado para comparar a distribuição de três ou mais grupos em amostras independentes. A análise de variância

Leia mais

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira Análise estatística Aula de Bioestatística 17/9/2008 (2.ª Parte) Paulo Nogueira Testes de Hipóteses Hipótese Estatística de teste Distribuição da estatística de teste Decisão H 0 : Não existe efeito vs.

Leia mais

Delineamento e Análise Experimental Aula 4

Delineamento e Análise Experimental Aula 4 Aula 4 Castro Soares de Oliveira ANOVA Significativa Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos evidência de que existem diferenças entre as médias populacionais.

Leia mais

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARAN PARANÁ DEPARTAMENTO DE ENGENHARIA AMBIENTAL Estatística II Aula 8 Profa. Renata G. Aguiar Considerações Coleta de dados no dia 18.05.2010. Aula extra

Leia mais

Análise de variância (ANOVA)

Análise de variância (ANOVA) Análise de variância (ANOVA) Universidade Estadual de Santa Cruz Ivan Bezerra Allaman CRONOGRAMA 1. História 2. Concepção da ideia 3. Formalização da ideia e o surgimento da distribuição F 4. Hipóteses

Leia mais

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: ANÁLISE DOS RESÍDUOS Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: seguem uma distribuição normal; têm média zero; têm variância σ 2 constante

Leia mais

Estatística aplicada a ensaios clínicos

Estatística aplicada a ensaios clínicos Estatística aplicada a ensaios clínicos RAL - 5838 Luís Vicente Garcia lvgarcia@fmrp.usp.br Faculdade de Medicina de Ribeirão Preto Estatística aplicada a ensaios clínicos aula 12 1 grupo 2 grupos > 2

Leia mais

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126 3/8/26 Teste de hipóteses Testes de Hipóteses VPS26 Ferramenta estatística para auxiliar no acúmulo de evidências sobre uma questão Média de glicemia de um grupo de animais é diferente do esperado? Qual

Leia mais

Prof. Dr. Alfredo J Rodrigues. Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo

Prof. Dr. Alfredo J Rodrigues. Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo Bioestatística Básica RCA 5804 1. Experimentos no qual o sujeito recebe + de 1 tratamento 2. Alternativas para teste T e Análise de Variância 3. Correlação Prof. Dr. Alfredo J Rodrigues Departamento de

Leia mais

Estatística. Nos exercícios que se seguem, e caso seja necessário, considere que os pressupostos necessários à aplicação da ANOVA são verificados.

Estatística. Nos exercícios que se seguem, e caso seja necessário, considere que os pressupostos necessários à aplicação da ANOVA são verificados. INSTITUTO SUPERIOR POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA Ano Lectivo 007/008 Estatística Ficha n.º Nos exercícios que se seguem, e caso seja necessário, considere que os pressupostos necessários

Leia mais

Introdução. Amostragem, amostra aleatória simples, tabela de números aleatórios, erros

Introdução. Amostragem, amostra aleatória simples, tabela de números aleatórios, erros Estatística Aplicada 2007/2008 Programa Introdução às probabilidades. Distribuições. Amostragem. Testes de hipóteses. Análise da variância. Estatística não-paramétrica. Testes de ajuste do qui-quadrado.

Leia mais

TESTE DE COMPARAÇÃO MÚLTIPLA

TESTE DE COMPARAÇÃO MÚLTIPLA SUMÁRIO 1 TESTE DE COMPARAÇÃO MÚLTIPLA Quando a aplicação da análise de variância conduz à rejeição da hipótese nula, temos evidência de que existem diferenças entre as médias populacionais. Mas, entre

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Session 4 Introducing statistical modeling Part 1 (Analysis of variance) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Introduzir a ideia de

Leia mais

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari EXPERIMENTAÇÃO ZOOTÉCNICA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari amanda.perticarrari@unesp.br INTRODUÇÃO Um dos principais objetivos da estatística é a tomada de decisões a respeito da população,

Leia mais

Group Statistics. residência N Mean Std. Deviation Std. Error Mean. Avaliação Breve do Estado Mental. meio rural 11 27,73 1,849,557

Group Statistics. residência N Mean Std. Deviation Std. Error Mean. Avaliação Breve do Estado Mental. meio rural 11 27,73 1,849,557 ANEXO M: Output 1 Teste t de Student para amostras independentes, para comparação entre médias obtidas nos quatro instrumentos de avaliação pelas duas amostras: meio rural e meio urbano. Group Statistics

Leia mais

Curso de Metodologia da Pesquisa em Ciências da Vida. Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida

Curso de Metodologia da Pesquisa em Ciências da Vida. Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida Conceito de bioestatística A bioestatística é um recurso matemático aplicado às ciências biológicas Tem por finalidade de coletar,

Leia mais

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48) Estimação parâmetros e teste de hipóteses Prof. Dr. Alberto Franke (48) 91471041 Intervalo de confiança para média É um intervalo em que haja probabilidade do verdadeiro valor desconhecido do parâmetro

Leia mais

ESTATÍSTICA ANALÍTICA. Prof. Dr. Guanis de Barros Vilela Junior

ESTATÍSTICA ANALÍTICA. Prof. Dr. Guanis de Barros Vilela Junior ESTATÍSTICA ANALÍTICA Prof. Dr. Guanis de Barros Vilela Junior Introdução Permite ao pesquisador ir além da descrição dos dados e fazer inferências sobre a população, a partir da amostra. Estas inferências

Leia mais

Catarina Marques. Estatística II Licenciatura em Gestão. Conceitos: População, Unidade Estatística e Amostra

Catarina Marques. Estatística II Licenciatura em Gestão. Conceitos: População, Unidade Estatística e Amostra Amostragem Estatística II Licenciatura em Gestão 1 Conceitos: População, Unidade Estatística e Amostra População (ou Universo) dimensão N Conjunto de unidades com uma ou mais características comuns População

Leia mais

Inferência para duas populações

Inferência para duas populações Inferência para duas populações Capítulo 13, Estatística Básica (Bussab&Morettin, 8a Edição) 7a AULA 27/04/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 7a aula (27/04/2015) MAE229 1 / 27 1.

Leia mais

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari EXPERIMENTAÇÃO ZOOTÉCNICA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari amanda@fcav.unesp.br INTRODUÇÃO Um dos principais objetivos da estatística é a tomada de decisões a respeito da população,

Leia mais

Aula 6. Testes de Hipóteses Paramétricos (I)

Aula 6. Testes de Hipóteses Paramétricos (I) Aula 6. Testes de Hipóteses Paramétricos (I) Métodos Estadísticos 2008 Universidade de Averio Profª Gladys Castillo Jordán Teste de Hipóteses Procedimento estatístico que averigua se os dados sustentam

Leia mais

CONSULTADORIA INFORMÁTICA, LDA. Análise Bivariada

CONSULTADORIA INFORMÁTICA, LDA. Análise Bivariada CONSULTADORIA INFORMÁTICA, LDA. Análise Bivariada Testes Paramétricos Os procedimentos estatísticos e as conclusões são baseados na distribuição subjacente aos dados disponíveis em estudo. Fazem uso de

Leia mais

TESTES DE HIPÓTESES. O procedimento básico de um teste de hipóteses pode ser decomposto em quatro fases: i) Definição das hipóteses.

TESTES DE HIPÓTESES. O procedimento básico de um teste de hipóteses pode ser decomposto em quatro fases: i) Definição das hipóteses. 227 TESTES DE HIPÓTESES Objectivo: Verificar se os dados amostrais (ou estimativas obtidas a partir deles) são ou não compatíveis com determinadas populações (ou com valores previamente fixados dos correspondentes

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. http://www.mat.ufrgs.br/viali/ viali@mat.ufrgs.br Os testes O teste de Kruskal-Wallis (Análise de variância de uma classificação por postos) O teste qui-quadrado William Henry Kruskal

Leia mais

Análise de Significância Estatística na Comparação entre Sistemas de Sumarização Automática

Análise de Significância Estatística na Comparação entre Sistemas de Sumarização Automática Universidade de São Paulo - USP Universidade Federal de São Carlos - UFSCar Universidade Estadual Paulista - UNESP Análise de Significância Estatística na Comparação entre Sistemas de Sumarização Automática

Leia mais

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses BIOESTATÍSTICA Parte 5 Testes de Hipóteses Aulas Teóricas de 05/05/2011 a 19/05/2011 5.1. Conceito de erro, estatística de teste, região de rejeição, nível de significância, valor de prova, potência do

Leia mais

H 0 : m 1 = m 2 =... = m I = 0 H a : pelo menos m u m k, para algum u k (u,k=1,2,...,i)

H 0 : m 1 = m 2 =... = m I = 0 H a : pelo menos m u m k, para algum u k (u,k=1,2,...,i) Em um experimento ao se comparar as médias de tratamentos ou dos níveis de um fator de tratamentos, inicialmente, formula-se a seguintes hipóteses: H 0 : m = m =... = m I = 0 H a : pelo menos m u m k,

Leia mais

Análise de Variância. Análise de Variância. Análise de Variância. Análise de Variância. Análise de Variância. Mestrado em Recreação e Lazer

Análise de Variância. Análise de Variância. Análise de Variância. Análise de Variância. Análise de Variância. Mestrado em Recreação e Lazer Mestrado em Recreação e Lazer Estudos Práticos ANalysis Of VAriance O que é? Permite verificar qual o EFEITO de uma variável independente, de natureza qualitativa (factor), numa variável dependente ou

Leia mais

P R O G R A M A TERCEIRA FASE. DISCIPLINA: Estatística Aplicada à Pesquisa Educacional Código: 3EAPE Carga Horária: 54h/a (crédito 03)

P R O G R A M A TERCEIRA FASE. DISCIPLINA: Estatística Aplicada à Pesquisa Educacional Código: 3EAPE Carga Horária: 54h/a (crédito 03) UNIVERSIDADE DO ESTADO DE SANTA CATARINA - UDESC CENTRO DE CIÊNCIAS DA SAÚDE E DO ESPORTE - CEFID DEPARTAMENTO DE EDUCAÇÃO FÍSICA - DEF CURSO: LICENCIATURA EM EDUCAÇÃO FÍSICA CURRÍCULO: 2008/2 P R O G

Leia mais

Unidade IV Inferência estatística

Unidade IV Inferência estatística 6//5 Unidade IV Inferência estatística 4.. Introdução e histórico 4.. Conceitos fundamentais 4.3. Distribuições amostrais e Teorema central do limite 4.4. Estimação de parâmetros 4.5. Testes de hipóteses

Leia mais

ESTATÍSTICA DESCRITIVA

ESTATÍSTICA DESCRITIVA ESTATÍSTICA DESCRITIVA O principal objectivo da ESTATÍSTICA DESCRITIVA é a redução de dados. A importância de que se revestem os métodos que visam exprimir a informação relevante contida numa grande massa

Leia mais

Princípios de Bioestatística

Princípios de Bioestatística Princípios de Bioestatística Análise de Variância Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/~enricoc 2011 1 / 25 Introdução Existem muitas

Leia mais

Teste de hipóteses Página 1 de 8. Teste de hipóteses

Teste de hipóteses Página 1 de 8. Teste de hipóteses Teste de hipóteses Página 1 de 8 Teste de hipóteses O teste de hipóteses serve para verificar se uma dada amostra é ou não compatível com a população de onde foi tirada a amostra. Um teste de hipóteses

Leia mais

PLANIFICAÇÃO FACTORIAL UM PROCESSO OU SISTEMA PODE SER REPRESENTADO POR UM MODELO:

PLANIFICAÇÃO FACTORIAL UM PROCESSO OU SISTEMA PODE SER REPRESENTADO POR UM MODELO: PLANIFICAÇÃO FACTORIAL UM PROCESSO OU SISTEMA PODE SER REPRESENTADO POR UM MODELO: OBJECTIVOS DA EXPERIÊNCIA: 1. DETERMINAR QUAL (AIS) DA (S) VARIÁVEL (EIS) x s INFLUENCIA (M) MAIS A RESPOSTA, y.. DETERMINAR

Leia mais

CORRELAÇÃO. Flávia F. Feitosa

CORRELAÇÃO. Flávia F. Feitosa CORRELAÇÃO Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Junho de 2015 Revisão Inferência Estatística: Método científico para tirar conclusões sobre os parâmetros

Leia mais

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07 -027/031 07/06/2018 10:07 9 ESQUEMA DO CAPÍTULO 9.1 TESTE DE HIPÓTESES 9.2 TESTES PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 9.3 TESTES PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA

Leia mais

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB Governo do Estado do Rio Grande do Norte Secretaria de Estado da Educação e da Cultura - SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

3º Ano do Ensino Médio. Aula nº06

3º Ano do Ensino Médio. Aula nº06 Nome: Ano: º Ano do E.M. Escola: Data: / / 3º Ano do Ensino Médio Aula nº06 Assunto: Noções de Estatística 1. Conceitos básicos Definição: A estatística é a ciência que recolhe, organiza, classifica, apresenta

Leia mais

Instituto Universitário de Lisboa (ISCTE-IUL) Licenciaturas em Gestão e Finanças & Contabilidade Estatística II - Exame de 1ª época

Instituto Universitário de Lisboa (ISCTE-IUL) Licenciaturas em Gestão e Finanças & Contabilidade Estatística II - Exame de 1ª época Instituto Universitário de Lisboa (ISCTE-IUL) Licenciaturas em Gestão e Finanças & Contabilidade Estatística II - Exame de 1ª época Duração: 2h +30m Nota: Não são prestados esclarecimentos durante a prova!

Leia mais

Unidade IV Inferência estatística

Unidade IV Inferência estatística Unidade IV Inferência estatística 4.. Introdução e histórico 4.. Conceitos fundamentais 4.3. Distribuições amostrais e Teorema central do limite 4.4. Estimação de parâmetros 4.5. Testes de hipóteses 4.6.

Leia mais

ESTATÍSTICA II Ficha de Revisões - 1

ESTATÍSTICA II Ficha de Revisões - 1 Um dos objectivos da Estatística Indutiva é permitir conhecer o valor dos parâmetros populacionais de uma variável a partir de estatísticas descritivas calculadas numa amostra retirada da população. Este

Leia mais

Métodos Quantitativos Aplicados

Métodos Quantitativos Aplicados Métodos Quantitativos Aplicados Aula 6 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Análise de dados bivariada: os casos dos testes de proporções para duas amostras independentes e emparelhadas

Leia mais

Teste Anova. Prof. David Prata Novembro de 2016

Teste Anova. Prof. David Prata Novembro de 2016 Teste Anova Prof. David Prata Novembro de 2016 Tipo de Variável Introduzimos o processo geral de teste de hipótese. É hora de aprender a testar a sua própria hipótese. Você sempre terá que interpretar

Leia mais

BIOESTATÍSTICA. EXERCÍCIOS Folha 7 ANO LECTIVO: 2007/2008 ANOVA

BIOESTATÍSTICA. EXERCÍCIOS Folha 7 ANO LECTIVO: 2007/2008 ANOVA BIOESTATÍSTICA Departamento de Matemática EXERCÍCIOS Folha 7 ANO LECTIVO: 2007/2008 ANOVA 1. A anemia é uma doença que afecta muitas pessoas e que pode ter diversas origens. Pretendendo-se avaliar possíveis

Leia mais

ISCTE Instituto Superior de Ciências do Trabalho e da Empresa

ISCTE Instituto Superior de Ciências do Trabalho e da Empresa ISCTE Instituto Superior de Ciências do Trabalho e da Empresa Licenciatura em Gestão Exame de 2ª Época de Estatística II Duração: 2h +30m Nota: Não são prestados esclarecimentos durante a prova! Só é permitida

Leia mais