Métodos Quantitativos Aplicados Aula 5 http://www.iseg.utl.pt/~vescaria/mqa/
Tópicos apresentação Análise de dados bivariada: cruzamentos e medidas de associação variáveis nominais e ordinais e variáveis quantitativas Análise de dados bivariada: testes de igualdades de média ou tendência central para duas amostras independentes e emparelhadas
Análise bivariada análise bivariada Objectivo: análise de relação entre duas variáveis Tipo de análise 1: medir a relação entre as variáveis Duas variáveis qualitativas: cruzamentos, teste de independência e medidas de associação Duas variáveis quantitativas: análise da correlação
Análise bivariada: variáveis nominais/ordinais Cruzamentos e medidas de associação Analisar em que medida duas variáveis surgem relacionadas Variável 2 Categoria 1 Categoria 2 Variável 1 Categoria 1 a b Categoria 2 c d
Análise bivariada: variáveis nominais/ordinais Cruzamentos e medidas de associação para variáveis nominais e ordinais A leitura da tabela A contagem de casos As percentagens em linha e em coluna Os casos esperados e os resíduos na forma ajustada permitem ver se temos ou não independência entre as variáveis
Análise bivariada: testes independência Testar a independência Teste do Qui- quadrado (com duas categorias) Correcções para casos em que se violam as hipóteses do teste do Qui-Quadrado
Análise bivariada: medidas associação Se se rejeitar a independência é possível medir a associação entre as variáveis Baseadas no Qui- quadrado Baseadas na redução do erro de previsão
Análise bivariada: medidas associação Medidas de associação (baseadas no Qui- quadrado) O Phi 2 Phi n O C de Pearson coeficiente de contingência O V de Cramer 2 V nq ( 1) C 2 2 n (q menor número de linhas ou colunas) Variam entre 0 pouca associação - e valores próximos de 1 elevada associação.
Análise bivariada: medidas associação Medidas de associação (baseadas na redução do erro de previsão) A ideia em que medida conhecer a categoria de uma variável ajuda a prever o valor da outra variável Medidas simétricas existe associação mas não se identifica causa e efeito Medidas assimétricas identifica-se a causa e o efeito O valor das estatísticas dá a redução percentual do erro de previsão
Análise bivariada variáveis quantitativas: análise correlação Variáveis Quantitativas: A análise de correlação O coeficiente de correlação de Pearson O coeficiente de correlação de Spearman coeficiente de correlação de ordem aplicável a variáveis ordinais O coeficiente de correlação parcial - analisa a correlação entre duas variáveis controlando o efeito de outras O comando correlate
Análise bivariada: avaliar comportamento variável quantitativa em grupos população análise bivariada Objectivo: análise de relação entre duas variáveis Tipo de análise 2: avaliar comportamento de uma variável quantitativa em grupos de população Comparar média de variável quantitativa em duas amostras: testes t, Mann-Whitney, Sinal, Wilcoxon Comparar média de variável quantitativa em mais de duas amostras: análise ANOVA, Kruskal-Wallis
Análise bivariada: teste igualdade médias Testes de igualdade das médias testar se uma determinada variável quantitativa apresenta médias iguais em diferentes grupos da população - os testes t Três tipos de testes t Para duas amostras independentes Para duas amostras emparelhadas Para uma amostra NOTA: sempre que a amostra tem uma dimensão inferior a 30 é necessário verificar que os grupos apresentam uma distribuição normal
Análise bivariada: teste igualdade médias Teste t de igualdade das médias - duas amostras independentes Comparar a média de uma variável num grupo com a média dessa variável noutro grupo. ex: comparação dos rendimentos de homens e mulheres H : : 0 x x H x x Homens Mulheres a Homens Mulheres
Análise bivariada: teste igualdade médias Teste t de igualdade das médias para duas amostras independentes (cont.) Necessário testar se variância variável igual nos grupos ou não o teste de Levene teste de Levene - testa a igualdade das variâncias H H 0 : : 2 2 Homens Mulheres 2 2 a Homens Mulheres
Análise bivariada: teste igualdade médias Teste t de igualdade das médias para duas amostras independentes (cont.) Se rejeitarmos igualdade das variâncias utiliza-se o teste onde essa igualdade não é assumida Exemplo no caso da igualdade de salários entre homens e mulheres Independent Samples Test Current Salary Equal variances assumed Equal variances not assumed Levene's Test for Equality of Variances F Sig. t-test for Equality of Means t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference Std. Error Difference Lower Upper 119,669,000 10,945 472,000 $15,409.862 $1,407.906 $12,643.322 $18,176.401 11,688 344,262,000 $15,409.862 $1,318.400 $12,816.728 $18,002.996
Análise bivariada: teste igualdade médias Teste t de igualdade das médias - duas amostras emparelhadas o mesmo grupo de sujeitos é analisado em dois momentos ou dois grupos diferentes são analisados mas existe uma característica em comum pela qual os dois grupos podem ser comparados apresenta vantagens quando existe correlação entre os valores observados nas duas amostras compara-se com o valor 0 a média das diferenças entre os pares de observações não existe modificação significativa nos valores desses pares. ex: os valores antes e depois de um tratamento H : 0 : 0 0 xdiferença Ha xdiferença
Análise bivariada: teste igualdade médias Teste t de igualdade das médias para duas amostras emparelhadas (cont)
Análise bivariada: teste igualdade médias Teste t - uma amostra Compara os valores observados com um valor pré-definido H : 100 0 x H : x 100 a A distribuição da estatística de teste é diferente conforme o número de observações é superior ou inferior a 30 Exemplo: One-Sampl e Tes t Cu rrent Salary t df Sig. (2-tailed) Test Value = 20000 95% Co nfid ence Interval of the Difference Mean Differen ce Lo wer Up per 18,385 473,000 $14,419.57 $12,878.40 $15,960.73
Análise bivariada: testes não paramétricos igualdade tendência central Testes não paramétricos: Testes não paramétricos ou de distribuição livre são menos exigentes quanto às hipóteses, permitindo fazer os testes quando são violadas as hipóteses dos testes t Podem por vezes aplicar-se a dados de nível ordinal com pelo menos duas categorias Exemplos: Teste de Mann-Whitney para duas amostras independentes Testes de Sinal e de Wilcoxon para amostras emparelhadas
Análise bivariada: testes não paramétricos igualdade tendência central Teste de Mann-Whitney Compara o centro posicional das duas amostras - não as médias preferível ao teste t quando há violação da normalidade ou quando as variáveis são ordinais com duas ou três categorias H 0 : As duas populações são iguais em tendência central H a : As duas populações não são iguais em tendência central
Análise bivariada: testes não paramétricos igualdade tendência central Teste de Mann-Whitney (cont.) A estatística de teste é diferente conforme existam ou não empates (observações com o mesmo valor) Para se poder aplicar o teste tem que se verificar a igualdade da forma das duas distribuições: Caixas de bigodes Teste igualdade variâncias Simetria Regras de rejeição idênticas
Análise bivariada: testes não paramétricos igualdade tendência central Teste do Sinal e de Wilcoxon - Testes para amostras emparelhadas Teste de sinal: não utiliza os valores das observações mas apenas o sinal Aplica-se a variáveis pelo menos ordinal Vantagem quando uma das variáveis tende a ser superior à outra Cada par classificado como +: xi<yi (aumento); - : xi>yi ou 0: xi=yi Hipótese: H 0 :P(x>Y)=P(X<Y)=0,5 Estatística diferente se nº empates <= 20 ou >20
Análise bivariada: testes não paramétricos igualdade tendência central Teste de Wilcoxon Variáveis ordinais com pelo menos duas categorias, ou de nível superior Mais eficiente que teste de sinal pois não usa só sinal mas também ordem das diferenças Hipótese: H 0 :E(X)=E(Y) Exige simetria da distribuição da diferenças
Bibliografia Maroco, Cap 2, 5, 6, 7 Pestana e Gageiro, Cap 2, 4, 5, 6 e 7