Investigação Sociológica Analisar modelos com Equações Estruturais Rui Brites rui.brites@iscte.pt 1
Modelação de Equações Estruturais (MEE) (SEM structural equations modeling) com SPSS/AMOS O essencial Exemplo de aplicação 2
Os modelos de equações estruturais (MEE) podem ser vistos, segundo Klem*, como uma extensão da regressão múltipla, se for considerado que na aplicação da regressão o investigador está interessado em prever uma única variável dependente, enquanto nos MEE há mais do que uma variável dependente. Regressão: X influencia Y; MEE: X influencia Y e Y influencia Z. Uma das características básicas da MEE é o de permitir testar uma teoria de ordem causal entre um conjunto de variáveis pois: Permite observar de que forma as variáveis independentes explicam a variável dependente, bem como a sua importância relativa, podendo incorporar variáveis latentes na análise;** Permite calcular simultaneamente todas as relações entre os factores associados a um determinado fenómeno. *Klem, L. Path analysis, em Grimm, L. G. e P. R. Yarnold, Reading and understanding multivariate statistics. Washington, DC, American Psychological Association, 1995. ** Uma variável latente é um construto teórico e não observado que, por conseguinte, não pode ser medido directamente, mas pode ser representado ou medido por duas ou mais variáveis observadas. 3
A MEE é aconselhável quando: Existem construtos latentes; Quando as variáveis observadas contêm erros de mensuração e a relação desejada é entre as variáveis observáveis; Quando existe interdependência entre as variáveis observadas. A sua principal utilidade é a de possibilitar a resolução de problemas de pesquisa relacionados com relações causais entre construtos latentes que são medidos través de variáveis observadas. 4
A MEE revela-se muito útil quando se pretende testar modelos complexos, com múltiplas variáveis simultâneas e traços latentes, sendo apresentada por vários autores como uma mistura de análise factorial com a regressão múltipla.* O processo inicia-se com a formulação do modelo teórico que estabelece as relações causais entre um conjunto de variáveis. Este deve estar devidamente fundamentado na teoria, entendendo-se o respectivo diagrama como o resumo das hipóteses que se pretendem validar. A MEE começa pelo enunciar dos aspectos teóricos do estudo. Por conseguinte, a elaboração teórica de modelos hipotéticos é fundamental no contexto da MEE, pois as relações entre as variáveis, a estabelecer pelo investigador devem basear-se em pressupostos teóricos consistentes ou em evidências empíricas anteriores. * Cfr. Ullman, J. B. (2007), Structural Equation Modeling, em Tabachnick, B. G. & L. S. Fidell (Orgs.), Using multivariate statistics, (5ª ed.). Boston, Pearson Education. 5
Uma característica comum na MEE como forma de especificação, é a representação gráfica dos modelos estruturais. Essa representação possui uma simbologia convencionada de nomenclatura das relações estruturais entre variáveis representadas num diagrama: As variáveis observadas são representadas por rectângulos ou quadrados; As variáveis latentes são representadas por círculos ou elipses; O caminho ou a relação de causa entre duas variáveis é representado por uma seta com uma ponta; Uma relação bidireccional entre duas variáveis é representada por duas setas em sentidos opostos; A correlação ou covariância entre duas variáveis é representada por uma seta com duas pontas 6
No nosso exemplo vamos utilizar o AMOS, que é um programa opcional do SPSS que se distingue de outros softwares de Modelação de Equações Estruturais pelo seu interface bastante amigável, que inclui as ferramentas necessárias ao desenho do modelo. Os dados provêm do European Social Survey*, round 1 (2002) e referem-se unicamente a Portugal Nota: sobre o European Social Survey, ver o ESS no CIES: http://ess.cies.iscte.pt/ * A base de dados original está disponível em http://www.europeansocialsurvey.org/ 7
Modelo de medida (Análise Factorial Confirmatória) 8
Os modelos de medida especificam a forma como as variáveis observadas dependem das variáveis latentes. Veja-se o seguinte exemplo, que comporta quatro medidas distintas:* * Arbuckle, J. L. (1995-2007). Amos 16.0 User s Guide, USA, Amos Development Corporation. Disponível 9em: http://www.amosdevelopment.com/download/amos%2016.0%20user's%20guide.pdf
No nosso exemplo pretendemos confirmar se os 3 indicadores de Confiança Social (a8, a9 e a10) e os 4 de Confiança nas Instituições Públicas nacionais (b7, b8, b9 e b10) são explicados pelas variáveis latentes Confiança Social e Confiança Institucional, respectivamente, bem como saber a correlação entre elas. O modelo teórico é o seguinte: Confiança interpessoal Confiança na honestidade dos outros Confiança Social Confiança no altruísmo dos outros Confiança no Parlamento Confiança nos Políticos Confiança no Sistema Jurídico Confiança Institucional Confiança na Polícia 10
Especificação do Modelo e1 Confiança interpessoal Variáveis observadas Erros de medida e2 Confiança na honestidade dos outros Confiança Social e3 Confiança no altruísmo dos outros Variáveis latentes (intuídas teoricamente) e4 Confiança no Parlamento Correlação entre as variáveis latentes e6 e5 Confiança nos Políticos Confiança no Sistema Jurídico Confiança Institucional e7 Confiança na Polícia Direcção (as variáveis latentes explicam as observadas) 11
Resultados da Análise Coeficientes de regressão estandardizados (Beta)* e1 Confiança interpessoal,88 Coeficiente de correlação e2 Confiança na honestidade dos outros,82,85 Confiança Social e3 Confiança no altruísmo dos outros,34 e4 Confiança no Parlamento,88 e6 e5 Confiança nos Políticos Confiança no Sistema Jurídico,88,86,82 Confiança Institucional e7 Confiança na Polícia * Designados por pesos factoriais na Análise Factorial Confirmatória 12
Resultados da Análise Formato publicação Confiança interpessoal Confiança na honestidade dos outros Confiança no altruísmo dos outros,82,85,88 Confiança Social,34 Confiança no Parlamento Confiança nos Políticos Confiança no Sistema Jurídico,88,82,88,86 Confiança Institucional Confiança na Polícia 13
Análise de Caminhos (Path Analysis) 14
De acordo com Bryman e Duncan*: A path analysis é uma extensão dos procedimentos referentes à regressão múltipla. De facto, este tipo de análise implica o uso da regressão múltipla em relação a modelos causais explicitamente formulados. Não se pode estabelecer a causalidade através dela; também não pode ser usada para substituir o investigador na formulação das relações causais mais prováveis entre um grupo de variáveis. Com base nesta análise o que se pode fazer é analisar o padrão de relações entre três ou mais variáveis, mas nunca se pode confirmar ou rejeitar a hipotética relação causal. o objectivo da path analysis é o de fornecer estimativas quantitativas das relações causais entre grupos de variáveis. As relações são direccionadas e são vistas como formando vias (paths) distintas. [ ] O diagrama torna explícitas as relações de causa e efeito que são consideradas prováveis entre as variáveis. * Bryman, A. e D. Cramer (2003), Análise de Dados em Ciências Sociais, Oeiras, Celta. 15
Path Diagrama do exemplo apresentado no slide 9, com a especificação das relações: 16
Resultados do exemplo apresentado no slide 9 O valor.66 indica que knowledge, value e satisfaction explicam 66% da variação de performance. 17
Modelo teórico do nosso exemplo: Satisfação com o estado da Economia Confiança nos Políticos Satisfação com a forma como o Governo está a actuar Satisfação com a vida em geral Confiança na Polícia Confiança no Parlamento Satisfação com o funcionamento da Democracia Grau de felicidade que sente 18
Especificação do Modelo: 0; e1 1 Satisfação com o estado da Economia 0; e2 1 Confiança nos Políticos Satisfação com a forma como o Governo está a actuar Satisfação com a vida em geral 1 e4 0; Confiança na Polícia Grau de felicidade que sente 1 e5 0; Confiança no Parlamento Satisfação com o funcionamento da Democracia e3 1 0; 19
Resultados da Análise Coeficientes de correlação Coeficientes de regressão estandardizados (Beta)* Coeficientes de regressão** e1,25 Satisfação com o estado da Economia,83 -,50,23 e2 -,14,17 Confiança nos Políticos,49 Satisfação com a forma como o Governo está a actuar Satisfação com a vida em geral e4,60,37,38 Confiança na Polícia,23,55,26,16,55,30 Grau de felicidade que sente e5 Confiança no Parlamento,25 Satisfação com o funcionamento da Democracia * Efeito de x em y ** % de variação de y explicada pelas variáveis especificadas no modelo e3 20
Resultados da Análise Formato publicação,25 Satisfação com o estado da Economia,83 -,50,23 -,14,17 Confiança nos Políticos,49 Satisfação com a forma como o Governo está a actuar Satisfação com a vida em geral,60,37,38 Confiança na Polícia,23,55,26,16,55,30 Grau de felicidade que sente Confiança no Parlamento,25 Satisfação com o funcionamento da Democracia 21
Exemplo de aplicação A satisfação dos estudantes universitários portugueses (resultados mais importantes) 22
Diagrama da Análise de Equações Estruturais dos indicadores de satisfação (Coeficientes Beta e correlação linear) Interacção com docentes Qual.aconselham. Disciplinas opção Qual.conteúdos Conhecimento Qual.ensino Avaliação Relevância,57,82,74,84,80,74,83 Edifícios e envolvente,58 Rec.bibliotecários Satisfação Aspectos Académicos,43 Curso -,02,63,34,40,55,89,88,30 Satisfação Apoio Académico Instituição Laboratórios,80,27,78 Salas de aula,62 Turmas,53,78,78,67,79 Satisfação,89 Aspectos de Desenvolvimento Pessoal,88,24,11,24 Empregabilidade,28,09 Melhores cap.comunicação,88 Relacionam.interpessoal Melhores cap.liderança Prestígio social Melhores cap.trabalho Mais conhecimentos Expect.intelectuais Expect.pessoais,27 Satisfação com o Curso, a Instituição, a Empregabilidade e o Prestígio social do curso Legenda: Variáveis observadas Variáveis latentes 23
Diagrama da Análise de Equações Estruturais dos indicadores de satisfação (cont.) (Coeficientes Beta) Os resultados permitem concluir o seguinte: a) relevância dos indicadores associados a cada uma das variáveis latentes, uma vez que, com excepção dos indicadores interacção com os docentes (β=0,58), oferta de disciplinas de opção (β=0,62), os restantes são muito bem explicados pelas respectivas variáveis latentes, apresentando βs>0,7; b) correlação linear moderada entre a Satisfação com os aspectos académicos e a Satisfação com o apoio académico (r=0,55) e entre esta e a Satisfação com os aspectos de Desenvolvimento pessoal (r=0,53), e forte entre esta e a Satisfação com os aspectos académicos (r=0,78); c) capacidade explicativa das variáveis latentes no que se refere à satisfação com o Curso, com a Empregabilidade, o Prestígio social do curso e a Instituição, sintetizada no quadro acima, verificando-se que a Satisfação com os aspectos académicos é a que mais explica as quatro dimensões de satisfação observadas. Verifica-se, também, que Satisfação com o apoio académico não tem impacto na satisfação 24 com o Curso e no Prestígio social
Output Informação sobre a qualidade do ajuste do modelo (resultados mais importantes) 25
Para além dos resultados estandardizados (coeficientes de regressão e de correlação), deve também ser disponibilizada informação sobre o ajuste dos dados. Os índices de ajuste dão informação sobre a qualidade do ajuste do modelo hipotético com os dados amostrais. 26
Modelo de medida (AFC) χ2 dá uma ideia ampla sobre o ajuste do modelo. A hipótese nula é a de que o modelo se ajusta perfeitamente à população, pelo que interessa não rejeitar. 27
CMIN/DF Complementa a informação sobre o χ2. É a razão entre χ2/graus de liberdade. Considera-se um bom ajuste quando a razão entre χ2/graus de liberdade não excede 5. Os modelos especificados são, normalmente, rejeitados pelos testes de excelência (ajuste perfeito), devido à sua complexidade e ao número de restrições. Neste caso rejeita-se a hipótese nula, considerando-se, por conseguinte, que o ajuste não é perfeito: 28
Para contornar as limitações do teste do χ2, devem interpretarse os índices de aderência (Goodness-of-fit) para avaliar o modelo. NFI (Normed Fit Índex): compara o modelo hipotético com o modelo de independência. Varia entre 0 e 1, considerando-se um bom ajuste valores >0,90. Tendência para subestimar o ajuste em amostras pequenas. CFI (Comparative Fit Índex): interpretação idêntica ao NFI, já que se trata de uma correcção ao mesmo para o tamanho da amostra. Revela um bom ajuste (CFI e NFI >09) 29
RMSEA (Root Mean Square Error of Aproximation): reconhecido como um dos critérios mais informativos sobre MEE em estruturas de co-variâncias. O RMSEA tem em conta o erro de aproximação na população, cuja medida de discrepância é expressa em graus de liberdade. É sensível ao número de parâmetros estimados no modelo. Valores menores que 0,05 indicam bom ajuste, e valores maiores que 0,08 representam erros razoáveis na aproximação com a população. Valores entre 0,08 e 0,10 indicam um ajuste medíocre, e maiores que 0,10, um ajuste pobre. RMSEA de 0,06 pode ser um indicativo de bom ajuste entre o modelo hipotético e os dados observados. Ajuste medíocre (>0,08) 30
CN (Critical N); também chamado índice de Hoelter 0,05 e 0,01 (níveis de significância), adequação do tamanho da amostra ao modelo postulado com 95% de confiança e 99% de confiança, respectivamente. Este critério verifica a adequação do tamanho da amostra, e não o ajustado modelo. A proposta deste índice é uma estimativa do tamanho da amostra que seja suficientemente adequado ao ajuste o modelo para o teste χ2. Um valor que exceda 200 é indicativo que o modelo representa adequadamente os dados amostrais. O modelo representa adequadamente os dados amostrais (>200): 31
Qualidade global do ajuste: Path Analysis 32
Índices de ajuste (aderência) 33
Breve tutorial 34
Execução do AMOS: 35
Especificação do Modelo 36
Especificação do modelo: 37
38
39
Bibliografia recomendada Arbuckle, J. L. (1995-2007). Amos 16.0 User s Guide, USA, Amos Development Corporation. Disponível em: http://www.amosdevelopment.com/download/amos%2016.0 %20User's%20Guide.pdf, consultado em 26/02/2010. Bryman, A. e D. Cramer (2003), Análise de Dados em Ciências Sociais, Oeiras, 3ª edição portuguesa: 288-295. Maroco, J. (2007), Análise Estatística com utilização do SPSS, Lisboa, Sílabo, 3ª edição: 648-667. Ullman, J. B. (2007). Structural Equation Modeling, em Tabachnick, B. G. & L. S. Fidell (Orgs.), Using multivariate statistics, (5ª ed.). Boston, Pearson Education. 40
É tudo. Muito obrigado pela vossa atenção! 41