Jéssica Rocha Rodrigues. UMinho 2018

Tamanho: px
Começar a partir da página:

Download "Jéssica Rocha Rodrigues. UMinho 2018"

Transcrição

1 Universidade do Minho Escola de Ciências Jéssica Rocha Rodrigues Modelação em Equações Estruturais: uma abordagem estatística multivariada Jéssica Rocha Rodrigues Modelação em Equações Estruturais: uma abordagem estatística multivariada UMinho 2018 Abril de 2018

2

3 Universidade do Minho Escola de Ciências Departamento de Matemática e Aplicações Jéssica Rocha Rodrigues Modelação em Equações Estruturais: uma abordagem estatística multivariada Dissertação de Mestrado Mestrado em Estatística Trabalho realizado sob a orientação de Professora Doutora A. Manuela Gonçalves Professora Doutora Susana Faria Abril 2018

4 Declaração Nome: Jéssica Rocha Rodrigues Endereço eletrónico: Título da dissertação: Modelação em Equações Estruturais: uma abordagem estatística multivariada Orientadores: Professora Doutora Arminda Manuela Andrade Pereira Gonçalves Professora Doutora Susana Margarida Ferreira de Sá Faria Ano de conclusão: 2018 Mestrado em Estatística É AUTORIZADA A REPRODUÇÃO INTEGRAL DESTA DISSERTAÇÃO APENAS PARA EFEITOS DE INVESTIGAÇÃO, MEDIANTE DECLARAÇÃO ESCRITA DO INTERESSADO, QUE A TAL SE COMPROMETE. Universidade do Minho, 30 de Abril de A autora:

5 Agradecimentos À Professora Doutora Arminda Manuela Andrade Pereira Gonçalves e à Professora Doutora Susana Margarida Ferreira de Sá Faria, por todo o apoio, dedicação, empenho e paciência que demonstraram neste longo percurso. iii

6

7 Resumo Desde a década de 1970 que a investigação em saúde ocupacional tem vindo a destacar a mútua interferência Trabalho-Família como uma importante fonte de stresse. A dificuldade de conciliação da vida profissional com os papéis familiares tem demonstrado significativos efeitos negativos sobre a saúde emocional, mental e física de um indivíduo. Avaliar os mecanismos que podem explicar o aparecimento e desenvolvimento do stresse ocupacional torna-se essencial. Um desses mecanismos refere-se aos processos de avaliação cognitiva que indicam até que ponto uma dada situação de stresse é avaliada pelo próprio indivíduo e como esta avaliação influencia os níveis de conflito entre a vida familiar e a vida profissional. Neste trabalho aplicam-se Modelos com Equações Estruturais a um conjunto de dados reais da área da Psicologia, tendo como principais objetivos avaliar se um modelo teórico estabelecido a priori se ajusta aos dados e testar se a autoavaliação cognitiva que educadores/professores portugueses fazem da sua atividade profissional desempenha um papel mediador na relação entre a mútua interferência Trabalho-Família e a síndrome de Burnout. Os resultados obtidos confirmam que o modelo teórico proposto se ajusta aos dados e que a avaliação cognitiva apenas desempenha um papel mediador na relação entre o Conflito Trabalho-Família e a síndrome de Burnout. Palavras-chave: Análise de Caminhos, Análise Fatorial, Avaliação Cognitiva, Burnout, Mediação, Modelo com Equações Estruturais, Mútua Interferência Trabalho- Família. v

8

9 Abstract Since the 1970 s occupational health research has been highlighting work-family conflicts as an important source of stress. The difficulty of reconciling professional and family roles has demonstrated significant negative effects on an individual s emotional, mental, and physical health. Assessing the mechanisms that may explain the onset and development of occupational stress becomes essential. One of these mechanisms refers to cognitive appraisal that indicates the extent to which a given stress situation is assessed by the individual and how this assessment influences the levels of conflict between work and family life. In this work we apply Structural Equation Models to a set of real data from the domain of Psychology. The main objectives are to evaluate if a theoretical model established a priori fits the data and test if the cognitive self-evaluation that Portuguese teachers make of their professional activity plays a mediating role in the relationship between work-family conflicts and the Burnout syndrome. The results confirm that the proposed theoretical model fits the data and that cognitive self-evaluation only plays a mediating role in the relationship between Work-Family Conflict and Burnout. Keywords: Path Analysis, Factor Analysis, Cognitive Appraisal, Burnout Syndrome, Mediation, Structural Equation Model, Work-Family Conflicts. vii

10

11 Conteúdo 1 Introdução Estrutura do Trabalho Resenha Histórica 3 3 Modelos com Equações Estruturais Modelo Matemático Diagrama de Caminhos Etapas da Análise de Equações Estruturais Pressupostos da Análise de Equações Estruturais Análise Fatorial Efeito de Mediação com Variáveis Latentes Análise Multigrupos Aplicação Análise Exploratória de Dados Modelo com Equações Estruturais Submodelo de Medida Submodelo Estrutural Análise Multigrupos Conclusões Trabalho Futuro Anexos 67 A Matriz de variância-covariância 67 B Questionário 69 C Assimetria e Curtose das variáveis manifestas 73 ix

12

13 Lista de Figuras 3.1 Representação gráfica de um Modelo com Equações Estruturais Decomposicão do modelo da Figura 3.1 nos seus submodelos Representação gráfica de um modelo de mediação com variáveis latentes Modelo para testar a significância do efeito total do modelo de mediação com variáveis latentes Modelo teórico em estudo Modelo de Análise Fatorial Confirmatória da mútua interferência Trabalho-Família Modelo de Análise Fatorial Confirmatória da mútua interferência Trabalho-Família reespecificado Modelo de Análise Fatorial Confirmatória da avaliação cognitiva Modelo de Análise Fatorial Confirmatória do Burnout Modelo de Análise Fatorial Confirmatória do Burnout reespecificado Submodelo de medida com 1 fator Submodelo de medida com 9 fatores Modelo de efeitos diretos Modelo de mediação total Modelo de mediação parcial xi

14

15 Lista de Tabelas 3.1 Simbologia utilizada na representação gráfica de Modelos com Equações Estruturais Decomposição do efeito total em efeito direto e efeito indireto Matriz de correlação dos fatores α de Cronbach, fiabilidade compósita e variância extraída média da mútua interferência Trabalho-Família α de Cronbach, fiabilidade compósita e variância extraída média da avaliação cognitiva α de Cronbach, fiabilidade compósita e variância extraída média do Burnout Índices de ajustamento dos modelos estruturais Modelo de mediação parcial Análise Multigrupos de género Análise Multigrupos de idade C.1 Assimetria e curtose das variáveis manifestas xiii

16

17 Lista de Abreviaturas ADF AFC AFE AGFI AIC AMOS BCC BIC CAIC CFI EAC ECVI EQS FC FWC GFI gl GLS IFI JKW LISREL MBSM MECVI Asymptotic Distribuition Free Análise Fatorial Confirmatória Análise Fatorial Exploratória Adjusted Goodness of Fit Index Akaike Information Criterion Analysis of Moment Structures Browne-Cudeck Criterion Bayes Information Criterion Consistent Akaike Information Criterion Comparative Fit Index Escala de Avaliação Cognitiva Expected Cross-Validation Index Structural Equations System Fiabilidade Compósita Family-Work Conflict Goodness of Fit Index graus de liberdade Generalized Least Squares Incremented Fit Index Jöreskog-Keesling-Wiley Linear Structural Relations Medida de Burnout de Shirom-Melamed Maximum Likelihood Expected Cross-Validation Index xv

18 ML NCP NFI PCFI PGFI PNFI RFI RMSEA RMSR SEM Maximum Likelihood Non Centrality Parameter Normed Fit Index Parsimony Comparative Fit Index Parsimony Goodness of Fit Index Parsimony Normed Fit Index Relative Fit Index Root Mean Square Error of Approximation Root Mean Square Residual Structural Equation Modeling SEMNET Structural Equation Modeling Network SPSS SQE TLI ULS VEM VIF WFC WLS Statistical Package for the Social Sciences Soma dos Quadrados dos Erros Tucker-Lewis Index Unweighted Least Squares Variância Extraída Média Variance Inflation Factor Work-Family Conflict Weighted Least Squares xvi

19 Capítulo 1 Introdução Nas últimas décadas e com principal destaque na área das Ciências Sociais, a necessidade de se estudarem fenómenos cada vez mais complexos, isto é, que exijam a análise de múltiplas relações simultâneas, requer que se utilizem técnicas multivariadas de análise de dados. A análise de Modelos com Equações Estruturais (Structural Equation Modeling, SEM) surge como uma das principais metodologias que se tem implementado nesta área. Os Modelos com Equações Estruturais que têm na sua origem os modelos de Análise Fatorial e os modelos de Análise de Caminhos têm-se destacado pois, ao contrário da maioria dos métodos de análise de dados, permitem uma abordagem confirmatória em vez de uma abordagem exploratória. Através da aplicação destes modelos é possível testar hipóteses sobre a estrutura de um dado acontecimento, ou seja, testar a validade de modelos teóricos. A análise de Modelos com Equações Estruturais também se tem destacado pelo facto de permitir a incorporação de variáveis que não podem ser observadas ou medidas diretamente. Estas variáveis, variáveis latentes, são definidas conceptualmente e só podem ser observadas através de outras variáveis medidas diretamente (variáveis manifestas). O principal objetivo deste trabalho é aplicar Modelos com Equações Estruturais a um conjunto de dados reais da área das Ciências Sociais, nomeadamente, da área da Psicologia. Os conflitos entre o trabalho e a família são uma fonte de stresse para muitos trabalhadores, sendo a mútua interferência Trabalho-Família definida como uma situação em que as exigências profissionais e os papéis familiares são mutuamente incompatíveis. A vida profissional interfere na vida familiar (conflito trabalho-família) e a vida familiar interfere na vida profissional (conflito família-trabalho), originando uma doença ocupacional, a síndrome de Burnout, que se caracteriza pelo estado de exaustão emocional, mental e física de um indivíduo. A avaliação cognitiva surge como um mecanismo para explicar o aparecimento e desenvolvimento do stresse ocupacional e indica de que forma uma dada situação de stresse é avaliada pelo próprio indivíduo. O objetivo consiste, então, em avaliar se um modelo teórico estabelecido a priori se ajusta aos dados, ou seja, se esse modelo é capaz de explicar a relação entre as 1

20 variáveis manifestas. No caso de este modelo se ajustar aos dados, tenciona-se ainda testar se a avaliação cognitiva que educadores/professores portugueses fazem da sua atividade profissional, desempenha um papel mediador na relação entre a mútua interferência Trabalho-Família e a síndrome de Burnout. 1.1 Estrutura do Trabalho Este trabalho encontra-se dividido em cinco Capítulos. No primeiro Capítulo faz-se uma breve contextualização do tema a desenvolver e estabelecem-se os principais objetivos que se procuram atingir com este estudo. No segundo Capítulo faz-se uma breve resenha histórica dos Modelos com Equações Estruturais e presentam-se alguns dos trabalhos científicos que abordam esta temática. No terceiro Capítulo apresentam-se os conteúdos teóricos associados aos Modelos com Equações Estruturais. Em particular, identificam-se as equações matriciais; o diagrama de caminhos; os pressupostos e as etapas desta metodologia, que incluem as principais funções de discrepância associadas aos diferentes métodos de estimação e as técnicas existentes para avaliar a qualidade do ajustamento do modelo. Apresentam-se ainda os conteúdos teóricos relacionados com a Análise Fatorial Confirmatória, os efeitos de mediação com variáveis latentes e a Análise Multigrupos. No quarto Capítulo aplicam-se os Modelos com Equações Estruturais a um conjunto de dados reais da área da Psicologia. Inicialmente, descreve-se a base de dados, faz-se uma pequena análise exploratória da mesma e apresenta-se o modelo que se pretende avaliar. Por fim, avalia-se a qualidade de ajustamento do Modelo com Equações Estruturais. No último Capítulo discutem-se os resultados obtidos, apresentam-se as principais conclusões e dão-se algumas sugestões para um trabalho futuro. 2

21 Capítulo 2 Resenha Histórica Os Modelos com Equações Estruturais foram desenvolvidos a partir de modelos de Análise de Caminhos (Path Analysis) e de modelos com variáveis latentes, nomeadamente o modelo clássico de Análise Fatorial. Após os conceitos de correlação e de regressão terem sido definidos, Spearman (1904), um psicólogo com grande aptidão estatística, propôs um modelo de Análise Fatorial que destacava a relação entre variáveis latentes e variáveis manifestas, mas que não fazia referência à relação estrutural entre as variáveis latentes. A ideia básica era que se um conjunto de variáveis manifestas se encontravam correlacionadas, as respostas individuais para esse conjunto de itens podiam ser somadas para gerar uma pontuação que era capaz de medir, definir e inferir uma variável latente. O modelo por ele proposto foi obtido a partir do estudo de um conjunto de variáveis correspondentes a testes de aptidão mental que revelou que pessoas com um bom desempenho num teste tendiam a ter também um bom desempenho nos restantes testes, o que levou Spearman a criar um modelo de Análise Fatorial, em que a estrutura correlacional de todas as variáveis manifestas era completamente explicada através de uma variável latente: a inteligência geral. O livro de Lawley e Maxwell (1971) pode ser considerado o primeiro livro sobre Análise Fatorial. Outros livros importantes sobre esta temática são as obras de Everitt (1984), Kaplan (2000), Loehlin (2004), Bartholomew et al. (2008) e Bartholomew et al. (2011). A maioria dos testes de aptidão, aproveitamento e diagnóstico, inquéritos e inventários utilizados hoje em dia são criados a partir de técnicas de Análise Fatorial. Um resumo mais completo dos principais marcos na história da Análise Fatorial pode ser encontrado em Cudeck et al. (2001). Thurstone (1940) levou a cabo um conjunto de análises estatísticas a que hoje podemos chamar Análise Fatorial Exploratória (AFE). O termo Análise Fatorial Confirmatória (AFC) tem como base os trabalhos de Howe (1955), Anderson e Rubin (1956) e Lawley (1958). Um dos contributos com maior significância na Análise Fatorial Confirmatória foi dado por Karl Jöreskog na década de Jöreskog concluiu a sua dissertação em 1963, publicou o primeiro artigo sobre a AFC em 1969 (Jöreskog (1969)) e também ajudou a desenvolver o primeiro software de Análise Fatorial Confirmatória, 3

22 o LISREL (Linear Structural Relations). Um dos exemplos mais conhecidos da aplicação da Análise Fatorial Confirmatória é o modelo Big Five de personalidade de Goldberg (1990), em que foi confirmada a estrutura fatorial do modelo com cinco fatores: extroversão, disposição, conscientização, neuroticismo e intelecto. Para uma introdução à Análise Fatorial Exploratória versus Análise Fatorial Confirmatória ver, Long (1983). Os modelos de Análise de Caminhos foram desenvolvidos por Wright(1918; 1921; 1934; 1960), um investigador nas áreas da Biologia e da Biometria. Estes modelos são considerados como uma extensão dos modelos de Regressão Linear Múltipla e são utilizados para modelar relações complexas entre variáveis manifestas. A primeira aplicação da Análise de Caminhos foi feita por Wright em 1918, apesar da maioria dos artigos que utilizam esta técnica serem datados da década de Utilizando os diagramas de caminhos, que são representações gráficas de modelos com equações simultâneas, Wright propôs um conjunto de regras que relaciona as covariâncias (ou as correlações) dos parâmetros do modelo. Após a estimação dos parâmetros é possível distinguir os efeitos (efeitos diretos, efeitos indiretos e efeitos totais) que uma variável exerce sobre outra. Um dos exemplos da aplicação da Análise de Caminhos é o modelo teórico de Walberg de produtividade educacional para alunos entre o quinto e o oitavo ano de escolaridade (Parkerson et al., 1984). As relações entre as variáveis ambiente doméstico, grupo de colegas, média, capacidade, ambiente social, tempo na tarefa, motivação e estratégias instrucionais foram analisadas num único modelo. Todos os caminhos hipotéticos entre as variáveis revelaram-se estatisticamente significativos, fornecendo um suporte para o modelo de produtividade educacional. Os Modelos com Equações Estruturais combinam modelos de Análise de Caminhos e modelos de Análise Fatorial, ou seja, incorporam quer variáveis manifestas, quer variáveis latentes. A SEM também é conhecida como análise de estruturas de covariância, modelação causal e modelação de equações simultâneas. A combinação dos trabalhos de Jöreskog (1973), Keesling (1972) e Wiley (1973) deu origem ao modelo JKW, que também ficou conhecido como o modelo de relações estruturais lineares ou modelo LISREL. Este modelo encontra-se dividido em duas partes. A primeira parte apresenta as variáveis manifestas como sendo dependentes das variáveis latentes(modelo de medida) e a segunda parte é um modelo semelhante ao modelo de equações simultâneas da Econometria, composto apenas por variáveis latentes (modelo estrutural). Para além dos contributos de Jöreskog, os contributos de Bentler (1990; 2007), Browne (1974; 1984), Muthén (1984) e Satorra e Bentler (2001) foram importantes para o desenvolvimento dos Modelos com Equações Estruturais. Os livros de Mueller (1996) e Kelloway (1998) podem ser considerados livros introdutórios aos Modelos com Equações Estruturais, e o livro de Bollen (1989b) pode ser considerado um dos livros chave para a compreensão destes modelos. Outros livros importantes são as obras de Kaplan(2000), Schumacker e Lomax(2004) e Byrne (2010). Algumas ferramentas também essenciais são a revista científica Structural 4

23 Equation Modeling: A Multidisciplinary Journal que se encontra disponível desde 1994; e a Structural Equation Modeling Network (SEMNET), que está em funcionamento desde fevereiro de 1993 e que permite aos seus usuários partilhar ideias e questões sobre os Modelos com Equações Estruturais e os modelos que lhe dão origem. Para além do desenvolvimento teórico e científico, o desenvolvimento de softwares estatísticos mais potentes e de fácil manipulação tem permitido a implementação de modelos teóricos cada vez mais complexos, isto é, modelos que permitem testar simultaneamente várias relações múltiplas, como é o caso dos Modelos com Equações Estruturais. Alguns dos softwares mais utilizados são o LISREL (Linear Structural Relations) criado por Jöreskog e Sörbom, o EQS (Structural Equations System) criado por Peter Bentler, o Mplus, criado por Linda Muthén e Bengt Muthén em 1987,ospackages sem (Fox,2006)elavaan (Rosseel,2012)doRetambémosoftware AMOS do SPSS, criado por James Arbuckle em A família, o trabalho e a saúde são as áreas com maior importância na vida das pessoas. Enquanto criança, um indivíduo desenvolve-se e aprende a viver socialmente no contexto familiar (Swick e Williams, 2006), enquanto na vida adulta, a vida familiar e a vida profissional consistem nos ambientes mais influentes e determinantes dos comportamentos, atitudes e bem-estar dos indivíduos (Bellavia e Frone, 2005). Desde a década de 1970 que a investigação em saúde ocupacional tem vindo a destacar a mútua interferência Trabalho-Família como uma importante fonte de stresse que afeta quer a saúde física, quer a saúde mental dos indivíduos e das suas famílias (Bellavia e Frone, 2005; Gallie e Russell, 2009; Greenhaus e Beutell, 1985; Pal e Saksvik, 2008). Com muita frequência, as exigências profissionais e os papéis familiares são mutuamente incompatíveis, o que leva ao aparecimento de uma doença ocupacional chamada a síndrome de Burnout, que foi descrita pela primeira vez em 1974 pelo psiquiatra e psicoterapeuta Herbert Freudenberger e que se caracteriza pelo estado de exaustão emocional, mental e física de um indivíduo. O interesse de se estudar a relação entre a mútua interferência Trabalho-Família e a saúde de um indivíduo advém do facto de que o mundo do trabalho se tem tornado cada vez mais competitivo e exigente, além de reduzir cada vez mais o tempo disponível para as atividades familiares (Gallie e Russell, 2009). Por outro lado, este interesse surge também do facto de a mulher participar cada vez mais no mundo do trabalho (Bellavia e Frone, 2005). Em Portugal, um país onde os tradicionalismos de género ainda imperam, verificase que apesar da crescente participação da mulher no mundo do trabalho, o desempenho de múltiplos papéis familiares ainda lhe pertence (Lyonette et al., 2007; Wall, 2005). Avaliar os mecanismos que podem explicar o aparecimento e desenvolvimento do stresse ocupacional é essencial. Um desses mecanismos refere-se aos processos de avaliação cognitiva que indicam até que ponto uma dada situação de stresse é avaliada pelo próprio indivíduo e como esta avaliação influencia os níveis de conflito entre a vida familiar e a vida profissional. 5

24 A relação entre a avaliação cognitiva como mediador na relação entre a mútua interferência Trabalho-Família e a síndrome de Burnout foi estudada em vários artigos, como é o caso dos artigos de Netemeyer et al. (1996), Westman et al. (2004), Shirom e Melamed (2006), Glaser e Hecht (2013), Gomes et al. (2013) e Gomes et al. (2016). Os resultados têm sido consensuais ao demonstrarem que a avaliação cognitiva apenas desempenha um papel mediador na relação entre o conflito trabalho-família e a síndrome de Burnout (Netemeyer et al., 1996). 6

25 Capítulo 3 Modelos com Equações Estruturais No âmbito da análise de Modelos com Equações Estruturais é usual classificar as variáveis em dois tipos: variáveis manifestas e variáveis latentes. As variáveis manifestas, variáveis observadas ou itens, são variáveis diretamente observáveis que correspondem frequentemente a uma pergunta de um questionário e são usadas para medir variáveis latentes ou fatores que são variáveis não diretamente observáveis e que representam construtos hipotéticos (conceitos definidos em termos conceptuais). As variáveis manifestas que se encontram relacionadas são o reflexo das variáveis latentes, enquanto as variáveis latentes explicam a causa das variáveis manifestas. As variáveis, quer latentes, quer manifestas, são ainda classificadas como independentes ou exógenas ou como dependentes ou endógenas, sendo esta classificação dependente da influência de outras variáveis presentes no modelo sobre a variável em questão. As variáveis manifestas podem ser qualitativas ou quantitativas. Usualmente, tem-se itens de Likert, ou seja, variáveis manifestas qualitativas numa escala ordinal. A estes itens são atribuídas quantidades numéricas e é a manipulação algébrica destas quantidades que permite a estimação quantitativa das variáveis latentes, que não podem ser medidas de outra forma. 3.1 Modelo Matemático O Modelo com Equações Estruturais é um modelo linear e pode ser dividido em dois submodelos: submodelo de medida e submodelo estrutural. Para o Modelo com Equações Estruturais, as variáveis utilizadas são variáveis centradas, isto é, variáveis que a cada uma das suas observações subtraiu o valor médio dessa mesma variável. A notação utilizada ao longo deste Capítulo é baseada em Bollen (1989b). 7

26 Submodelo de Medida O submodelo de medida define a relação entre as variáveis manifestas e as variáveis latentes. Mais especificamente, relaciona cada variável latente com as variáveis manifestas que lhe dão origem. Este modelo pode ainda ser dividido dependendo do tipo de variáveis manifestas: variáveis manifestas endógenas ou variáveis manifestas exógenas. Para as variáveis manifestas endógenas, o submodelo de medida é escrito formalmente como onde y 1 y 2 y =. y p p 1 y = Λ y η +ε (3.1) é o vetor das p variáveis manifestas endógenas; λ 11 λ λ 1r λ 21 λ λ 2r Λ y = λ p1 λ p2... λ pr η 1 η 2 η =. η r ε 1 ε 2 ε =. ε p r 1 p 1 p r é a matriz dos pesos fatoriais de η em y; é o vetor das r variáveis latentes endógenas; e é o vetor dos erros de medida de y. Para as variáveis manifestas exógenas, o modelo de medida é escrito formalmente como onde x = Λ x ξ +δ (3.2) 8

27 x 1 x 2 x =. x q q 1 é o vetor das q variáveis manifestas exógenas; λ 11 λ λ 1s λ 21 λ λ 2s Λ x = λ q1 λ q2... λ qs q s é a matriz dos pesos fatoriais de ξ em x; ξ 1 ξ 2 ξ =. ξ s s 1 é o vetor das s variáveis latentes exógenas; e δ 1 δ 2 δ =. δ q q 1 é o vetor dos erros de medida de x. Submodelo Estrutural O submodelo estrutural estabelece o conjunto de relações de dependência entre as variáveis latentes do modelo, isto é, determina o impacto de uma variável latente nas restantes variáveis latentes do modelo. Este modelo pode ser escrito formalmente como η = Bη +Γξ +ζ (3.3) onde 0 β β 1r β β 2r B = β r1 β r r r é a matriz dos coeficientes de η no modelo estrutural com β ii = 0 (i = 1,...,r); 9

28 γ 11 γ γ 1s γ 21 γ γ 2s Γ = γ r1 γ r2... γ rs ζ 1 ζ 2 ζ =. ζ r r 1 r s é a matriz dos coeficientes de x no modelo estrutural; e é o vetor dos r erros do modelo estrutural. Para além de assumir amostras aleatórias, observações independentes e relações estruturais lineares nos parâmetros e nas variáveis, os Modelos com Equações Estruturais têm ainda os seguintes pressupostos: (i) ζ e ξ são independentes, ou seja, E[ζξ T ] = E[ξζ T ] = 0; (ii) os erros de medida não estão correlacionados com as variáveis latentes, isto é, ε e δ são independentes de η e ξ; (iii) os erros de medida não estão correlacionados entre si, nem com os termos residuais das equações estruturais, isto é, ε, δ e ζ são mutuamente independentes, (iv) os valores esperados dos erros são 0, ou seja, E[η] = E[ζ] = E[ξ] = 0; (v) B ii = 0 (i = 1,...,r), isto é, B é uma matriz cujos valores da diagonal principal são nulos; (vi) (I B) é uma matriz invertível (não singular) onde I é a matriz identidade; e as matrizes de variância-covariância associadas às variáveis latentes são definidas por (Bollen, 1989b; Jöreskog e Sörbom, 1996) Cov(ξ) = Φ (s s), Cov(ε) = Θ ε(p p), Cov(ζ) = Ψ (r r), 3.2 Diagrama de Caminhos Cov(δ) = Θ δ(q q). (3.4) A representação gráfica de um Modelo com Equações Estruturais é feita através de um diagrama de caminhos. Neste tipo de representação, assume-se que todas as relações causais são indicadas e que são lineares. Para se compreender um diagrama de caminhos é necessário compreender todos os símbolos que lhe estão associados. As variáveis latentes são representadas 10

29 por círculos ou elipses; as variáveis manifestas são representadas por quadrados ou retângulos; as relações causais são representadas com uma seta de causa para efeito; as relações recursivas ou de feedback são representadas por duas setas e as correlações entre as variáveis são representadas por setas com duas pontas. Esta simbologia está resumida na Tabela 3.1. Tabela 3.1: Simbologia utilizada na representação gráfica de Modelos com Equações Estruturais Símbolo Significado Variável latente Variável manifesta Relação causal (de causa para efeito) Relação recursiva Correlação (sem hipótese de causalidade) Para uma melhor compreensão da simbologia e do modelo matemático, na Figura 3.1 apresenta-se um exemplo de uma representação gráfica de um Modelo com Equações Estruturais (modelo adaptado de Marôco, 2010) x 1 x 2 λ x 11 λ x 21 ξ λ 1 x 31 x 3 φ 12 ψ 12 1 Υ 11 λ y 11 1 y 1 λ β y y x 4 λ x 42 β 21 λ y 32 y λ x 52 x 5 ξ 2 2 λ y 42 y 4 4 Figura 3.1: Representação gráfica de um Modelo com Equações Estruturais Este modelo é composto por duas variáveis latentes exógenas, ξ 1 e ξ 2, definidas pelas variáveis manifestas exógenas x 1,x 2,x 3 e x 4,x 5, respetivamente, e por duas variáveis latentes endógenas, η 1 e η 2, definidas pelas variáveis manifestas endógenas y 1,y 2 e y 3,y 4, respetivamente. As variáveis latentes exógenas estão correlacionadas (φ 12 ); os erros das variáveis latentes endógenas, ζ 1 e ζ 2, estão correlacionados (ψ 12 ); e os erros associados às variáveis manifestas exógenas x 3 e x 4 também se encontram 11

30 correlacionados (θ δ 34). η 1 influencia e é influenciada por η 2. O comportamento da variável manifesta x 1 é explicado pela variável latente ξ 1 e pelo erro δ 1 ; o peso fatorial do fator ξ 1 em x 1 é calculado por λ x 11; e o coeficiente estrutural de η 1 em ξ 2 é calculado por γ 12. O modelo também pode ser dividido nos seus submodelos: submodelo de medida e submodelo estrutural. Esta decomposição é representada graficamente na Figura 3.2. δ 1 δ 2 δ 3 x 1 λ x 11 λ x 21 x 2 ξ λ x 31 1 x 3 λ y 11 η 1 y 1 λ y 12 y 2 ε 1 ε 2 ξ 1 1 φ 12 ψ 12 2 Υ 11 β 12 1 θ δ 34 φ 12 ψ 12 δ 4 δ 5 λ x x 42 4 λ x 52 x 5 ξ 2 η 2 λ y 32 λ y 42 y 3 y 4 ε 3 ε 4 ξ 2 β 21 2 (a) Submodelo de medida para ξ (b) Submodelo de medida para η (c) Submodelo estrutural Figura 3.2: Decomposicão do modelo da Figura 3.1 nos seus submodelos O submodelo de medida para ξ apresenta as seguintes equações x 1 = λ x 11ξ 1 +δ 1 x 2 = λ x 21ξ 1 +δ 2 x 3 = λ x 31ξ 1 +δ 3 x 4 = λ x 42ξ 2 +δ 4 x 5 = λ x 52ξ 2 +δ 5 que podem ser representadas na sua forma matricial como x 1 λ x 11 0 δ 1 x 2 x 3 x 4 = λ x 21 0 [ ] λ x 31 0 ξ1 δ λ x ξ 2 δ 3 42 δ 4. x 5 0 λ x 52 δ 5 O submodelo de medida para η apresenta as seguintes equações y 1 = λ y 11η 1 +ε 1 y 2 = λ y 21η 1 +ε 2 y 3 = λ y 32η 2 +ε 3 y 4 = λ y 42η 2 +ε 4 12

31 que podem ser representadas na sua forma matricial como y 1 λ y 11 0 y 2 y 3 = λ y λ y 32 y 4 0 λ y 42 [ η1 η 2 ] ε 1 + ε 2 ε 3. ε 4 O submodelo estrutural apresenta as seguintes equações η 1 = β 12 η 2 +γ 11 ξ 1 +γ 12 ξ 2 +ζ 1 η 2 = β 21 η 1 +γ 21 ξ 1 +ζ 2 que podem ser representadas na sua forma matricial como [ η1 η 2 ] = [ 0 β12 β 21 0 ][ η1 η 2 ] + [ γ11 γ 12 γ 21 0 ][ ξ1 ξ 2 ] + [ ζ1 ζ 2 ]. As matrizes de variância-covariância do modelo são dadas por [ ] [ ] θ ε θ δ φ11 φ Φ = 12 ψ11 ψ ; Ψ = 12 ; Θ φ 21 φ 22 ψ 21 ψ ε = 0 θ22 ε θ33 ε 0 e 0 θ22 δ Θδ = 0 0 θ33 δ θ34 δ θ44 ε 0 0 θ43 δ θ44 δ θ55 δ 3.3 Etapas da Análise de Equações Estruturais Elaboração do Modelo Teórico A primeira etapa da Análise de Equações Estruturais consiste na elaboração de ummodeloteóricoa priori, istoé, noestabelecimentodeummodeloondesedefinem as hipóteses das relações causais entre as variáveis. Recolha dos Dados Após a elaboração do modelo teórico é necessário fazer a recolha dos dados. Uma questão importante nesta etapa é a dimensão da amostra a recolher. Uma das condições mais utilizadas para a determinação da dimensão da amostra, n, é dada pela expressão (Westland, 2010) n 50r 2 450r+1100 (3.5) onde r = (p + q)/f, em que p é o número de variáveis manifestas endógenas, q o número de variáveis manifestas exógenas e f o número de variáveis latentes. 13

32 Especificação do Modelo A especificação do modelo consiste na tradução das hipóteses que se estabelecem no modelo teórico num diagrama de caminhos. Nesta etapa, o erro mais crítico é a inclusão ou a omissão de uma ou mais variáveis preditoras, um problema conhecido como erro de especificação que pode impedir a estimação dos parâmetros do modelo ou produzir estimativas enviesadas dos mesmos. Identificação do Modelo Os Modelos com Equações Estruturais podem ser classificados em três tipos (Schumacker e Lomax, 2004): modelos sub-identificados; modelos identificados e modelos sobre-identificados. Esta classificação é feita tendo em conta o número de parâmetros a estimar, t, e o número de elementos não redundantes da matriz de variância-covariância das variáveis manifestas, (p+q)(p+q +1)/2, onde p é o número de variáveis manifestas endógenas e q o número de variáveis manifestas exógenas. Quandoonúmerodeparâmetrosaestimarésuperioraonúmerodeelementosnão redundantes da matriz de variância-covariância, os modelos denominam-se modelos sub-identificados ou indeterminados. Neste caso, o modelo tem pouca informação para determinar as estimativas dos parâmetros, existindo assim um número infinito de soluções. Para a resolução do problema de indeterminação, fixa-se ou restringe-se um ou mais parâmetros livres do modelo, ou então adicionam-se variáveis manifestas no caso de as variáveis latentes serem definidas por um número reduzido de variáveis manifestas. Se o número de parâmetros a estimar é igual ao número de elementos não redundantes da matriz de variância-covariância, os modelos denominam-se modelos identificados ou determinados. Neste caso, existe apenas uma única estimativa para cada parâmetro. A qualidade do ajustamento do modelo é perfeita, bem como a sua significância. Caso o número de parâmetros a estimar seja inferior ao número de elementos não redundantes da matriz de variância-covariância, os modelos denominam-se modelos sobre-identificados. Neste caso, é necessário impor algum tipo de restrição para que os parâmetros possam ser estimados e assim é possível avaliar a qualidade de ajustamento do modelo. Modelos identificados ou sobre-identificados podem apresentar problemas de subidentificação empírica, que ocorre quando um parâmetro necessário para a identificação do modelo assume um valor próximo de zero ou quando existe multicolinearidade entre variáveis. A solução para a sub-identificação empírica consiste na reespecificação do modelo com a remoção de variáveis manifestas colineares e o aumento da dimensão da amostra. Algumas das condições e regras mais utilizadas para avaliar a identificação dos modelos são: regra B = 0; regra recursiva; condição de ordem; condição de característica e regra-t. 14

33 (i) Regra B = 0 A regra B = 0 é uma condição suficiente, mas não é uma condição necessária para a identificação do modelo. Esta regra dita que o modelo é identificado se a matriz B for nula (Salgueiro, 2012); (ii) Regra Recursiva A regra recursiva é uma condição suficiente, mas não é uma condição necessária para a identificação do modelo. Esta regra dita que se a matriz B for triangular inferior e a matriz Ψ for diagonal, então o modelo é identificado (Salgueiro, 2012); (iii) Condição de Ordem A condição de ordem é uma condição necessária, mas não é uma condição suficiente para a identificação do modelo. Esta condição dita que uma equação é identificada se todos os elementos sujeitos à estimação de Ψ são livres e se o número de variáveis excluídas dessa equação é maior ou igual a p 1, onde p é o número de variáveis manifestas endógenas (Salgueiro, 2012); (iv) Condição de Característica A condição de característica é uma condição necessária e suficiente para a identificação do modelo. Esta condição dita que uma equação é identificada se todos os elementos de Ψ são livres e se ao se construir uma matriz C dada por C = [(I B) Γ] onde I é a matriz identidade, B é a matriz dos coeficientes das variáveis latentes endógenas e Γ é a matriz das variáveis manifestas exógenas, quando se eliminam todas as colunas desta matriz que não tenham zeros na i-ésima linha e se constrói uma nova matriz C i com as restantes colunas, a característica de C i é igual a p 1, onde p é o número de variáveis manifestas endógenas (Salgueiro, 2012); (v) Regra-t A regra-t é uma condição necessária, mas não é uma condição suficiente para a identificação do modelo. Esta regra dita que o número de parâmetros a estimar tem de ser menor ou igual ao número de elementos não redundantes da matriz de variância-covariância, ou seja, t (p+q)(p+q +1) 2 (3.6) onde p é o número de variáveis manifestas endógenas e q o número de variáveis manifestas exógenas (Salgueiro, 2012). 15

34 Estimação do Modelo O objetivo da estimação do modelo é encontrar um vetor de estimativas dos parâmetros que maximize a probabilidade de se observar a estrutura correlacional das variáveis manifestas. Assim, nesta etapa pretende-se obter um vetor de estimativas dos parâmetros do modelo, θ, que gere uma matriz de variância-covariância, Σ(θ), que reproduza a matriz de variância-covariância populacional das variáveis manifestas, Σ, ou seja, pretende-se obter θ tal que Σ = Σ( θ). (3.7) A matriz de variância-covariância populacional das variáveis manifestas, Σ, é dada por (Jöreskog e Sörbom, 1996) [ ] Σyy Σ Σ = yx. Σ xy Σ xx Através da álgebra de matrizes e considerando as equações (3.1), (3.2), (3.3) e (3.4), esta pode ser escrita em função dos parâmetros do modelo como (ver Apêndice A) Σ = [ Λ y (I B) 1 (ΓΦΓ T +Ψ) ( (I B) 1) T Λ T y +Θ ε Λ x ΦΓ ( T (I B) 1) T Λ T y ] Λ y (I B) 1 ΓΦΛ T x. (3.8) Λ x ΦΛ T x +Θ δ Na prática, como não se conhecem as verdadeiras variâncias e covariâncias populacionais trabalha-se com a matriz de variância-covariância amostral, S. Pretende-se assim, obter θ tal que S = Σ( θ). (3.9) Para se obterem as estimativas dos parâmetros, os softwares de Análise de Equações Estruturais implementam um ou vários dos seguintes métodos de estimação: método da máxima verosimilhança; método dos mínimos quadrados não ponderados; método dos mínimos quadrados generalizados; e distribuição assintótica livre ou métodos dos mínimos quadrados ponderados. Todos estes métodos utilizam algoritmos iterativos para a obtenção do vetor θ que minimize uma função da diferença da matriz de variância-covariância amostral, S, e a matriz de variânciacovariância gerada pelo modelo teórico, Σ( θ). A função que traduz essa diferença é designada função de discrepância e é dada por f = F ( ) S Σ( θ). (3.10) As funções de discrepância possuem as seguintes propriedades: f é um escalar; f 0; f = 0 se e só se o ajustamento é perfeito (S = Σ( θ)); e f é contínua em S e em Σ( θ). 16

35 (i) Método da Máxima Verosimilhança O método da máxima verosimilhança (Maximum Likelihood, ML) é o método de estimação mais utilizado em SEM e requer a normalidade multivariada da distribuição conjunta das variáveis manifestas. A função de discrepância deste método é dada por (Jöreskog e Sörbom, 1996) f ML = log Σ( θ) +tr(sσ 1 ( θ)) log S (p+q) (3.11) onde p é o número de variáveis manifestas endógenas e q o número de variáveis manifestas exógenas. Os estimadores de máxima verosimilhança são consistentes (à medida que a dimensão da amostra aumenta, as estimativa obtidas tendem para os verdadeiros valores dos parâmetros), assintoticamente eficientes (para amostras grandes, a variância dos estimadores é mínima), assintoticamente não enviesados (para amostras de grande dimensão, os estimadores dos parâmetros são não enviesados) e independentes da escala de medida das variáveis (Babakus et al., 1987; Curran et al., 1996; Finch et al., 1997; Olsson et al., 2000; Tomarken e Waller, 2005). (ii) Mínimos Quadrados Não Ponderados O método dos mínimos quadrados não ponderados (Unweighted Least Squares, ULS) minimiza a soma dos quadrados dos erros (SQE), isto é, minimiza a soma dos quadrados de cada elemento da matriz residual, E, que é dada por E = S Σ( θ). (3.12) Os estimadores são consistentes, não assintoticamente eficientes e dependentes da escala de medida das variáveis. A função de discrepância deste método é dada por (Bollen, 1989b; Jöreskog e Sörbom, 1996) f ULS = 1 2 tr[(s Σ( θ)) 2 ]. (3.13) (iii) Mínimos Quadrados Generalizados O método dos mínimos quadrados generalizados (Generalized Least Squares, GLS) minimiza a soma dos quadrados dos erros (SQE) ponderada pelo inverso da matriz de variância-covariância amostral. A função de discrepância deste método é dada por (Arbuckle, 2008; Jöreskog e Sörbom, 1996) f GLS = 1 2 tr[s 1 (S Σ( θ))] 2 = 1 2 tr[(i S 1 Σ( θ)) 2 ]. (3.14) Tal como o método da máxima verosimilhança, este método requer a normalidade multivariada da distribuição conjunta das variáveis manifestas. Os estimadores são consistentes, assintoticamente eficientes, assintoticamente não enviesados e independentes da escala de medida das variáveis. 17

36 (iv) Distribuição Assintótica Livre ou Mínimos Quadrados Ponderados A função de discrepância do método de distribuição assintótica livre (Asymptotic Distribuition Free, ADF) é dada por (Arbuckle, 2008; Jöreskog e Sörbom, 1996) f ADF = (s σ( θ)) T W 1 (s σ( θ)) k g k i = w gh,ij (s gh σ gh )(s ij σ ij ) (3.15) g=1 h=1 i=1 j=1 onde s T = [s 11,s 21,s 22,s 31,...,s kk ] é o vetor de elementos da matriz triangular inferior incluindo a diagonal de S com k = p+q; σ( θ) T = [σ 11,σ 21,σ 22,σ 31,...,σ kk ] é o vetor de elementos da matriz triangular inferior incluindo a diagonal de Σ( θ) e w gh,ij um elemento genérico de uma matriz de pesos W 1, definida positiva. É a presença desta matriz de pesos que faz com que este método também seja conhecido por Mínimos Quadrados Ponderados (Weighted Least Squares, WLS). Os elementos da matriz W 1 devem ser estimativas consistentes da covariância assintótica entre s gh e s ij, que se calcula a partir de acov(s ij,s gh ) = 1 n (σ ijgh σ ij σ gh ) (3.16) ondeσ ijgh éomomentodequartaordememtornodamédiaeσ ij eσ gh ascovariâncias populacionais de x i com x j e de x g com x h, respetivamente. Avaliação da Qualidade do ajustamento Nesta etapa, avalia-se como o modelo estimado na fase anterior se ajusta aos dados. Para o efeito, utilizam-se: o teste do Qui-Quadrado de ajustamento; os índices de qualidade de ajustamento e a análise de resíduos, a significância dos parâmetros e a fiabilidade individual. O teste do Qui-Quadrado de ajustamento e os índices de qualidade de ajustamento testam o ajustamento global, enquanto a análise dos resíduos e da significância do modelo testa o ajustamento local do modelo. (i) Teste do Qui-Quadrado de Ajustamento O teste do Qui-Quadrado (χ 2 ) de ajustamento é um teste à significância da função da diferença entre a matriz de variância-covariância populacional, Σ, e a matriz de variância-covariância estimada pelo modelo, Σ( θ). As hipóteses estatísticas do teste são H 0 : Σ = Σ( θ) vs. H 1 : Σ Σ( θ) e a estatística de teste é calculada por (Bollen, 1989b; Jöreskog e Sörbom, 1996) X 2 = (n 1)f min a χ 2 (p+q)(p+q+1) 2 t (3.17) 18

37 onde f min é o valor mínimo da função de discrepância do método de estimação aplicado. Este teste é sensível à violação do pressuposto da normalidade multivariada da distribuição conjunta das variáveis manifestas e à dimensão da amostra. Quanto maior é o valor da estatística de teste X 2, pior é o ajustamento do modelo. Quando a normalidade multivariada da distribuição conjunta das variáveis manifestas não é verificada, uma correção deve ser utilizada (correção de Satorra-Bentler) para se calcular a estatística X 2. Esta correção é dada por (Satorra e Bentler, 2001) XSB 2 = X2 a χ 2 (p+q)(p+q+1) c t 2 onde c é um fator de correção estimado por (3.18) 1 c = tr[u W (p+q)(p+q +1) ADF ] (3.19) t 2 onde W ADF é a matriz dos pesos do método ADF. Se o método de estimação for o de máxima verosimilhança, a matriz U é estimada por U ML = W ML W ML ( T W ML ) 1 T W ML (3.20) onde = σ( θ) θ T é a matriz jacobiana. (ii) Índices de Qualidade de Ajustamento Os índices de qualidade de ajustamento avaliam a qualidade de ajustamento do modelo, quando comparado com o modelo saturado ou o modelo basal. O modelo saturado é o modelo com o melhor ajustamento possível, ou seja, o modelo em que todas as variáveis manifestas se encontram relacionadas. O modelo basal ou modelo de independência total é o modelo com o pior ajustamento possível, ou seja, o modelo em que nenhuma variável se encontra relacionada com as restantes variáveis no modelo. Estes índices podem ainda ser classificados em índices absolutos, relativos, de parcimónia, de discrepância populacional e baseados na teoria de informação. (A) Índices Absolutos Os índices absolutos avaliam a qualidade de ajustamento do modelo sem o comparar com nenhum outro modelo. (A.1) X 2 /gl X 2 /gl corrige o valor da estatística Qui-Quadrado de ajustamento do modelo pelos seus graus de liberdade (gl). Se o valor de X 2 é grande face aos graus de liberdade, é porque é possível obter informação adicional a partir dos dados. Se o ajustamento for perfeito, esta razão é igual a 1. Se for inferior a 3, considera-se que o ajustamento é bom; entre 3 e 5, considera-se que o ajustamento é aceitável; e se for superior a 5, então o ajustamento é inaceitável (Arbuckle, 2008; Wheaton, 1987). 19

38 (A.2) Root Mean Square Residual (RMSR) O Root Mean Square Residual (RMSR) é uma medida da média dos resíduos ajustados que quantifica a diferença entre a matriz de variância-covariância estimada pelo modelo e a matriz de variância-covariância amostral. Este índice é de difícil interpretação e, por isso, é normalmente estandardizado. O RMSR é calculado por (Jöreskog e Sörbom, 1996) 2 p+q i (s ij σ ij ) 2 i=1 j=1 RMSR = (3.21) (p+q)(p+q +1) onde p é o número de variáveis manifestas endógenas e q o número de variáveis manifestas exógenas. Este índice é sobrestimado para amostras de pequena dimensão e para modelos envolvendo a estimação de muitos parâmetros(kenny et al., 2015). Se o ajustamento for perfeito, isto é, se S = Σ( θ), o RMSR é igual a 0 e valores menores do que 0,08 indicam um bom ajustamento (Hu e Bentler, 1999). (A.3) Goodness of Fit Index (GFI) O Goodness of Fit Index (GFI) mede a proporção de covariâncias amostrais que o modelo estima corretamente. Este índice é calculado para cada uma das funções de discrepância dos métodos de estimação utilizados. Para os métodos de máxima verosimilhança e mínimos quadrados ponderados, o GFI é calculado por (Jöreskog e Sörbom, 1996) ( ) ] 2 tr[ Σ( θ) 1 S I GFI ML = 1 ( ) ] 2, (3.22) tr[ Σ( θ) 1 S GFI ULS = 1 ( ) ] 2 tr[ S Σ( θ) tr[s 2 ]. (3.23) Para o método dos mínimos quadrados generalizados, o GFI é calculado por(tanaka e Huba, 1985) [ ( ) ] 2 tr I Σ( θ)s 1 GFI GLS = 1. (3.24) p+q O GFI aumenta com o aumento da dimensão da amostra e com a adição de variáveis ao modelo. Valores inferiores a 0,90 são indicadores de um modelo com mau ajustamento; valores entre 0,90 e 0,95 indicam um bom ajustamento; valores superiores a 0,95 são indicadores de um ajustamento muito bom e GFI = 1 indica um ajustamento perfeito. 20

39 (A.4) Adjusted Goodness of Fit Index (AGFI) O Adjusted Goodness of Fit Index (AGFI) ajusta o GFI pelos graus de liberdade e é calculado por [ ] (p+q)(p+q +1) AGFI = 1 [1 GFI] (3.25) 2gl onde GFI deve ser substituído por (3.22), (3.23) ou (3.24) dependendo do método de estimação utilizado. Valores superiores a 0,90 são indicadores de um modelo com um bom ajustamento. (B) Índices Relativos Os índices relativos avaliam a qualidade de ajustamento comparando o modelo estimado com o modelo basal. X 2 e gl representam, respetivamente, a estatística Qui-Quadrado de ajustamento do modelo estimado e os seus graus de liberdade, enquanto que X 2 b e gl b representam, respetivamente, a estatística Qui-Quadrado de ajustamento do modelo basal e os seus graus de liberdade. (B.1) Normed Fit Index (NFI) O Normed Fit Index (NFI) avalia de que forma a qualidade de ajustamento do modelo estimado melhora em relação ao modelo basal. Este índice é calculado por (Bentler e Bonett, 1980) NFI = 1 X2. (3.26) Xb 2 O NFI aumenta com o aumento da dimensão da amostra e com a adição de variáveis ao modelo. Valores inferiores a 0,80 indicam um mau ajustamento; valores entre 0,80 e 0,90 indicam um ajustamento sofrível; valores superiores a 0,90 indicam um bom ajustamento e NFI = 1 indica um ajustamento perfeito (Arbuckle, 2008). (B.2) Incremented Fit Index (IFI) O Incremented Fit Index (IFI) corrige o NFI pelos graus de liberdade e pela dimensão da amostra. Este índice é calculado por (Bollen, 1989a) e valores próximos de 1 indicam um bom ajustamento. IFI = X2 b X2 X 2 b gl (3.27) 21

40 (B.3) Comparative Fit Index (CFI) O Comparative Fit Index (CFI) corrige a subestimação que ocorre quando se aplica o índice NFI a amostras de pequena dimensão e a sua interpretação é equivalente à interpretação do NFI. Este índice é calculado por (Bentler, 1990) CFI = 1 max(x2 gl,0) max(x 2 b gl b,0). (3.28) Valores inferiores a 0,90 indicam um mau ajustamento; valores entre 0,90 e 0,95 indicam um bom ajustamento; valores superiores a 0,95 indicam um ajustamento muito bom e CFI = 1 indica um ajustamento perfeito. (B.4) Relative Fit Index (RFI) O Relative Fit Index (RFI) compara o ajustamento do modelo estimado com o modelo basal. Este índice é calculado por (Bollen, 1989b) RFI = 1 X 2 gl Xb 2. (3.29) gl b O RFI aumenta com o aumento da dimensão da amostra e com a adição de variáveis ao modelo. Valores inferiores a 0,90 indicam um mau ajustamento e valores próximos de 1 indicam um bom ajustamento. (B.5) Tucker-Lewis Index (TLI) O Tucker-Lewis Index (TLI) corrige o IFI pelos graus de liberdade. Este índice é calculado por (Bentler e Bonett, 1980) TLI = X 2 b X2 gl b gl Xb 2. (3.30) 1 gl b Este é o índice menos afetado pela dimensão da amostra. Valores próximos de 1 indicam um ajustamento muito bom. (C) Índices de Parcimónia Os índices de parcimónia determinam o impacto da adição de parâmetros ao modelo, sendo obtidos através da correção dos índices relativos por um fator de penalização (gl/gl b ). Valores inferiores ou iguais a 0,60 são indicadores de um mau ajustamento (Mulaik et al., 1989); valores entre 0,60 e 0,80 são indicadores de um ajustamento razoável e valores superiores a 0,80 são indicadores de um bom ajustamento(blunch, 2008). 22

41 (C.1) Parsimony Normed Fit Index (PNFI) O Parsimony Normed Fit Index (PNFI) aplica o fator de penalização ao NFI (C.2) Parsimony Comparative Fit Index (PCFI) PNFI = NFI gl gl b. (3.31) O Parsimony Comparative Fit Index (PCFI) aplica o fator de penalização ao CFI PCFI = CFI gl gl b. (3.32) (C.3) Parsimony Goodness Fit Index (PGFI) O Parsimony Goodness Fit Index (PGFI) aplica o fator de penalização ao GFI PGFI = GFI gl gl b. (3.33) (D) Índices de Discrepância Populacional Os índices de discrepância populacional avaliam a qualidade de ajustamento, comparando o modelo em que o mínimo da função de discrepância é obtido através dos momentos amostrais e o modelo em que o mínimo da função de discrepância é obtido através dos momentos populacionais. (D.1) Non Centrality Parameter (NCP) O Non Centrality Parameter (NCP) calcula o quão afastado está o valor esperado da estatística X 2 do verdadeiro valor da χ 2, sob a validade de H 0. Este parâmetro, δ, é calculado por (Steiger et al., 1985) NCP = max[x 2 gl,0]. (3.34) Quantomenoréovalordesteíndice,melhoréoajustamentodomodeloeNCP=0 indica um ajustamento perfeito. (D.2) Root Mean Square Error of Approximation (RMSEA) O Root Mean Square Error of Approximation (RMSEA) analisa a discrepância entre a matriz de variância-covariância estimada pelo modelo e a matriz de variânciacovariância populacional. É um dos critérios mais informativos de Modelação com Equações Estruturais. Este índice é calculado por (Steiger et al., 1985) RMSEA = F 0 gl (3.35) 23

42 onde F 0 é calculada por [ ] X F 2 gl 0 = max n 1,0 = NCP n 1. (3.36) O RMSEA é sobrestimado para amostras pequenas e para modelos envolvendo a estimação de muitos parâmetros. Valores superiores a 0,10 indicam um ajustamento inaceitável; valores entre 0,08 e 0,10 indicam um ajustamento medíocre; valores entre 0,05 e 0,08 indicam um ajustamento bom e valores inferiores a 0,05 indicam um ajustamento muito bom (Arbuckle, 2008). (E) Índices Baseados na Teoria de Informação Os índices baseados na teoria de informação servem para comparar vários modelos alternativos que se ajustam aos dados. Estes índices não possuem valores de referência, sendo o melhor modelo aquele que apresenta os menores valores em um ou em vários dos índices. (E.1) Akaike Information Criterion (AIC) O Akaike Information Criterion (AIC) é calculado por (Arbuckle, 2008) AIC = X 2 +2t (3.37) onde t é o número de parâmetros estimados no modelo. (E.2) Consistent Akaike Information Criterion (CAIC) O Consistent Akaike Information Criterion (CAIC) ajusta o AIC pela dimensão da amostra e é calculado por (Bozdogan, 1987) CAIC = X 2 +t(ln(n)+1) (3.38) onde t é o número de parâmetros estimados no modelo e n a dimensão da amostra. (E.3) Browne-Cudeck Criterion (BCC) O Browne-Cudeck Criterion (BCC) é calculado por (Arbuckle, 2008) BCC = X 2 +2t (n 1)(p+q)(p+q +3) n (p+q) 2 (p+q)(p+q +3) (3.39) onde p é o número de variáveis endógenas e q o número de variáveis exógenas do modelo. 24

43 (E.4) Bayesian Information Criterion (BIC) O Bayesian Information Criterion (BIC) é calculado por (Arbuckle, 2008) BIC = X 2 +tln(n). (3.40) (E.5) Expected Cross-Validation Index (ECVI) O Expected Cross-Validation Index (ECVI) mede a diferença entre a matriz de variância-covariância amostral e a matriz de variância-covariância esperada que seria obtida numa outra amostra equivalente. Este índice é calculado por(arbuckle, 2008) ECVI = AIC n 1. (3.41) Quando o método de estimação dos parâmetros foi o método de máxima verosimilhança, o ECVI deve ser substituído pelo MECVI MECVI = BCC n. (3.42) Estes índices são particularmente utilizados para comparar modelos não aninhados. Dois modelos dizem-se aninhados ou encaixados se um dos modelos é submodelo do outro. (iii) Análise de resíduos, significância de parâmetros e fiabilidade individual A análise de resíduos, a significância de parâmetros e a fiabilidade individual testam a qualidade do ajustamento local do modelo. (a) Avaliação dos resíduos estandardizados A principal hipótese num Modelo com Equações Estruturais é a hipótese de que a matriz de variância-covariância populacional é idêntica à matriz de variânciacovariância estimada pelo modelo (Σ = Σ( θ)). Quando este cenário é verdadeiro, espera-se que a matriz dos resíduos populacionais seja nula. Assim, quando um resíduo populacional é diferente de zero, esse resíduo foi mal estimado pelo modelo. Este problema deve-se, normalmente, à dimensão da amostra e à escala das variáveis. Para a resolução do problema, utilizam-se os resíduos estandardizados que corrigem asvariáveis, deformaaquetodasfiquemnamesmaescalaetenhamemconsideração a dimensão da amostra. A fórmula para calcular os resíduos estandardizados é (Bollen, 1989b) r ij = e ij σ εij = e ij ( σ 2 ii σ 2 jj + σ 2 ij) n (3.43) 25

44 onde e ij é o elemento da linha i e da coluna j da matriz residual, σ εij é a estimativa do desvio-padrão de e ij e σ 2 ii, σ 2 jj e σ 2 ij são os elementos da matriz de variânciacovariância estimada pelo modelo (variância da variável i, variância da variável j e covariância entre as variáveis i e j). Se existirem resíduos estandardizados que sejam em módulo superiores a 2, existe um problema de especificação do modelo. (b) Avaliação da significância dos parâmetros do modelo Se alguns dos resíduos estandardizados forem, em módulo, superiores a 2, isto é, se os erros-padrão forem duas vezes superiores à estimativa do parâmetro, existe um problema de especificação do modelo. A significância dos parâmetros γ ij do modelo pode ser avaliada com um teste Z em que as hipóteses são H 0 : γ ij = 0 vs. H 1 : γ ij 0 e a estatística de teste é Z = γ ij σ γij a N(0,1) (3.44) onde σ γij é a estimativa do erro-padrão assintótico do parâmetro γ ij estimada pelo elemento da linha i e coluna j da matriz assintótica da covariância de θ estimada, que é dada por (Bollen, 1989b) ( [ ]) 2 1 LL(θ) acov( θ) = E (3.45) θ θ T onde LL(θ) representa a função logaritmo da máxima verosimilhança. (c) Avaliação da fiabilidade individual das variáveis manifestas A fiabilidade individual das variáveis manifestas avalia a importância de cada variável manifesta no modelo e é dada pela variância de cada variável manifesta, que é explicada pela variável latente associada a esse item (corresponde ao conceito de R 2 na regressão linear). Em equações estruturais, o R 2 de cada variável é calculado como o peso fatorial dessa variável ao quadrado (R 2 j λ 2 ij). Valores de R 2 superiores a 0,25 (λ ij superiores a 0,50) são ideais. Reespecificação do Modelo Por vezes, o modelo estimado não apresenta um bom ajustamento aos dados. Neste caso, é necessária uma reespecificação do modelo, ou seja, é necessário aplicar algumas alterações ao modelo que façam com que o mesmo apresente um melhor ajustamento. Várias técnicas foram desenvolvidas para o efeito, nomeadamente o teste da razão de verosimilhanças e o teste do multiplicador de Lagrange. Estes testes são equivalentes e só podem ser aplicados em modelos aninhados. Ambos os testes permitem o cálculo dos Índices de Modificação (Modification Indices), que estimam a diferença entre as estatísticas X 2 do modelo proposto (r) e do modelo reespecificado (u). A análise destes índices é feita de forma sequencial e índices com valores superiores a 4 indicam que é necessária a alteração de um dos parâmetros 26

45 do modelo, para que este apresente um melhor ajustamento. A alteração mais usual é a correlação entre os erros de dois itens que definem um fator. Esta alteração pode ser explicada do ponto de vista teórico pela natureza de formulação destes itens, pois este tipo de correlação sugere que parte do comportamento das variáveis manifestas em questão, que não é explicada pela variável latente que definem, está correlacionada, ou seja, que estes itens partilham uma outra causa que não é considerada pelo modelo. Quer no teste da razão de verosimilhanças, quer no teste do multiplicador de Lagrange, as hipóteses de teste são H 0 : χ 2 = 0 vs. H 1 : χ 2 0, onde χ 2 define a diferença entre a estatística Qui-Quadrado do modelo proposto e a estatística Qui-Quadrado do modelo reespecificado. (i) Teste da Razão de Verosimilhanças O teste da razão de verosimilhanças determina qual dos modelos reespecificados tem o maior decréscimo da estatística X 2. A estatística de teste é calculada por (Bollen, 1989b) LR = (n 1)(f MLr f MLu ) (3.46) onde f MLr é a função de discrepância avaliada para o modelo proposto e f MLu é a função de discrepância avaliada para o modelo reespecificado. Esta estatística possui distribuição χ 2 com graus de liberdade igual à diferença entre os graus de liberdade do modelo proposto e do modelo reespecificado. (ii) Teste do Multiplicador de Lagrange O teste do multiplicador de Lagrange compara o modelo proposto com o modelo reespecificado, sem ter que estimar o modelo reespecificado. Este teste é utilizado para determinar quais das restrições impostas ao modelo proposto podem ser consideradas livres para que se obtenha uma maior redução na estatística X 2 do ajustamento global do modelo. Este processo é realizado até que o modelo tenha um bom ajustamento e pode ser considerado um processo stepwise de regressão. A estatística de teste é calculada por (Bollen, 1989b) LM = n 1 2 ( fmlr θ r ) T [ E ( )] 2 1 ( ) f MLr fmlr θ r θ T r que possui distribuição χ 2 com 1 grau de liberdade. θ r (3.47) 3.4 Pressupostos da Análise de Equações Estruturais Indepedência das Observações A independência das observações é um dos pressupostos da Análise de Equações Estruturais. A violação deste pressuposto leva ao aumento das estimativas dos erros-padrão dos parâmetros e ao aumento de erros de tipo II, ou seja, assumir a não significância de um parâmetro que na população é significativo. 27

46 Normalidade Multivariada da Distribuição Conjunta das Variáveis Manifestas Como já foi dito anteriormente, alguns métodos de estimação(método da máxima verosimilhança e método dos mínimos quadrados generalizados) requerem a normalidade multivariada da distribuição conjunta das variáveis manifestas. Apesar de existirem testes estatísticos de ajustamento, estes não se encontram implementados nos softwares de análise de equações estruturais. Assim, as medidas utilizadas para a verificação deste pressuposto são a assimetria e a curtose univariadas e ainda a curtose multivariada (medidas de forma da distribuição). Nas fórmulas que se seguem, x e s representam a média e o desvio-padrão amostrais da variável e n representa a dimensão da amostra A assimetria univariada (sk) e o seu desvio-padrão (se sk ) são calculados por e sk = n (x i x) 3 i=1 ns 3, (3.48) se sk = 6 n, (3.49) respetivamente. A curtose univariada (ku) e o seu desvio-padrão (se ku ) são calculados por e ku = n (x i x) 4 i=1 ns 4 3, (3.50) se ku = 24 n, (3.51) respetivamente. A curtose multivariada (ku M ) e o seu desvio-padrão (se kum ) são calculados por e ku M = 1 n n i=1 [(x i x) T S 1 (x i x)] 2 p(p+2)(n 1) n+1, (3.52) respetivamente. 8p(p+2) se kum =, (3.53) n 28

47 Se a assimetria e a curtose forem em valor absoluto, menores ou iguais do que 2 e 7, respetivamente, assume-se que o pressuposto da normalidade multivariada da distribuição conjunta das variáveis manifestas é verificado (Marôco, 2010). Sob o pressuposto da normalidade é possível testar a significância destas medidas. Para o caso da assimetria univariada, as hipóteses são H 0 : SK = 0 vs. H 1 : SK 0 e a estatística de teste é Z = sk se sk a N(0,1). (3.54) Paraocasodacurtoseunivariada, ashipótesessãoh 0 : KU = 0vs.H 1 : KU 0 e a estatística de teste é Covariâncias Amostrais Não Nulas Z = ku se ku a N(0,1). (3.55) Este pressuposto diz respeito ao modelo de medida e diz que as variáveis manifestas que definem uma variável latente têm de apresentar algum tipo de associação entre si, isto é, a sua covariância não pode ser nula. Múltiplos Indicadores O pressuposto dos múltiplos indicadores dita que é necessária a presença de pelo menos 3 variáveis manifestas para cada variavel latente. Este pressuposto diz respeito ao modelo de medida. Ausência de Multicolinearidade Em relação ao modelo estrutural, é essencial que as variáveis exógenas não apresentem multicolinearidade, isto é, que não se encontrem fortemente associadas. Este pressuposto é necessário, pois a multicolinearidade gera estimativas negativas para as variâncias e covariâncias das variáveis. A multicolinearidade das variáveis manifestas é calculada através da estatística VIF (Variance Inflation Factor) e valores superiores a 5 indicam a presença de multicolinearidade. Continuidade A estimação dos parâmetros do modelo requer o cálculo de variâncias e covariâncias, que só podem ser calculadas se o pressuposto da continuidade das variáveis for observado. O mais usual é as variáveis serem qualitativas, medidas numa escala ordinal. No entanto, se a maior parte destas variáveis apresentar um número elevado de categorias (mais do que 5) e a distribuição de frequências das categorias se aproximar da distribuição Normal, estas podem ser consideradas variáveis quantitativas sem que os índices de ajustamento sofram grandes alterações. 29

48 Inexistência de Outliers Outliers são observações que caem fora da tendência das restantes observações. Os outliers podem ser classificados como outliers univariados e outliers multivariados. (i) Outliers Univariados Outliers univariados são observações cujos valores são inferiores a Q 3 1,5 (Q 3 Q 1 ) ou superiores a Q 3 +1,5 (Q 3 Q 1 ) com Q 1 e Q 3, respetivamente, o 1 e o 3 quartis da distribuição. Pode-se ainda identificar os valores que são outliers a partir da representação gráfica. (ii) Outliers Multivariados Outliers multivariados são identificados a partir da Distância de Mahalanobis, D i = (x i x) T S 1 (x i x), i = 1,...,n, (3.56) que calcula a distância de uma observação x i ao centróide da amostra (média de todas as observações de todas as variáveis, x). A partir da Distância de Mahalanobis, (3.52) e (3.53) é possível calcular duas probabilidades: p 1 e p 2. A probabilidade p 1 é a probabilidade de uma observação x i ter um valor de D 2 i superior à d 2 i (valor de χ 2 com tantos graus de liberdade quanto o número de variáveis manifestas presentes no modelo) calculada para essa observação, isto é, p 1 = P(D 2 i > d 2 i) em que D 2 i χ 2 p+q, p é o número de variáveis manifestas endógenas e q o número de variáveis manifestas exógenas. A probabilidade p 2 é a probabilidade da maior Distância de Mahalanobis ser superior à d 2 i calculada para uma observação, isto é, p 2 = 1 n C n (1 p 1 ) n p 0 1 n C n 1 (1 p 1 ) n 1 p 1 1 n C n k+1 (1 p 1 ) n k+1 p k 1 1 onde n é a dimensão da amostra e k é a ordem da k-ésima observação mais distante do centróide. Usualmente, recorre-se ao protocolo descrito por Tabachnick e Fidell (2007) que a partir da probabilidade p 1, classifica uma observação como outlier multivariado se a Distância de Mahalanobis para essa observação for superior ao valor do χ 2 com tantos graus de liberdade quanto o número de variáveis manifestas presentes no modelo (d 2 i) com uma probabilidade inferior a 0, Análise Fatorial A Análise Fatorial tem como princípio básico a ideia de que a covariância (ou a correlação) entre um conjunto de variáveis manifestas se deve à existência de variáveis latentes comuns a essas variáveis manifestas. 30

49 A Análise Fatorial pode ser classificada em dois tipos: Análise Fatorial Exploratória (AFE) e Análise Fatorial Confirmatória (AFC). Análise Fatorial Exploratória A Análise Fatorial Exploratória (AFE) deve ser utilizada no caso de não existir informação a priori sobre a estrutura fatorial que explica as variâncias e covariâncias entre as variáveis manifestas, sendo assim possível que cada variável latente seja refletida em todas as variáveis manifestas. Na AFE, os erros não podem estar correlacionados e assume-se que as variâncias e covariâncias das variáveis manifestas são explicadas apenas pelas variáveis latentes presentes no modelo. Análise Fatorial Confirmatória A Análise Fatorial Confirmatória (AFC) é um método utilizado para confirmar o ajustamento de um modelo de medida teórico aos dados, isto é, a AFC indica quais as variáveis latentes que são responsáveis pelo uso de certas variáveis manifestas. A AFC é o primeiro passo na avalição de um Modelo com Equações Estruturais. Para além da avaliação da qualidade do ajustamento, é também necessário avaliar a validade e a fiabilidade do instrumento de medida. (i) Validade do Instrumento de Medida A validade do instrumento de medida descreve até que ponto os itens associados a um construto medem o mesmo conceito. Um instrumento diz-se válido se medir aquilo que efetivamente é suposto medir e nada mais. A validade do construto é composta por 3 componentes: a validade fatorial, a validade convergente e a validade discriminante. A validade fatorial verifica-se quando a identificação das variáveis manifestas que definem um construto é correta. Este tipo de validade é avaliada através dos pesos fatoriais estandardizados. Valores de λ 2 ij (fiabilidade individual) com i = 1,...,p e j = 1,...,r se as variáveis forem endógenas ou i = 1,...,q e j = 1,...,s se as variáveis forem exógenas, iguais ou superiores a 0,25 indicam validade fatorial apropriada. λ 2 ij corresponde à variância da variável manifesta que é explicada pela variável latente que esse item define. A validade convergente verifica-se quando as variáveis manifestas que definem uma variável latente apresentam correlações positivas e elevadas entre si. Este tipo de validade é avaliada através da variância extraída média (VEM), que é a média das variâncias dos itens que o fator explica. Para um fator j com k itens a VEM é calculada por (Fornell e Larcker, 1981) VEM j = k λ 2 ij i=1. (3.57) k λ 2 ij + k ǫ ij i=1 com j = 1,...,r para os fatores endógenos ou j = 1,...,s para os fatores exógenos. i=1 31

50 Valores de VEM iguais ou superiores a 0,50 indicam validade convergente adequada (Hair et al., 2010). A validade discriminante verifica-se quando um conjunto de variáveis manifestas apenas definem uma variável latente. A validade discriminante é confirmada através de certas condições (Anderson e Gerbing, 1988; Fornell e Larcker, 1981), sendo a condição seguinte a mais correta: as variâncias médias de dois fatores, i e j, são iguais ou superiores ao quadrado da correlação entre esses fatores. (ii) Fiabilidade do Instrumento de Medida A fiabilidade do instrumento de medida descreve o grau em que uma variável ou um conjunto de variáveis é consistente naquilo que é suposto medir. Um instrumento diz-se fiável se, repetindo a medição em condições idênticas, se obtiver um resultado muito similar. A medida mais utilizada para avaliar a fiabilidade é o α de Cronbach (Cronbach, 1951). Este coeficiente é calculado como k ( ) k Var[x i ] α = k 1 1 i=1 [ k ] (3.58) Var x i onde k representa o número de itens associados ao construto. O α de Cronbach assume valores entre 0 e 1 e valores superiores a 0,80 indicam fiabilidade do construto apropriada. Uma outra medida bastante utilizada é a fiabilidade compósita (FC). Para um fator j com k itens esta medida é calculada por (Fornell e Larcker, 1981) ( k ) 2 λ ij i=1 FC j = ( k ) 2 (3.59) λ ij + k ε ij i=1 i=1 com j = 1,...,r para os fatores endógenos ou j = 1,...,s para os fatores exógenos e onde λ ij representam os pesos fatorias estandardizados e ε ij os erros de cada item (ε ij = 1 R 2 ij 1 λ 2 ij). Valores de fiabilidade compósita iguais ou superiores a 0,70 indicam fiabilidade do construto apropriada (Hair et al., 2010). 3.6 Efeito de Mediação com Variáveis Latentes Os efeitos de mediação explicam como e porquê duas variáveis se encontram relacionadas. Esta relação é medida através de uma ou mais variáveis às quais se dá o nome de variáveis mediadoras. Isto é, as variáveis mediadoras são variáveis intermediárias na relação causal de uma variável exógena sobre uma variável endógena, ou seja, a variável exógena é a causa da variável mediadora, que por sua vez é a causa da variável endógena. 32 i=1

51 Os efeitos de mediação podem ser medidos através do efeito direto, do efeito indireto e do efeito total. O efeito direto é a influência de uma variável exógena sobre uma variável endógena, sem o intermédio de uma terceira variável. Este efeito é medido pelo coeficiente da regressão que relaciona as variáveis. O efeito indireto é a influência de uma variável exógena sobre uma variável endógena, com a intermediação de uma ou mais variáveis(variáveis mediadoras). Este efeito é medido pelo produto dos coeficientes de regressão ao longo da cadeia de caminhos que liga as variáveis. O efeito total é a soma do efeito direto e do efeito indireto (Efeito Total = Efeito Direto + Efeito Indireto). A Tabela 3.2 ilustra a decomposição do efeito total em efeito direto e efeito indireto, bem como a relação destes efeitos com os parâmetros do modelo. Tabela 3.2: Decomposição do efeito total em efeito direto e efeito indireto Efeitos em Efeitos de ξ η y x Direto Γ 0 Λ x Indireto (I B) 1 Γ Γ Λ y (I B) 1 Γ 0 Total (I B) 1 Γ Λ y (I B) 1 Γ Λ x Efeitos de η η y x Direto B Λ y 0 Indireto (I B) 1 I B Λ y (I B) 1 Λ y 0 Total (I B) 1 I Λ y (I B) 1 0 Para uma melhor compreensão dos efeitos de mediação, representa-se graficamente na Figura 3.3 um exemplo de um modelo de mediação com variáveis latentes (modelo adaptado de Marôco, 2010). 3 4 x 3 x 4 μ 1 B μξ B μ 2 1 x 1 ξ B ξ y x 2 y 2 2 Figura 3.3: Representação gráfica de um modelo de mediação com variáveis latentes 33

52 O efeito de mediação de uma variável exógena, ξ, sobre uma variável endógena, η, com recurso a uma variável mediadora, µ, pode ser escrito na sua forma não estandardizada como η = B 0η +B ηξ ξ +B ηµ µ+ζ 2, η = B 0η +B ηξ ξ +B ηµ (B 0µ +B µξ ξ +ζ 1 )+ζ 2, η = B 0η +B ηµ B 0µ +(B ηξ +B ηµ B µξ )ξ +ζ 1 +ζ 2. (3.60) Oefeitototaldavariávelξ sobreavariávelη éestimadopelasomadoefeitodireto (estimado por B ηξ ) e do efeito indireto (estimado por B µξ B ηµ ). Se a mediação for perfeita então B ηξ = 0. A significância do efeito indireto (efeito de mediação) é avaliada com o teste de Sobel. As hipóteses de teste são vs. H 0 : B µξ B ηµ = 0 (o efeito de mediação não é significativo) H 1 : B µξ B ηµ 0 (o efeito de mediação é significativo) e a estatística de teste é Z = B µξ B ηµ σ Bµξ B ηµ = B µξ B ηµ B2 ηµ σ 2 µξ + B 2 µξ σ2 ηµ + σ 2 µξ σ2 ηµ a N(0,1). (3.61) Um intervalo de confiança para o efeito de mediação pode ser obtido como IC = ( Bµξ B ηµ zα σ B 2 µξ B ηµ, B µξ B ) ηµ +zα σ B 2 µξ B ηµ. (3.62) A significância do efeito indireto pode também ser testada usando métodos de reamostragem. A significância do efeito total pode ser avaliada através de um teste à significância de um modelo sem a variável mediadora. O modelo encontra-se representado graficamente na Figura x 1 ξ B ξ y x 2 y 2 2 Figura 3.4: Modelo para testar a significância do efeito total do modelo de mediação com variáveis latentes Se o efeito total deste modelo for significativo, então o efeito total do modelo de mediação (modelo da Figura 3.3) é também significativo. Quando o efeito de mediação que se quer testar é composto por 3 ou mais variáveis mediadoras latentes, basta que todas as trajetórias entre essas variáveis sejam significativos para que o efeito global de mediação seja também significativo, não sendo assim necessário realizar testes à significância das diferentes combinações de variáveis mediadoras (Cohen et al., 1983). 34

53 Métodos de Reamostragem A suposição de que o efeito indireto dividido pelo seu desvio-padrão (teste de Sobel) apresenta distribuição Normal é incorreta, pois na maior parte dos casos o produto de parâmetros com distribuição Normal não segue uma distribução Normal. Assim, os intervalos de confiança calculados usando (3.62) são incorretos. Nestes casos, a estratégia é recorrer a métodos não paramétricos (métodos de reamostragem) que não apresentam nenhum pressuposto sobre a estatística de teste. (i) Jackknife Para uma amostra de dimensão n têm-se n amostras Jackknife obtidas por remoção de uma observação da amostra original. Assim, cada amostra Jackknife tem n 1 observações. A estimativa do efeito indireto pelo método de reamostragem Jackknife é dada pela média das estimativas do efeito indireto para as n amostras Jackknife e o seu desvio-padrão (s Jackknife ) é calculado por s Jackknife = n 1 n n [ ] 2 θ(i) θ (.) (3.63) onde θ (i) representa o valor do efeito indireto na i-ésima amostra Jackknife e θ (.) a média de θ (i) para as n amostras Jackknife. Um intervalo de confiança para o efeito de mediação pelo método de reamostragem Jackknife pode ser obtido como (MacKinnon et al., 2004) i=1 IC = ( θ (.) zα s Jackknife,θ 2 (.) +zα s ) Jackknife 2. (3.64) (iii) Percentil Bootstrap Um intervalo de confiança para o efeito de mediação por este método de reamostragem é dado pelos valores dos percentis α e 1 α da distribuição da amostra 2 2 obtida por Bootstrap (MacKinnon et al., 2004). (iv) Bootstrap-t O método Bootstrap-t é baseado na estatística t. Para cada amostra Bootstrap, é criado um valor T que se obtém dividindo a diferença entre a estimativa Bootstrap e a estimativa da amostra original pelo desvio-padrão da amostra Bootstrap. Um intervalo de confiança para o efeito de mediação pelo método de reamostragem Bootstrap-t pode ser obtido como (MacKinnon et al., 2004) IC = ( Bµξ B ηµ T 1 α 2 σ B µξ B ηµ, B µξ B ηµ Tα 2 σ B µξ B ηµ ). (3.65) 35

54 (v) Bootstrap-Q Este método é obtido transformando o método Bootstrap-t através de Q(T) = T + st2 3 + s2 T s 6n (3.66) onde s é a assimetria em cada distribuição Bootstrap de T, T é o valor de Bootstrap-t para cada amostra Bootstrap e n é a dimensão da amostra. Valores críticos de Q são calculados pelos percentis α e 1 α. Estes valores de 2 2 Q(T) são depois transformados novamente em valores de T por ( 1+s Q(T) s ) 1/3 1 6n W(Q) = 3. (3.67) s Os valores de W(Q) = T são usados de uma maneira idêntica aos valores de Bootstrap-t para calcular os limites dos intervalos de confiança (MacKinnon et al., 2004). (vi) Bootstrap com correção do viés O método Bootstrap com correção do viés é o melhor método de reamostragem para estimar o efeito indireto. Este método corrige o viés (ẑ 0 ) que é o z score do valor obtido da proporção de amostras Bootstrap inferiores à estimativa original no número total de amostras Bootstrap. Um intervalo de confiança para o efeito de mediação pelo método de reamostragem Bootstrap com viés corrigido pode ser obtido como (MacKinnon et al., 2004) IC = ( 2ẑ 0 +zα,2ẑ 0 +z 2 1 α Análise Multigrupos ). (3.68) A Análise Multigrupos avalia se a estrutura do Modelo com Equações Estruturais é invariante para grupos ou populações com características diferentes. Para o efeito, testa-se uma série de modelos sequencialmente restritos (modelo de invariância configural, modelo de invariância métrica, modelo de invariância escalar e modelo de invariância estrutural) para determinar até que ponto o submodelo de medida e o submodelo estrutural se ajustam nos vários grupos. Estes modelos são depois comparados aplicando o teste do χ 2. Se a diferença do χ 2 entre os modelos for não estatisticamente significativa, existe invariância entre os modelos nos parâmetros restritos. A função de discrepância para a análise de G grupos é dada por (Jöreskog e Sörbom, 1996) F = G g=1 ( ng ) f g (S g,σ g,w g ) (3.69) N 36

55 onde f g (S g,σ g,w g ) é a função de discrepância do método de estimação aplicado ao grupo g, n G a dimensão da amostra para o grupo g, N a dimensão total da amostra (N = n 1 + +n G ), S g e Σ g as matrizes de variância-covariância amostral e populacional, respetivamente, para o grupo g e W g a matriz dos pesos para o grupo g. A estatística de teste do Qui-Quadrado de ajustamento é X 2 = NF min χ 2 G(p+q)(p+q+1) 2 t (3.70) onde t é o número total de parâmetros estimados em todos os grupos. Se o método de estimação aplicado foi o método de máxima verosimilhança, o X 2 do modelo multigrupos é igual à soma dos X 2 dos modelos ajustados a cada um dos grupos individualmente. (i) Invariância Configural O modelo de invariância configural testa se é possível afirmar se a estrutura proposta se mantém para os diferentes grupos, ou seja, se os grupos possuem o mesmo número de variáveis latentes e se cada variável latente é medida pelo mesmo conjunto de itens. Este modelo serve de modelo basal para a análise de invariância e nenhum parâmetro de medida é definido para ser invariante entre os grupos, isto é, o mesmo modelo é ajustado a todos os grupos em simultâneo. Se a hipótese de invariância configural for rejeitada, o processo de análise de invariância termina neste passo. (ii) Invariância Métrica O modelo de invariância métrica impõe restrições de igualdade aos pesos fatoriais, para verificar se estes são invariantes nos diferentes grupos. As hipóteses de teste são H 0 : Λ 1 = = Λ G vs. H 1 : i,j : Λ i Λ j (i j; i,j = 1,...,G) e a estatística de teste é X 2 = X 2 R 1 X 2 B χ 2 gl R1 gl B (3.71) onde XR 2 1 e XB 2 são as estatísticas de teste do Qui-Quadrado de ajustamento do modelo de invariância métrica e do modelo de invariância configural, respetivamente. Se a hipótese nula não for rejeitada, a qualidade de ajustamento não difere significativamente entre os dois modelos e, portanto, a hipótese de invariância métrica é verificada. Se a hipótese de invariância métrica for rejeitada, o processo de análise de invariância termina neste passo. 37

56 (iii) Invariância Escalar O modelo de invariância escalar impõe restrições de igualdade aos pesos fatoriais e aos interceptos (médias dos itens), para verificar se os últimos são invariantes nos diferentes grupos. As hipóteses de teste são H 0 : M 1 = = M G vs. H 1 : i,j : M i M j (i j; i,j = 1,...,G) e a estatística de teste é X 2 = X 2 R 2 X 2 R 1 χ 2 gl R2 gl R1 (3.72) onde X 2 R 2 é a estatística de teste do Qui-Quadrado de ajustamento do modelo de invariância escalar. Se a hipótese nula não for rejeitada, a qualidade de ajustamento não difere significativamente entre os dois modelos e, portanto, a hipótese de invariância escalar é verificada. Se a hipótese de invariância escalar for rejeitada, o processo de análise de invariância termina neste passo. (iv) Invariância Estrutural O modelo de invariância estrutural impõe restrições de igualdade aos pesos fatoriais, aos interceptos e aos coeficientes estruturais, para verificar se os últimos são invariantes nos diferentes grupos. As hipóteses de teste são H 0 : Σ BY X(1) = = Σ BY X(G) vs. H 1 : i,j : Σ BY X(i) Σ BY X(j) (i j; i,j = 1,...,G) e a estatística de teste é X 2 = X 2 R 3 X 2 R 2 χ 2 gl R3 gl R2 (3.73) onde X 2 R 3 é a estatística de teste do Qui-Quadrado de ajustamento do modelo de invariância estrutural. Se a hipótese nula não for rejeitada, a qualidade de ajustamento não difere significativamente entre os dois modelos e, portanto, a hipótese de invariância estrutural é verificada e pode-se afirmar que o modelo é invariante nos diferentes grupos. 38

57 Capítulo 4 Aplicação Neste trabalho, pretende-se aplicar Modelos com Equações Estruturais a um conjunto de dados reais da área das Ciências Sociais, nomeadamente da área da Psicologia. A base de dados estudada diz respeito a educadores/professores portugueses e é constituída por um total de 53 variavéis, das quais 17 são variáveis sociodemográficas (género, idade, estado civil, tipo de escola recodificada, tipo de escola específica, habilitação profissional, vínculo profissional, anos de serviço, anos de serviço enquanto docente, anos de serviço na escola atual, níveis de ensino atuais, número médio de alunos por turma, número de horas letivas semanais, número de horas não letivas semanais, grupos disciplinares atuais, baixa médica e período de baixa médica) e 36 variáveis que correspondem às variáveis manifestas presentes no Modelo com Equações Estruturais. As variáveis foram medidas através de um questionário (ver Apêndice B) composto por uma parte sociodemográfica; pela versão portuguesa de Work-Family Conflict & Family-Work Conflict Scales (WFC & FWC) (Netemeyer et al., 1996; adaptado por Simães et al., 2009); pelo questionário de avaliação cognitiva (EAC) (Gomes, 2008); e pela medida de Burnout de Shirom-Melamed (MBSM) (Gomes, 2012). O questionário sociodemográfico avalia a informação pessoal e profissional dos professores. A versão portuguesa do Work-Family Conflict & Family-Work Conflict Scales avalia a mútua interferência Trabalho-Família e é constituído por 10 itens distribuídos pelos seguintes fatores: Conflito Trabalho-Família(5 itens: WFC.1, WFC.2, WFC.3, WFC.4 e WFC.5) e Conflito Família-Trabalho (5 itens: FWC.6, FWC.7, FWC.8, FWC.9 e FWC.10). Os itens foram medidos numa escala de Likert de 1 (Discordo Totalmente) a 7 (Concordo Totalmente). O questionário de avaliação cognitiva avalia de que forma um indivíduo avalia uma situação de stresse relacionada com a sua atividade profissional e é constituído por 12 itens distribuídos pelos seguintes fatores: Ameaça (3 itens: EAC.4, EAC.5 e EAC.6), Desafio (3 itens: EAC.7, EAC.8 e EAC.9), Confronto (3 itens: EAC.10, EAC.11 e EAC.12) e Controlo (3 itens: EAC.13, EAC.14 e EAC.15). Os itens foram medidos recorrendo a diferentes escalas de Likert de 7 pontos (ver Apêndice B). 39

58 A medida de Burnout de Shirom-Melamed avalia a experiência de Burnout de um indivíduo e é constituído por 14 itens distribuídos pelos seguintes fatores: Fadiga Física (6 itens: MBSM.1, MBSM.2, MBSM.3, MBSM.4, MBSM.5 e MBSM.6), Fadiga Cognitiva (5 itens: MBSM.7, MBSM.8, MBSM.9, MBSM.10 e MBSM.11) e Exaustão Emocional (3 itens: MBSM.12, MBSM.13 e MBSM.14). Os itens foram medidos numa escala de Likert de 1 (Nunca ou quase nunca) a 7 (Sempre ou quase sempre). O principal objetivo deste trabalho de aplicação é testar se um modelo teórico estabelecido a priori é capaz de explicar se a avaliação cognitiva que educadores/professores portugueses fazem da sua atividade profissional desempenha um papel mediador na relação entre a mútua interferência Trabalho-Família e a síndrome de Burnout. O modelo teórico que se pretende avaliar é apresentado na Figura 4.1. Ameaça Confronto Conflito Trabalho-Família Burnout Conflito Família-Trabalho Desafio Controlo Figura 4.1: Modelo teórico em estudo Todas as análises são conduzidas no software AMOS (v. 24, SPSS, An IBM Company, Chicago, IL) e o método de estimação utilizado é o método da máxima verosimilhança (ver Apêndice C). A qualidade de ajustamento dos modelos é avaliada usando os seguintes índices: estatísitca χ 2, Root Mean Square Error of Approximation (RMSEA), Tucker-Lewis Index (TLI), Comparative Fit Index (CFI) e Normed Fit Index (NFI). Todas as estimativas apresentadas referentes aos Modelos com Equações Estruturais encontram-se estandardizadas. 4.1 Análise Exploratória de Dados Neste estudo participaram 438 professores portugueses que lecionam desde o jardim de infância até ao ensino secundário. Dos 438 professores, 304 são do género feminino(69,41%), 129 do género masculino(29,45%) e 5 não forneceram informação sobre o seu género (1,14%). A idade dos professores varia entre os 28 e os 67 anos, 40

59 sendo a idade média 46,85 anos e o desvio-padrão 7,88 anos (32 inquiridos não forneceram informação sobre a sua idade). A maioria dos professores é casada (70,78%), 13,47% são solteiros, 10,96% divorciados e 2,74% pertencem a um outro estado civil (2,05% dos inquiridos, o que corresponde a 9 professores, não forneceram informação sobre o seu estado civil). O número de anos de serviço varia de 2 a 44 anos, sendo a média 23,24 anos e o desvio-padrão 8,33 anos. Relativamente ao número de anos de serviço enquanto docente, este varia de 2 a 42 anos, sendo a média 22,63 anos e o desvio-padrão 8,39 anos. A maioria dos professores não esteve de baixa nos 12 meses que antecederam a recolha dos inquéritos (94,52%). A matriz de correlação de Spearman dos fatores é apresentada na Tabela 4.1. Tabela 4.1: Matriz de correlação dos fatores Variáveis Conflito Trabalho-Família 1, Conflito Família-Trabalho 0,398** 1, Ameaça 0,435** 0,290** 1, Desafio -0,125** -0,084-0,356** 1, Confronto -0,104* -0,127** -0,376** 0,397** 1, Controlo -0,105* 0,003-0,281** 0,376** 0,438** 1, Fadiga Física 0,559** 0,281** 0,501** -0,344** -0,292** -0,216** 1, Fadiga Cognitiva 0,455** 0,344** 0,447** -0,264** -0,374** -0,216** 0,769** 1, Exaustão Emocional 0,185** 0,421** 0,311** -0,133** -0,233** -0,089 0,335** 0,520** 1,000 Nota: *p-valor<0,05; **p-valor<0,01 Os Conflitos Trabalho-Família e Família-Trabalho estão positivamente correlacionados entre si e com a Ameaça e negativamente correlacionados com o Desafio e o Confronto. Além disso, estão positivamente correlacionados com a Fadiga Física, a Fadiga Cognitiva e a Exaustão Emocional. A Ameaça encontra-se negativamente correlacionada com o Desafio, o Confronto e o Controlo e positivamente correlacionada com a Fadiga Física, a Fadiga Cognitiva e a Exaustão Emocional. O Desafio, o Confronto e o Controlo encontram-se positivamente correlacionados entre si e negativamente correlacionados com a Fadiga Física, a Fadiga Cognitiva e a Exaustão Emocional. A Fadiga Física, a Fadiga Cognitiva e a Exaustão Emocional encontram-se positivamente correlacionadas entre si. 4.2 Modelo com Equações Estruturais Um Modelo com Equações Estruturais pode ser dividido em dois submodelos: submodelo de medida e submodelo estrutural. Estes submodelos são estabelecidos recorrendo à Análise Fatorial Confirmatória e à análise do efeito de mediação entre variáveis latentes, respetivamente Submodelo de Medida Para se estabelecer um submodelo de medida, recorre-se inicialmente à Análise Fatorial Confirmatória dos instrumentos de medida. 41

60 Análise Fatorial Confirmatória da Mútua interferência Trabalho-Família O modelo de Análise Fatorial Confirmatória da mútua interferência Trabalho- Família, os seus índices de qualidade de ajustamento e as estimativas dos pesos fatoriais são apresentados na Figura 4.2. Figura 4.2: Modelo de Análise Fatorial Confirmatória da mútua interferência Trabalho-Família 42

61 Todos os itens da escala da mútua interferência Trabalho-Família apresentam pesos fatoriais adequados (os pesos fatoriais são todos superiores a 0,50). Contudo, o modelo apresenta índices de qualidade de ajustamento considerados inaceitáveis (χ 2 (34)=258,781; RMSEA=0,123; TLI=0,926; CFI=0,944 e NFI=0,936). Através dos índices de modificação, reespecifica-se o modelo, correlacionando os erros dos itens FWC.9 (e19) e FWC.10 (e18); WFC.1 (e17) e WFC.2 (e16); FWC.6 (e22) e FWC.8 (e20); WFC.3 (e15) e WFC.5 (e13); e FWC.6 (e22) e FWC.9 (e19). O modelo de Análise Fatorial Confirmatória da mútua interferência Trabalho- Família reespecificado, os seus índices de qualidade de ajustamento e as estimativas dos pesos fatoriais são apresentados na Figura 4.3. Figura 4.3: Modelo de Análise Fatorial Confirmatória da mútua interferência Trabalho-Família reespecificado 43

62 Todos os itens apresentam pesos fatoriais adequados e o modelo apresenta índices de qualidade de ajustamento considerados bons (χ 2 (29)=87,580; RMSEA=0,068; TLI=0,977; CFI=0,985 e NFI=0,978). O alfa de Cronbach, a fiabilidade compósita e a variância extraída média desta escala são apresentados na Tabela 4.2. Tabela 4.2: α de Cronbach, fiabilidade compósita e variância extraída média da mútua interferência Trabalho-Família Variáveis α de Cronbach Fiabilidade Compósita Variância Extraída Média Conflito Trabalho-Família 0,955 0,955 0,810 Conflito Família-Trabalho 0,901 0,900 0,646 Os quadrados dos pesos fatoriais são iguais ou superiores a 0,25 o que indica validade fatorial adequada. A validade convergente é também adequada pois a variância extraída média de cada fator é igual ou superior a 0,50 (a VEM do fator Conflito Trabalho-Família é 0,810 enquanto que a VEM do fator Conflito Família-Trabalho é 0,646). A validade discriminante é avaliada pela comparação da variância extraída média com o quadrado da correlação entre os fatores. A VEM do fator Conflito Trabalho- Família e a VEM do fator Conflito Família-Trabalho são superiores ao quadrado da correlação entre estes fatores (0,212), podendo-se portanto afirmar que os dois fatores apresentam validade discriminante adequada. Assim, como a validade fatorial, a validade convergente e a validade discriminante são adequadas, pode-se afirmar que a validade do instrumento de medida para a mútua interferência Trabalho-Família é verificada. Uma vez que, para cada fator, o alfa de Cronbach é superior a 0,80 (0,955 para o fator Conflito Trabalho-Família e 0,901 para o fator Conflito Família-Trabalho) e a fiabilidade compósita é igual ou superior a 0,70 (0,955 para o fator Conflito Trabalho-Família e 0,900 para o fator Conflito Família-Trabalho), a fiabilidade do instrumento de medida para a mútua interferência Trabalho-Família é verificada. Análise Fatorial Confirmatória da Avaliação Cognitiva O modelo de Análise Fatorial Confirmatória da avaliação cognitiva, os seus índices de qualidade de ajustamento e as estimativas dos pesos fatoriais são apresentados na Figura

63 Figura 4.4: Modelo de Análise Fatorial Confirmatória da avaliação cognitiva Todos os itens da escala de avaliação cognitiva apresentam pesos fatoriais adequados e o modelo apresenta índices de qualidade de ajustamento considerados bons (χ 2 (48)=81,138; RMSEA=0,040; TLI=0,982; CFI=0,987 e NFI=0,969). O alfa de Cronbach, a fiabilidade compósita e a variância extraída média desta escala são apresentados na Tabela 4.3. Tabela 4.3: α de Cronbach, fiabilidade compósita e variância extraída média da avaliação cognitiva Variáveis α de Cronbach Fiabilidade Compósita Variância Extraída Média Ameaça 0,825 0,825 0,611 Desafio 0,856 0,862 0,679 Confronto 0,851 0,858 0,671 Controlo 0,790 0,803 0,582 Os quadrados dos pesos fatoriais são iguais ou superiores a 0,25 o que indica 45

64 validade fatorial adequada. A validade convergente é também adequada, pois a variância extraída média de cada fator é igual ou superior a 0,50 (0,611 para a Ameaça; 0,679 para o Desafio; 0,671 para o Confronto e 0,582 para o Controlo). A validade discriminante é avaliada pela comparação da variância extraída média comoquadradodacorrelaçãoentreosfatores. AVEMdofatorAmeaçaeaVEMdo fator Desafio são superiores ao quadrado da correlação entre estes fatores (0,205), podendo-se portanto afirmar que estes fatores apresentam validade discriminante adequada. Da mesma maneira, o quadrado da correlação entre os fatores Ameaça e Confronto (0,205), Ameaça e Controlo (0,139), Confronto e Desafio (0,262), Confronto e Controlo (0,306) e Desafio e Controlo (0,221) é igual ou inferior à VEM de cada fator. Assim, como a validade fatorial, a validade convergente e a validade discriminante são adequadas, pode-se afirmar que a validade do instrumento de medida para a mútua interferência Trabalho-Família é verificada. Para os fatores Ameaça, Desafio e Confronto o alfa de Cronbach é superior a 0,80 (0,825 para a Ameaça; 0,856 para o Desafio e 0,851 para o Confronto) e a fiabilidade compósita é igual ou superior a 0,70 (0,825 para a Ameaça; 0,862 para o Desafio e 0,858 para o Confronto) e portanto a fiabilidade destes fatores é adequada. Contudo, para o fator Controlo, o alfa de Cronbach é igual ou inferior a 0,80 (0,790) mas, a fiabilidade compósita é igual ou superior a 0,70 (0,803) e portanto pode-se também afirmar que a fiabilidade para este fator é adequada. Assim, a fiabilidade do instrumento de medida para a mútua interferência Trabalho-Família é verificada. Análise Fatorial Confirmatória do Burnout O modelo de Análise Fatorial Confirmatória do Burnout, os seus índices de qualidade de ajustamento e as estimativas dos pesos fatoriais são apresentados na Figura

65 Figura 4.5: Modelo de Análise Fatorial Confirmatória do Burnout Todos os itens da escala do Burnout apresentam pesos fatoriais adequados. Contudo, o modelo apresenta índices de qualidade de ajustamento considerados medíocres (χ 2 (74)=295,936; RMSEA=0,083; TLI=0,964; CFI=0,971 e NFI=0,961). Através dos índices de modificação, reespecifica-se o modelo, correlacionando os erros dos itens MBSM.7 (e48) e MBSM.10 (e51); MBSM.3 (e44) e MBSM.4 (e45); MBSM.1 (e42) e MBSM.6 (e47); MBSM.7 (e48) e MBSM.8 (e49); e MBSM.2 (e43) e MBSM.5 (e46). O modelo de Análise Fatorial Confirmatória do Burnout reespecificado, os seus índices de qualidade de ajustamento e as estimativas dos pesos fatoriais são apresentados na Figura

66 Figura 4.6: Modelo de Análise Fatorial Confirmatória do Burnout reespecificado Todos os itens apresentam pesos fatoriais adequados e o modelo apresenta índices de qualidade de ajustamento considerados bons (χ 2 (69)=174,609; RMSEA=0,059; TLI=0,982; CFI=0,986 e NFI=0,977). O alfa de Cronbach, a fiabilidade compósita e a variância extraída média desta escala são apresentados na Tabela 4.4 Tabela 4.4: α de Cronbach, fiabilidade compósita e variância extraída média do Burnout Variáveis α de Cronbach Fiabilidade Compósita Variância Extraída Média Fadiga Física 0,950 0,952 0,770 Fadiga Cognitiva 0,968 0,969 0,864 Exaustão Emocional 0,914 0,919 0,793 Os quadrados dos pesos fatoriais são iguais ou superiores a 0,25 o que indica validade fatorial adequada. A validade convergente é também adequada, pois a variância extraída média de cada fator é igual ou superior a 0,50 (0,770 para a Fadiga Física; 0,864 para a Fadiga 48

67 Cognitiva e 0,793 para a Exaustão Emocional). A validade discriminante é avaliada pela comparação da variância extraída média com o quadrado da correlação entre os fatores. A VEM do fator Fadiga Física e a VEM do fator Fadiga Cognitiva são superiores ao quadrado da correlação entre estes fatores (0,637), podendo-se portanto afirmar que estes fatores apresentam validade discriminante adequada. Da mesma maneira, o quadrado da correlação entre os fatores Fadiga Física e Exaustão Emocional (0,132) e Fadiga Cognitiva e Exaustão Emocional (0,289) é igual ao inferior à VEM de cada fator. Assim, como a validade fatorial, a validade convergente e a validade discriminante são adequadas, pode-se afirmar que a validade do instrumento de medida para a mútua interferência Trabalho-Família é verificada. Uma vez que, para cada fator, o alfa de Cronbach é superior a 0,80 (0,950 para a Fadiga Física; 0,968 para a Fadiga Cognitiva e 0,914 para a Exaustão Emocional) e a fiabilidade compósita é igual ou superior a 0,70 (0,952 para a Fadiga Física; 0,969 para a Fadiga Cognitiva e 0,919 para a Exaustão Emocional), a fiabilidade do instrumento de medida para a mútua interferência Trabalho-Família é verificada. Após a Análise Fatorial Confirmatória dos instrumentos de medida, é necessário estabelecer um submodelo de medida adequado. Para o efeito, faz-se uma análise dos dados para se detetarem outliers, usando o protocolo descrito por Tabachnick e Fidell (2007) que classifica outliers multivariados como sendo as observações em que a Distância de Mahalanobis é superior ao valor de χ 2 (36)=67,985. Este processo faz com que 13 participantes sejam removidos, ficando uma amostra final de 325 participantes. Para se estabelecer o submodelo de medida, testam-se dois modelos: um modelo com nove fatores (Conflito Trabalho-Família, Conflito Família-Trabalho, Ameaça, Desafio, Confronto, Controlo, Fadiga Física, Fadiga Cognitiva e Exaustão Emocional) e um modelo com apenas um único fator, ou seja, um modelo em que todas as variáveis manifestas em estudo definem apenas uma variável latente. O modelo com apenas um único fator, os seus índices de qualidade de ajustamento e as estimativas dos pesos fatoriais são apresentados na Figura

68 Figura 4.7: Submodelo de medida com 1 fator O modelo com nove fatores, os seus índices de qualidade de ajustamento e as estimativas dos pesos fatoriais são apresentados na Figura

69 Figura 4.8: Submodelo de medida com 9 fatores Oajustamentodomodelocomosnovefatoresébom(χ 2 (554)=949,160; RMSEA= 0,041; TLI=0,970; CFI=0,974 e NFI=0,939) e melhor do que o ajustamento do modelo com apenas um único fator (χ 2 (590)=7612,278; RMSEA=0,168; TLI=0,502; CFI=0,534 e NFI=0,515). Adiferençadoχ 2 entreosdoismodeloséestatisticamentesignificativa( χ 2 (36)= 6663,118; p-valor < 0,001), o que indica que o modelo com nove fatores é o melhor modelo, pois apresenta o menor valor de χ 2. Os pesos fatoriais deste modelo são todos estatisticamente significativos e variam entre 0,626 (EAC.13) e 0,975(MBSM.5). Os resultados confirmam a validade do modelo com os nove fatores e, assim, este modelo é considerado submodelo de medida. 51

O efeito interacção em modelos de equações estruturais

O efeito interacção em modelos de equações estruturais O efeito interacção em modelos de equações estruturais Maria de Fátima Salgueiro - ISCTE Business School, Lisboa fatima.salgueiro@iscte.pt XIV Congresso Anual da SPE - Covilhã 2006 XIV CONGRESSO DA SPE

Leia mais

Modelagem de Equações Estruturais no Software R

Modelagem de Equações Estruturais no Software R UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA Modelagem de Equações Estruturais no Software R Autora: Suziane dos Santos Pereira Orientadora: Profª. Drª.

Leia mais

ISBN

ISBN ISBN 978-989-96763-1-2 9 789899 676312 ANÁLISE de EQUAÇÕES ESTRUTURAIS FUNDAMENTOS TEÓRICOS, SOFTWARE & APLICAÇÕES João Marôco Edição apoiada por É proibida toda e qualquer reprodução desta obra por qualquer

Leia mais

6 Modelo de Equações Estruturais

6 Modelo de Equações Estruturais 6 Modelo de Equações Estruturais 6.. Introdução No capítulo 5 utilizamos a TRIN para construir as escalas dos construtos capital social, capital cultural e capital econômico. Neste capítulo apresentamos

Leia mais

Modelagem com Equações Estruturais: Princípios Básicos e Aplicações

Modelagem com Equações Estruturais: Princípios Básicos e Aplicações Modelagem com Equações Estruturais: Princípios Básicos e Aplicações Leila Denise Alves Ferreira Amorim, Rosemeire Leovigildo Fiaccone, Carlos Antônio de Souza Teles Santos, Lia Terezinha Lana Pimenta de

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

4.1.1 Participantes, Instrumentos de Medição e Procedimento

4.1.1 Participantes, Instrumentos de Medição e Procedimento 4 Estudo 2 4.1 Metodologia da Pesquisa 4.1.1 Participantes, Instrumentos de Medição e Procedimento O PSWQ e o IDATE-T foram aplicados para uma segunda amostra composta por 978 universitários. As características

Leia mais

VALIDADE ESTRUTURAL DO QUESTIONÁRIO DE ATITUDES FACE À MATEMÁTICA:

VALIDADE ESTRUTURAL DO QUESTIONÁRIO DE ATITUDES FACE À MATEMÁTICA: XII CONGRESSO INTERNACIONAL GALEGO-PORTUGUÊS DE PSICOPEDAGOGIA 11-13 setembro 2013 VALIDADE ESTRUTURAL DO QUESTIONÁRIO DE ATITUDES FACE À MATEMÁTICA: ESTUDO COM ALUNOS DO ENSINO BÁSICO PORTUGUÊS Adelinda

Leia mais

Análise Fatorial Confirmatória através dos Softwares R e Mplus

Análise Fatorial Confirmatória através dos Softwares R e Mplus UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE MATEMÁTICA DEPARTAMENTO DE ESTATÍSTICA Análise Fatorial Confirmatória através dos Softwares R e Mplus Daniela Andrea Droguett León Orientadora: Jandyra

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

Modelo de Regressão Múltipla

Modelo de Regressão Múltipla Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:

Leia mais

Métodos Quantitativos Aplicados

Métodos Quantitativos Aplicados Métodos Quantitativos Aplicados Aula 10 http://www.iseg.utl.pt/~vescaria/mqa/ Tópicos apresentação Análise Regressão: Avaliação de relações de dependência em que se explica o comportamento de uma/várias

Leia mais

i j i i Y X X X i j i i i

i j i i Y X X X i j i i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Análise fatorial confirmatória do Depression Anxiety Stress Scale em pessoas com Doença Renal Crónica

Análise fatorial confirmatória do Depression Anxiety Stress Scale em pessoas com Doença Renal Crónica VII Congresso Internacional da ASPESM: Evidência e Prática Clínica em Saúde Mental Análise fatorial confirmatória do Depression Anxiety Stress Scale em pessoas com Doença Renal Crónica Luís Sousa, CRRN,

Leia mais

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada Aula 2 Regressão Linear Simples Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada Conceitos Gerais A análise de regressão é utilizada para explicar ou modelar a relação entre

Leia mais

CONTRIBUIÇÃO PARA O ESTUDO PSICOMÉTRICO E ESTRUTURAL DA ESCALA DE ESPERANÇA (DE FUTURO) J. Pais Ribeiro, Luisa Pedro e Susana Marques

CONTRIBUIÇÃO PARA O ESTUDO PSICOMÉTRICO E ESTRUTURAL DA ESCALA DE ESPERANÇA (DE FUTURO) J. Pais Ribeiro, Luisa Pedro e Susana Marques Referência: Pais Ribeiro, J., Pedro, L., & Marques, S, (2006).Contribuição para o estudo psicométrico e estrutural da escala de esperança (de futuro). In: I.Leal, J. Pais-Ribeiro & S.Neves, (Edts.). Actas

Leia mais

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II Notas de Aulas Econometria I ** Eduardo P Ribeiro, 00 PARTE II Autocorrelação Autocorrelação: violação da hipótese: E [ε t ε t-s ] = 0, para s > 0, como por exemplo, ε t = ε t- + υ t, onde υ t é ruído

Leia mais

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou

Leia mais

p( y θ ) depende de um parâmetro desconhecido θ.

p( y θ ) depende de um parâmetro desconhecido θ. 55Modelação, Identificação e Controlo Digital 55 Método de Máxima Verosimilhança (Maximum Likelihood) Seja y uma variável aleatória (v. a.) cuja densidade de probabilidade p( y θ ) depende de um parâmetro

Leia mais

MODELAGEM DE EQUAÇÕES ESTRUTURAIS COM LISREL: UMA VISÃO INICIAL

MODELAGEM DE EQUAÇÕES ESTRUTURAIS COM LISREL: UMA VISÃO INICIAL REMark Revista Brasileira de Marketing e-issn: 2177-5184 DOI: 10.5585/remark.v13i2.2698 Data de recebimento: 07/01/2014 Data de Aceite: 03/03/2014 Editor Científico: Otávio Bandeira De Lamônica Freire

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review

Leia mais

Disciplina de Modelos Lineares

Disciplina de Modelos Lineares Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique

Leia mais

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo

Leia mais

Econometria. Econometria: Paradigma. Porque usar econometria? Porque usar econometria?

Econometria. Econometria: Paradigma. Porque usar econometria? Porque usar econometria? Econometria: Paradigma Econometria 1. O Paradigma da Econometria 19/8 Fundamentos teóricos Microeconometria e macroeconometria Modelagem comportamental: otimização, oferta de trabalho, equações de demanda,

Leia mais

Nesse capítulo serão apresentados os resultados da pesquisa realizada.

Nesse capítulo serão apresentados os resultados da pesquisa realizada. 4 Resultados Nesse capítulo serão apresentados os resultados da pesquisa realizada. Na primeira parte do capítulo serão exibidas as características demográficas e transacionais dos respondentes da amostra.

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses

Aula 2 Tópicos em Econometria I. Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses Aula 2 Tópicos em Econometria I Porque estudar econometria? Causalidade! Modelo de RLM Hipóteses A Questão da Causalidade Estabelecer relações entre variáveis não é suficiente para a análise econômica.

Leia mais

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito Unidade IV - Regressão Regressões Lineares Modelo de Regressão Linear Simples Terminologia Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito Regressão correlação Diferença

Leia mais

Cálculo Numérico BCC760

Cálculo Numérico BCC760 Cálculo Numérico BCC760 Resolução de Sistemas de Equações Lineares Simultâneas Departamento de Computação Página da disciplina http://www.decom.ufop.br/bcc760/ 1 Introdução! Definição Uma equação é dita

Leia mais

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2 COMO USAR ESTE LIVRO ÍNDICE PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 Variáveis, Populações e Amostras 1.1. VARIÁVEIS ESTATÍSTICAS E ESCALAS DE MEDIDA 27 1.2. POPULAÇÃO VS. AMOSTRA

Leia mais

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra) Testes de Tendência Central (média, mediana, proporção) Classificação Variável 1 Variável 2 Núm ero Gru pos Dependência Teste Z Paramétrico Quantitativa - 1 - Premissas Variância pop. * conhecida Teste

Leia mais

i j i i Y X X X i j 1 i 2 i i

i j i i Y X X X i j 1 i 2 i i Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão

Leia mais

Análise de regressão linear simples. Diagrama de dispersão

Análise de regressão linear simples. Diagrama de dispersão Introdução Análise de regressão linear simples Departamento de Matemática Escola Superior de Tecnologia de Viseu A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente

Leia mais

Vetores Auto-Regressivos (VAR) Cristian Rafael Pelizza Estágio de docência

Vetores Auto-Regressivos (VAR) Cristian Rafael Pelizza Estágio de docência Vetores Auto-Regressivos (VAR) Cristian Rafael Pelizza Estágio de docência Forma estrutural e reduzida O método VAR busca capturar a interdependência entre múltiplas séries de tempo. Estrutura-se equações

Leia mais

Incorporação de indicadores categóricos ordinais em modelos de equações estruturais. Bruno Cesar Bistaffa

Incorporação de indicadores categóricos ordinais em modelos de equações estruturais. Bruno Cesar Bistaffa Incorporação de indicadores categóricos ordinais em modelos de equações estruturais Bruno Cesar Bistaffa Dissertação apresentada ao Instituto de Matemática e Estatística da Universidade de São Paulo para

Leia mais

Análise de dados em Geociências

Análise de dados em Geociências Análise de dados em Geociências Regressão Susana Barbosa Mestrado em Ciências Geofísicas 2014-2015 Resumo Introdução Regressão linear dados independentes séries temporais Regressão de quantis Regressão

Leia mais

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc. ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc. Cap. 10 Multicolinearidade: o que acontece se os regressores são correlacionados? Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. Rio de Janeiro.

Leia mais

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre. UFFS Universidade Federal da Fronteira Sul Campus Cerro Largo PROJETO DE EXTENSÃO Software R: capacitação em análise estatística de dados utilizando um software livre Fonte: https://www.r-project.org/

Leia mais

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Lic. Eng. Biomédica e Bioengenharia-2009/2010 Modelos de regressão É usual estarmos interessados em estabelecer uma relação entre uma variável

Leia mais

REGRESSÃO E CORRELAÇÃO

REGRESSÃO E CORRELAÇÃO REGRESSÃO E CORRELAÇÃO A interpretação moderna da regressão A análise de regressão diz respeito ao estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis explanatórias,

Leia mais

Correlação e Regressão Linear

Correlação e Regressão Linear Correlação e Regressão Linear Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais CORRELAÇÃO LINEAR Coeficiente de correlação linear r Mede o grau de relacionamento linear entre valores

Leia mais

Escala de Atitudes em relação à Estatística: estudo de validação. Resumo

Escala de Atitudes em relação à Estatística: estudo de validação. Resumo 1 Escala de Atitudes em relação à Estatística: estudo de validação. Juliana Alvares Duarte Bonini Campos*; Lívia Nordi Dovigo**; Fernanda Salloumé Sampaio Bonafé**; João Maroco*** *Profa. Dra. Da Disciplina

Leia mais

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1 Susan Schommer Econometria I - IE/UFRJ Distribuições amostrais dos estimadores MQO Nas aulas passadas derivamos o valor esperado e variância

Leia mais

AULAS 14 E 15 Modelo de regressão simples

AULAS 14 E 15 Modelo de regressão simples 1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 18 e 23 de outubro de 2012 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem

Leia mais

Econometria em Finanças e Atuária

Econometria em Finanças e Atuária Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Modelos condicionalmente

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe

Leia mais

θ depende de um parâmetro desconhecido θ.

θ depende de um parâmetro desconhecido θ. 73 Método de Máxima Verosimilhança (Maximum Likelihood) Seja uma variável aleatória (v. a.) cuja densidade de probabilidade depende de um parâmetro desconhecido. Admite-se conhecida a forma de Exemplo

Leia mais

Endogeneidade, Variáveis Instrumentais e Modelos de Equações Estruturais

Endogeneidade, Variáveis Instrumentais e Modelos de Equações Estruturais 1 Endogeneidade, Variáveis Instrumentais e Modelos de Equações Estruturais Ernesto F. L. Amaral Magna M. Inácio 21 de outubro de 2010 Tópicos Especiais em Teoria e Análise Política: Problema de Desenho

Leia mais

Técnicas Multivariadas em Saúde

Técnicas Multivariadas em Saúde Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou

Leia mais

Análise de dados em Geociências

Análise de dados em Geociências Análise de dados em Geociências Modelação estatística Susana Barbosa Mestrado em Ciências Geofísicas 2014-2015 Resumo Modelação estatística Conceitos básicos de modelação estatística Modelação - identificação

Leia mais

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada

UNIVERSIDADE FEDERAL FLUMINENSE. Programa de Mestrado e Doutorado em Engenharia de Produção. Disciplina: Estatística Multivariada UNIVERSIDADE FEDERAL FLUMINENSE Programa de Mestrado e Doutorado em Engenharia de Produção Disciplina: Estatística Multivariada Aula: Análise Discriminante Professor: Valdecy Pereira, D. Sc. email: valdecy.pereira@gmail.com

Leia mais

Capacidade discriminante de testes de rastreamento utilizando variáveis latentes: aplicação de modelagem de equações estruturais

Capacidade discriminante de testes de rastreamento utilizando variáveis latentes: aplicação de modelagem de equações estruturais Capacidade discriminante de testes de rastreamento utilizando variáveis latentes: aplicação de modelagem de equações estruturais Juliana Alvares Duarte Bonini Campos 1 Paula Cristina Jordani 1 Fernanda

Leia mais

Métodos Quantitativos para Avaliação de Políticas Públicas

Métodos Quantitativos para Avaliação de Políticas Públicas ACH3657 Métodos Quantitativos para Avaliação de Políticas Públicas Aula 11 Análise de Resíduos Alexandre Ribeiro Leichsenring alexandre.leichsenring@usp.br Alexandre Leichsenring ACH3657 Aula 11 1 / 26

Leia mais

Universidade Aberta. Contributo das Técnicas de Análise Fatorial para o Estudo do Programa Ocupação Científica de Jovens nas Férias

Universidade Aberta. Contributo das Técnicas de Análise Fatorial para o Estudo do Programa Ocupação Científica de Jovens nas Férias Universidade Aberta Contributo das Técnicas de Análise Fatorial para o Estudo do Programa Ocupação Científica de Jovens nas Férias Domingas Maria Pina Portela Mestrado em Estatística, Matemática e Computação

Leia mais

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3. 3. Ajuste do Modelo 4. Modelo Restrito Resíduos Resíduos 1 M = I- X(X X) -1 X Hipóteses do modelo Linearidade significa ser linear nos parâmetros. Identificação: Só existe um único conjunto de parâmetros

Leia mais

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Erica Castilho Rodrigues 23 de Maio de 207 Introdução 2 3 Vimos como encontrar o EMV usando algoritmos numéricos. Duas possibilidades:

Leia mais

8 Testes de Hipóteses e Comparação entre Modelos

8 Testes de Hipóteses e Comparação entre Modelos 8 Testes de Hipóteses e Comparação entre Modelos 8.1 Testes de Hipóteses No Capítulo 3 foram levantadas diversas hipóteses relacionando os principais fatores estudados ao desempenho das alianças ou à realização

Leia mais

4 Modelagem e análise dos dados

4 Modelagem e análise dos dados 4 Modelagem e análise dos dados Neste capítulo são avaliadas as propriedades estatísticas e psicométricas da amostra coletada, sendo ajustados os modelos de mensuração e estruturais propostos. São testadas

Leia mais

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados. PREVISÃO O problema: usar a informação disponível para tomar boas decisões com impacto no futuro Informação disponível -qualitativa Prever o que irá acontecer -quantitativa: dados t DEI/FCTUC/PGP/00 1

Leia mais

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010 Aula - 6/8/010 Econometria Econometria 1. Hipóteses do Modelo de RLM O modelo de regressão linear múltipla Estudar a relação entre uma variável dependente e uma ou mais variáveis independentes. Forma genérica:

Leia mais

Introdução Regressão linear Regressão de dados independentes Regressão não linear. Regressão. Susana Barbosa

Introdução Regressão linear Regressão de dados independentes Regressão não linear. Regressão. Susana Barbosa Regressão Susana Barbosa Mestrado em Ciências Geofísicas 2012-2013 Regressão linear x : variável explanatória y : variável resposta Gráfico primeiro! Gráfico primeiro! Gráfico primeiro! Modelo linear x

Leia mais

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague Econometria IV Modelos Lineares de Séries Temporais Fernando Chague 2016 Estacionariedade Estacionariedade Inferência estatística em séries temporais requer alguma forma de estacionariedade dos dados Intuição:

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

Estatística Aplicada II. } Correlação e Regressão

Estatística Aplicada II. } Correlação e Regressão Estatística Aplicada II } Correlação e Regressão 1 Aula de hoje } Tópicos } Correlação e Regressão } Referência } Barrow, M. Estatística para economia, contabilidade e administração. São Paulo: Ática,

Leia mais

Introdução ao modelo de Regressão Linear

Introdução ao modelo de Regressão Linear Introdução ao modelo de Regressão Linear Prof. Gilberto Rodrigues Liska 8 de Novembro de 2017 Material de Apoio e-mail: gilbertoliska@unipampa.edu.br Local: Sala dos professores (junto ao administrativo)

Leia mais

Regression and Clinical prediction models

Regression and Clinical prediction models Regression and Clinical prediction models Session 6 Introducing statistical modeling Part 2 (Correlation and Linear regression) Pedro E A A do Brasil pedro.brasil@ini.fiocruz.br 2018 Objetivos Continuar

Leia mais

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012 1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à

Leia mais

M l u t l i t c i oli l n i e n arid i a d de

M l u t l i t c i oli l n i e n arid i a d de Multicolinearidade 1 Multicolinearidade Quando existem relação linear exata entre as variáveis independentes será impossível calcular os estimadores de MQO. O procedimento MQO utilizado para estimação

Leia mais

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Análise da Regressão. Prof. Dr. Alberto Franke (48) Análise da Regressão Prof. Dr. Alberto Franke (48) 91471041 O que é Análise da Regressão? Análise da regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas

Leia mais

Recebido em/manuscript first received: 03/02/2006 Aprovado em/manuscript accepted: 02/06/2006

Recebido em/manuscript first received: 03/02/2006 Aprovado em/manuscript accepted: 02/06/2006 Revista de Gestão da Tecnologia e Sistemas de Informação Journal of Information Systems and Technology Management Vol. 3, No. 2, 2006, p. 93-122 ISSN online: 1807-1775 ANÁLISE DE FLEXIBILIDADE EM ECONOMIA

Leia mais

Especialização em Engenharia de Processos e de Sistemas de Produção

Especialização em Engenharia de Processos e de Sistemas de Produção Especialização em Engenharia de Processos e de Sistemas de Produção Projetos de Experimento e Confiabilidade de Sistemas da Produção Prof. Claudio Luis C. Frankenberg 3ª parte Conforme foi apresentado

Leia mais

Disciplina de Modelos Lineares Professora Ariane Ferreira

Disciplina de Modelos Lineares Professora Ariane Ferreira Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

Análise Discriminante

Análise Discriminante Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Análise Discriminante Análise Discriminante 1 Análise discriminante - A

Leia mais

3 Modelos Comparativos: Teoria e Metodologia

3 Modelos Comparativos: Teoria e Metodologia 3 Modelos Comparativos: Teoria e Metodologia Para avaliar o desempenho do modelo STAR-Tree, foram estimados os modelos Naive, ARMAX e Redes Neurais. O ajuste dos modelos ARMAX e das redes neurais foi feito

Leia mais

AULAS 14 E 15 Modelo de regressão simples

AULAS 14 E 15 Modelo de regressão simples 1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 30 de abril e 02 de maio de 2013 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem

Leia mais

Estatística Aplicada

Estatística Aplicada Estatística Aplicada Correlação e Regressão Professor Lucas Schmidt www.acasadoconcurseiro.com.br Estatística Aplicada REGRESSÃO Correlação não implica Causalidade! O coeficiente de correlação não mede

Leia mais

Equações Estruturais: Uma aplicação a perfis de consumidores de café

Equações Estruturais: Uma aplicação a perfis de consumidores de café Equações Estruturais: Uma aplicação a perfis de consumidores de café Gislene Araujo Pereira 1 Letícia Lima Milani 2 Marcelo Ângelo Cirillo 2 4 1 Introdução O café sempre teve um papel importante para a

Leia mais

1 Introdução aos Métodos Estatísticos para Geografia 1

1 Introdução aos Métodos Estatísticos para Geografia 1 1 Introdução aos Métodos Estatísticos para Geografia 1 1.1 Introdução 1 1.2 O método científico 2 1.3 Abordagens exploratória e confirmatória na geografia 4 1.4 Probabilidade e estatística 4 1.4.1 Probabilidade

Leia mais

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência REGRESSÃO LOGÍSTICA É uma técnica recomendada para situações em que a variável dependente é de natureza dicotômica ou binária. Quanto às independentes, tanto podem ser categóricas ou não. A regressão logística

Leia mais

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV 69 'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV O presente capítulo objetiva entender o comportamento das séries de retorno financeiras para as carteiras de investimento elaboradas no capítulo anterior. Tal análise

Leia mais

Coeficiente de determinação R 2 no modelo de regressão linear normal

Coeficiente de determinação R 2 no modelo de regressão linear normal Coeficiente de determinação R 2 no modelo de regressão linear normal Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br

Leia mais

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa REGRESSÃO LINEAR Parte I Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Julho de 2015 Onde Estamos Para onde vamos Inferência Esta5s6ca se resumindo a uma equação

Leia mais

A Metodologia de Box & Jenkins

A Metodologia de Box & Jenkins A Metodologia de Box & Jenins Aula 03 Bueno, 0, Capítulo 3 Enders, 009, Capítulo Morettin e Toloi, 006, Capítulos 6 a 8 A Metodologia Box & Jenins Uma abordagem bastante utilizada para a construção de

Leia mais

ECONOMETRIA I. I (12 valores)

ECONOMETRIA I. I (12 valores) Faculdade de Economia Universidade Nova de Lisboa ECONOMETRIA I Exame de 2ª Época 26 de Janeiro de 2005 Duração: 2 horas I (12 valores) ATENÇÃO: Para as 10 primeiras questões deste grupo existem 4 opções

Leia mais

3 Modelos de Equações Estruturais Aplicados na Estimação da Satisfação do Consumidor

3 Modelos de Equações Estruturais Aplicados na Estimação da Satisfação do Consumidor 3 Modelos de Equações Estruturais Aplicados na Estimação da Satisfação do Consumidor 3.1 Introdução Este capítulo é dedicado a uma revisão bibliográfica sobre os Modelos de Equações Estruturais aplicados

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS Em uma grande escola, 10% dos alunos são comprovadamente fracos. Um teste educacional conseguiu identificar corretamente 80% entre aqueles que são fracos e 85% entre aqueles que

Leia mais

Estudo dirigido de Análise Multivariada

Estudo dirigido de Análise Multivariada Estudo dirigido de Análise Multivariada Conceitos Iniciais De um modo geral, os métodos estatísticos de análise multivariada são aplicados para analisar múltiplas medidas sobre cada indivíduo ou objeto

Leia mais

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 9 Correlação e Regressão 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 1 9-1 Aspectos Gerais Dados Emparelhados há uma relação? se há, qual

Leia mais

4 Modelos de Regressão Dinâmica

4 Modelos de Regressão Dinâmica 4 Modelos de Regressão Dinâmica Nos modelos de regressão linear (Johnston e Dinardo, 1998) estudados comumente na literatura, supõe-se que os erros gerados pelo modelo possuem algumas características como:

Leia mais

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação

AULAS 21 E 22 Análise de Regressão Múltipla: Estimação 1 AULAS 21 E 22 Análise de Regressão Múltipla: Estimação Ernesto F. L. Amaral 28 de outubro e 04 de novembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Cohen, Ernesto, e Rolando Franco. 2000. Avaliação

Leia mais

Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios. Wooldridge, Cápítulo 15

Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios. Wooldridge, Cápítulo 15 Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios Wooldridge, Cápítulo 5 Variáveis Instrumentais () 2 Variáveis Instrumentais Considere o seguinte modelo de regressão linear múltipla

Leia mais

4 Modelos Lineares Generalizados

4 Modelos Lineares Generalizados 4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da

Leia mais

Critérios de produção mais limpa e maturidade de gestão de projetos: uma análise de Structural Equation Modeling em indústrias Brasileiras

Critérios de produção mais limpa e maturidade de gestão de projetos: uma análise de Structural Equation Modeling em indústrias Brasileiras Critérios de produção mais limpa e maturidade de gestão de projetos: uma análise de Structural Equation Modeling em indústrias Brasileiras Julio Cesar Ferro de Guimarães (IMED/RS) Eliana Andréa Severo

Leia mais

Multicolinariedade e Autocorrelação

Multicolinariedade e Autocorrelação Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não

Leia mais

5 Análise dos resultados

5 Análise dos resultados 5 Análise dos resultados Os dados foram analisados utilizando o software SPSS (Statistical Package for Social Sciences) base 18.0. Para Cooper e Schindler (2003) a análise de dados envolve a redução de

Leia mais

Transformações e Ponderação para corrigir violações do modelo

Transformações e Ponderação para corrigir violações do modelo Transformações e Ponderação para corrigir violações do modelo Diagnóstico na análise de regressão Relembrando suposições Os erros do modelo tem média zero e variância constante. Os erros do modelo tem

Leia mais